Le 18 juillet 2024, OpenAI a lancé GPT-4o Mini, une version plus accessible et plus rentable du robuste GPT-4o, destinée aux entreprises et aux développeurs à la recherche d'options d'IA abordables. Ce modèle marque un changement dans l'orientation de l'industrie de l'IA, passant de modèles plus grands et plus chers à des modèles plus petits et plus localisés, mieux adaptés aux applications B2B. GPT-4o Mini comble une lacune cruciale dans la gamme OpenAI, en offrant de puissantes capacités d'IA dans un package plus petit et plus abordable, adapté à l'intégration entre applications et sites Web.
Qu'est-ce que GPT-4o mini ?
GPT-4o Mini est une nouvelle version réduite d'OpenAI qui allie prix abordable et hautes performances. Il offre une alternative économique et compacte aux modèles plus grands, rendant les technologies avancées d’IA plus accessibles à un public plus large sans compromettre leurs capacités.
GPT-4o Mini présente plusieurs fonctionnalités notables, telles que la prise en charge multimodale, une grande fenêtre contextuelle, un tokenizer avancé et des performances exceptionnelles dans les environnements académiques et les tâches multimodales. Il excelle également dans le raisonnement et le codage, ce qui augmente son utilité dans diverses applications.
Par rapport à la moyenne, le GPT-4o mini est de qualité supérieure, avec un score de 0,82 en MMLU et un indice de qualité de 88 dans toutes les évaluations. Ce modèle est moins cher, plus rapide et a une latence plus faible (il faut 0,56 s pour recevoir le premier token).
Petit modèle avec une grande intelligence et performance
Comme le GPT-4o, le GPT-4o mini excelle dans plusieurs tests académiques. Il a surpassé le modèle GPT-3.5 Turbo et a montré des performances exceptionnelles en matière d'intelligence textuelle et de raisonnement multimodal. Les développeurs peuvent également tirer pleinement parti de ce modèle en créant des applications qui obtiennent des données ou effectuent des actions avec des systèmes externes. Par rapport au modèle GPT-3.5 Turbo, ce modèle a également amélioré les performances dans les contextes longs.
- MMLU : MMLU est un test de compréhension qui évalue les capacités des modèles de langage. Il se compose de 16.000 57 questions portant sur 4 matières académiques (philosophie, mathématiques, droit, médecine et autres). Dans ce test, GPT-82,0o mini obtient un score de 77,9 %, suivi de Gemini Flash (73,8 %), Claude Haiku (4 %) et GPT-88,7o (4 %). Cela montre que le GPT-XNUMXo mini est meilleur que les autres modèles dans les tâches de raisonnement qui incluent à la fois des tâches de texte et de vision.
- GPQA : Abréviation de Google Proof Q&A pour les diplômés, il s'agit d'un test de référence qui évalue les capacités LLM et les mécanismes de surveillance évolutifs. Il se compose de 448 questions à choix multiples, rédigées par des experts en physique, chimie et biologie. Dans ce benchmark, le GP-4o obtient un score de 53,6 %, le GPT-4o mini de 40,2 %, suivi par d'autres modèles d'IA. Gemini Flash, Claude Haiku et GPT-3.5 Turbo ont obtenu des scores inférieurs à ceux de GPT-4o mini.
- TOMBER: abréviation de Discrete Reasoning Over Paragraphs, il évalue des ensembles de données constitués de paragraphes anglais. Des questions sont ensuite posées qui nécessitent une série d'étapes de raisonnement pour répondre à des questions mathématiques ou à des comparaisons. Dans ce test, GPT-4o mini a une précision de 79,7 %, suivi de Gemini Flash & Claude Haiku (78,4 %), GPT-3.5 Turbo (70,2 %) et GPT-4o (83,4 %).
- MGSM : Les mathématiques multilingues à l'école primaire sont une référence pour les problèmes de mathématiques à l'école primaire. GPT-4o mini obtient un score moyen de 87,0 % sur ce benchmark. Tandis que GPT-4o franchit les 90,5%, ce qui montre une bonne moyenne pour le mini modèle. Les autres modèles d'IA, tels que Gemini Flash et Claude Haiku, obtiennent un score moyen de 75 %, GPT-3.5 Turbo obtenant le score moyen le plus bas de 56,3 %.
- MATHÉMATIQUES: Ce benchmark évalue la capacité mathématique d'un LLM, composé de 20 ensembles de données d'évaluation dans divers domaines mathématiques avec 30.000 4 problèmes mathématiques. Il évalue la capacité de résolution de problèmes mathématiques des LLM, y compris l'arithmétique, les compétences primaires et secondaires et les domaines mathématiques avancés. GPT-70,2o mini obtient un score de 4 %, tandis que GPT-76,6o atteint une moyenne de XNUMX %, démontrant les bonnes performances du modèle dans ce test de référence.
Prix et disponibilité du GPT-4o Mini
Le GPT-4o mini est un modèle économique, conçu pour être accessible à un large éventail d'utilisateurs. Les jetons d'entrée sont au prix de 15 cents (0,15 $)/1 million de jetons et les jetons de sortie sont au prix de 60 cents (0,60 $)/1 million de jetons.
Par rapport aux modèles précédents, le GPT-4o mini a une structure tarifaire abordable. Ce modèle est 60 % moins cher que le modèle GPT-3.5 Turbo. Pour les autres modèles frontières, le GPT-4o mini offre des économies d'un ordre de grandeur par rapport aux autres modèles d'IA haut de gamme.
Sur ChatGPT, gratuit, utilisateurs Plus et Team pourra accéder à GPT-4o mini, au lieu de GPT-3.5. Les utilisateurs Entreprise y auront également accès à partir de la semaine prochaine.
Cas d'utilisation mini-GPT-4o
Le GPT-4o Mini, avec sa petite taille, son faible coût et ses performances élevées, constitue une solution idéale pour une grande variété d'applications, en particulier dans les environnements où les ressources sont limitées. Voici un aperçu de la façon dont GPT-4o Mini peut être utilisé dans différents scénarios :
- IA sur l'appareil : La taille compacte du GPT-4o Mini lui permet d'être intégré directement dans des appareils locaux tels que des ordinateurs portables, des smartphones et des serveurs Edge. Ce déploiement sur l'appareil permet de réduire la latence, ce qui accélère le temps de traitement et améliore la confidentialité, car les données n'ont pas besoin d'être envoyées à un serveur distant. Les applications incluent des applications d'apprentissage des langues, des assistants personnels et des outils de traduction hors ligne, tous bénéficiant de capacités de traitement locales.
- Prototypage rapide: GPT-4o Mini permet une itération plus rapide à moindre coût, ce qui facilite l'expérimentation et l'affinement des modèles avant de les mettre à l'échelle. Ceci est particulièrement utile pour les développeurs et les chercheurs qui ont besoin de tester de nouvelles idées de chatbot, de développer des prototypes basés sur l'IA et d'expérimenter de manière rentable différentes fonctionnalités de l'IA.
- Applications en temps réel : Grâce à sa réactivité rapide, GPT-4o Mini améliore les expériences interactives sur plusieurs plateformes. Cela le rend très efficace pour les chatbots, les assistants virtuels, les applications de traduction en temps réel, la narration interactive dans les jeux et les environnements de réalité virtuelle où une réponse immédiate est cruciale.
- Génération de contenu : GPT-4o Mini est un rédacteur rapide qui crée de superbes textes, notamment des articles de blog, des articles et du contenu sur les réseaux sociaux. Il peut également gérer des tâches d’écriture beaucoup plus complexes comme un scénario de film, un poème et même un livre entier. GPT-4o mini permet d'économiser des tonnes de temps et d'efforts en prenant en charge les tâches d'écriture.
- Encodage et déploiement : GPT-4o Mini change la façon dont les développeurs travaillent en générant des extraits de code dans plusieurs langages de programmation, économisant considérablement du temps et des efforts. Il aide non seulement à créer du code pour des fonctions spécifiques, mais également au débogage en identifiant les erreurs et en suggérant des solutions. Cette combinaison de fonctionnalités, ainsi que sa rentabilité, font de GPT-4o Mini un outil précieux qui accélère les cycles de développement et augmente la productivité.
Dans l'ensemble, la polyvalence et l'efficacité du GPT-4o Mini en font un atout puissant pour tous ceux qui cherchent à intégrer l'IA dans leurs projets ou services, en améliorant les capacités tout en gérant les coûts et en préservant la confidentialité des utilisateurs.
GPT-4o contre GPT-4o mini
OpenAI a présenté le modèle phare GPT-4o, qui offre des performances améliorées en matière de texte, de vision et d’audio. Il offre également un raisonnement en temps réel, la capacité d’imiter des interactions humaines et une vitesse accrue. Cependant, ces fonctionnalités sont disponibles à un prix plus élevé que celui du GPT-4o mini. GPT-4 dispose de données de formation complètes couvrant un large éventail de sujets. Le GPT-4o mini dispose d’un ensemble de données moins étendu mais diversifié. En termes de taille de modèle, GPT-4 possède plus de 200.000 milliards de paramètres, tandis que GPT-4o mini prend en charge une fenêtre contextuelle de 128.000 4 jetons. Les hautes performances de GPT-4o lui permettent de gérer des tâches complexes, avec une compréhension approfondie et des réponses détaillées aux entrées fournies. En revanche, le GPT-XNUMXo mini est optimisé pour l'efficacité et prend en charge les applications légères tout en offrant des réponses rapides.
En raison de sa petite taille, le GPT-4o mini est plus rapide, tandis que le GPT-4o a une vitesse modérée. Le GPT-4o a besoin de ressources élevées avec plus de mémoire de puissance de calcul, et le GPT-4o mini a moins de mémoire de puissance de calcul. GPT-4o est idéal pour les serveurs puissants pour les environnements cloud, tandis que GPT-4o mini convient aux systèmes mobiles et embarqués. GPT-4o mini est raisonnablement précis mais peut manquer de tâches complexes en profondeur, tandis que GPT-4o excelle en précision avec des contextes nuancés. GPT-4o n'est disponible que sur les forfaits premium, tandis que GPT-4o mini est plus abordable et disponible sur les forfaits fermium.
Comment accéder à GPT-4o mini ?
GPT-4o mini est accessible via l'API OpenAI. Comprend des options telles que l'API des participants, l'API de complétion du chat et l'API par lots. Voici les étapes pour utiliser GPT-4o mini avec l'API OpenAI.
- Authentifiez-vous à l'aide de la clé API. Remplacez your_api_key_here par la clé réelle.
- Une fois configuré, vous pouvez générer du texte avec GPT-4o mini.
L'API OpenAI est accessible via plusieurs points de terminaison, notamment l'API Attendants, l'API Chat Completions et l'API Batch. L'API Wizards prend en charge des outils tels que l'interpréteur de code, la recherche de fichiers et l'appel de fonctions. L'API Chat Completion prend en charge la saisie de texte et d'images et peut générer du contenu textuel. Les développeurs recherchant un haut niveau d'intelligence peuvent utiliser GPT-4o, et ceux qui recherchent de la rapidité et un faible coût peuvent opter pour GPT-4o mini. L'API Batch est rentable, avec des limites de vitesse plus élevées et des délais d'exécution plus rapides par rapport aux terminaux standards.
Protocoles de sécurité intégrés
OpenAI a toujours intégré et renforcé la sécurité à chaque étape du processus de développement. Lors de la pré-formation des modèles, les informations qu'OpenAI ne souhaite pas que ses modèles apprennent de la sortie sont ignorées. Dans ce processus, le contenu pour adultes, les discours de haine, le spam ou les sites ajoutant des informations personnelles sont filtrés. En post-formation, OpenAI vise à améliorer la précision et la fiabilité des modèles. Ils utilisent la technique d'apprentissage par renforcement avec retour humain (RLHF), dans laquelle le comportement du modèle est aligné sur les politiques OpenAI.
GPT-4o mini présente les mêmes mesures de sécurité que GPT-4o. OpenAI a soigneusement évalué ces mesures d'atténuation de sécurité à l'aide d'évaluations automatisées et humaines, conformément au cadre de préparation et conformément aux engagements volontaires d'OpenAI. Dans le cadre de préparation, OpenAI effectue des évaluations avec des tableaux de bord mis à jour pour tous ses modèles frontières. Des seuils de risque sont définis qui activent la base des mesures de sécurité. Les seuils de niveaux de risque sont classés en cybersécurité, CBRN (menaces chimiques, biologiques, radiologiques et nucléaires), persuasion et autonomie du modèle. Les modèles avec un score post-atténuation de « Moyen » ou inférieur peuvent être déployés. De plus, les modèles dont le score après atténuation est « élevé » ou inférieur peuvent être déployés davantage.
GPT-4o a été testé par 70 experts externes en psychologie sociale et en désinformation pour identifier les risques potentiels. OpenAI prévoit d'aborder et de partager les détails des risques potentiels dans la prochaine carte système GPT-4o et la carte de pointage de préparation. Le GPT-4o et le GPT-4o mini ont tous deux amélioré la sécurité grâce à des évaluations d'experts.
Méthode de hiérarchie d'instructions
L'équipe OpenAI a utilisé de nouvelles techniques pour améliorer la sécurité de GPT-4o mini. Ce modèle, dans l'API, est le premier auquel est appliquée la méthode de la hiérarchie d'instructions. Cette méthode aide le modèle à résister aux jailbreaks, aux injections rapides et aux extractions rapides du système. Cette méthode contribue à fiabiliser les réponses du modèle, tout en la rendant sûre pour une utilisation dans des applications à grande échelle.
La méthode de hiérarchie d'instructions définit comment les modèles doivent se comporter lorsque des instructions de priorités différentes entrent en conflit. Une méthode de génération de données est proposée pour démontrer le comportement de suivi d'instructions hiérarchique, dans lequel les LLM ignorent sélectivement les instructions de faible priorité.
Conclusion
Le GPT-4o Mini est un modèle d’IA exceptionnel, offrant un équilibre impressionnant entre performances et rentabilité. Dérivé du plus grand GPT-4o, il conserve une fenêtre contextuelle substantielle et des capacités multimodales, renforcées par de robustes fonctionnalités de sécurité, le rendant polyvalent et accessible pour diverses applications. Face au besoin croissant de solutions d’IA efficaces et abordables, le GPT-4o Mini est sur le point de contribuer de manière significative à la démocratisation de la technologie de l’IA.
FAQ
Le GPT-4o mini peut-il traiter des images, de la vidéo et de l'audio ?
Le GPT-4o Mini prend actuellement en charge la saisie de texte et d'images, et il est prévu d'étendre ses capacités pour inclure des entrées vidéo et audio à l'avenir.
Comment les performances du GPT-4o mini se comparent-elles à celles des autres modèles ?
Le GPT-4o Mini surpasse plusieurs modèles comparables, tels que le Llama 3 (8B), le Claude 3 Haiku et le GPT-3.5 Turbo, tant en termes de qualité que de vitesse de traitement. Bien que Gemini 1.5 Flash puisse être légèrement plus rapide en vitesse de sortie, GPT-4o Mini est supérieur en qualité globale.
Qu’est-ce qui rend GPT 4o mini rentable ?
GPT-4o Mini réduit le besoin en ressources informatiques, offrant une solution rentable sans compromettre les performances.