Dernière version d'OpenAI : tout ce que vous devez savoir sur GPT-4

Début mars 2023, OpenAI a publié le plus grand modèle multimodal GPT-4. Ce modèle de langage plus large accepte à la fois les images et le texte et génère des résultats. Il est capable de montrer des performances au niveau humain dans divers tests de référence, tant professionnels qu'académiques. 

Generative Pre-Trained Transformers (GPT) génère un texte de type humain à l'aide d'un modèle d'apprentissage en profondeur. Il existe une infinité d'applications allant de la génération de conversations & et Códigos, répondez à des questions, résumez un texte ou même traduisez dans d'autres langues. Les modèles GPT peuvent être ajustés avec des données spécifiques pour obtenir des résultats encore meilleurs. 

Actualités GPT-4

Au cours des deux dernières années, OpenAI a reconstruit l’intégralité de la pile d’apprentissage profond et a co-conçu un supercalculateur avec Azure. Des bugs ont été corrigés et les bases théoriques ont été améliorées lors de la réalisation du test GPT-3.5. En conséquence, le GPT-4 est devenu un modèle plus stable et plus grand. GPT-4 est plus fiable, créatif et capable de gérer des instructions beaucoup plus nuancées que GPT-3.5.

GPT-4 a une grande capacité à suivre les intentions des utilisateurs tout en générant des résultats véridiques. La distinction entre GPT-3.5 et GPT-4 Cela peut être subtil. Toutefois, la différence apparaît lorsque la complexité de la tâche atteint un seuil suffisant. 

Amélioration des performances

GPT-4 est un modèle plus improvisé que GPT-3.5 en ce qui concerne l'exactitude factuelle des réponses. Selon le benchmark de performances interne d'OpenAI, GPT-4 commet moins d'erreurs factuelles/de raisonnement. GPT-4 obtient un score 40 % plus élevé que GPT-3.5, ce qui le rend plus fiable. 

OpenAI a testé une variété de critères en stimulant des examens initialement conçus pour les humains. Il a été testé par rapport aux examens publics les plus récents. Aucune formation spécifique n'a été dispensée pour ces examens. 

Examens stimulésGPT-4 (centile estimé)GPT-3,5 (centile estimé)
Mathématiques SAT700/800 (-89º)590/800 (-70º)
GRE quantitatif163/170 (-80º)147/170 (-25º)
GRE verbale169/170 (-99º)154/170 (-63º)
Écriture GRE4/6 (-54º)4/6 (-54º)
Programme d'auto-évaluation des connaissances médicales75%53%

Entrées visuelles

Un utilisateur peut spécifier n'importe quelle tâche de vision ou de langage à l'aide de GPT-4. Il peut accepter à la fois du texte et des images. GPT-4 génère des sorties texte (langage naturel ou code) avec des entrées composées de texte et d'images entrecoupées. Il a des capacités similaires avec les documents, diagrammes, captures d'écran et photos qu'avec les entrées de texte uniquement. 

OpenAI a également évalué les performances de GPT-4 sur une série de tests de vision académiques standard. Cependant, les chiffres suivants ne représentent pas l’étendue de ses capacités. 

Point de référenceGPT-4
TextVQA Score VQA (val)78,0% 0 tir
Précision détendue ChartQA (test)78.5%
Diagramme A12 (AI2D) Précision (test)78,2% 0 tir
Score DocVQA ANLS (test)88,4 % 0-shot (pixels uniquement)

Maniabilité

Open AI a passé 6 mois à rendre GPT-4 plus sécurisé et aligné. GPT-4 est 82 % moins susceptible de répondre aux demandes de contenu non autorisé.

Le GPT classique adhérait à une verbosité, un ton et un style fixes. Les utilisateurs de ChatGPT peuvent désormais prescrire le style de leur IA dans le message « système ». Les utilisateurs de l'API peuvent personnaliser leur expérience dans certaines limites à l'aide des messages système. Open AI a déclaré que les limites ne sont pas parfaites. Cependant, les utilisateurs sont encouragés à les essayer. 

Sécurité et alignement

Open AI a intégré les commentaires humains pour améliorer le comportement de GPT-4. Pour mieux comprendre les risques, OpenAI a embauché plus de 50 experts en cybersécurité, risques, sécurité internationale et risques d’alignement de l’IA pour soumettre le modèle à des tests contradictoires. 

À mesure que de plus en plus de personnes l'utilisent, OpenAI continuera d'améliorer GPT-4 à un rythme régulier. Le système de sécurité et de surveillance de GPT-4 tire davantage de leçons des modèles précédents. Les fonctionnalités avancées incluent également la recherche de sécurité assistée par GPT-4 pour la formation, les évaluations et la surveillance. 

Mise à l'échelle prévisible

OpenAI a développé une infrastructure et une optimisation avec un comportement prévisible à plusieurs échelles. Au cours des tests, OpenAI a prédit avec précision à l’avance la perte éventuelle de GPT-4 dans la base de code interne. La même méthodologie a été utilisée mais avec 10.000 XNUMX fois moins de calculs. 

OpenAI estime que la prévision des futures capacités d'apprentissage automatique est un élément important de la sécurité. Cependant, son impact potentiel n’est pas pris en compte. 

Tests OpenAI

Une « eval » est une tâche utilisée pour évaluer la qualité du comportement d'un système. OpenAI Evals est un framework logiciel qui vous permet de créer et d'exécuter des benchmarks pour évaluer des modèles (GPT-4). Cela permet d’inspecter les performances échantillon par échantillon. 

Les utilisateurs peuvent appliquer des évaluations pour suivre les performances entre les versions de modèle et les intégrations de modèles évolutives. Eval est compatible avec l'application de référence existante. Open AI a inclus des blocs-notes et des intégrations de sous-ensembles de CoQA à titre d'exemple. OpenAI invite les utilisateurs à tester des modèles et à soumettre des exemples intéressants à Evals. 

Conclusion

OpenAI teste constamment pour faire de GPT-4 un outil précieux pour les utilisateurs. Il a amélioré de nombreuses applications et processus. Cependant, OpenAI estime qu’il reste encore beaucoup à faire. Les efforts collectifs de la communauté peuvent contribuer à améliorer le modèle. 

Foire Aux Questions (FAQ)

Quelle est l’histoire des modèles GPT ?

Depuis le BERT de Google en 2017, la révolution de l’IA est devenue possible grâce à l’invention de modèles transformateurs. Auparavant, la génération de texte était réalisée par des réseaux de neurones récursifs (RNN) et des réseaux de neurones à mémoire à court terme (LSTM). 

Comment GPT-4 s’améliore-t-il par rapport aux modèles précédents ?

GPT-4 peut suivre les intentions de l'utilisateur et générer des résultats moins dangereux. Améliore les capacités factuelles et de raisonnement. Il peut modifier le comportement en fonction des demandes des utilisateurs. De plus, GPT-4 utilise des images en plus du texte. 

Comment puis-je accéder à GPT-4 ?

Les utilisateurs de ChatGPT Plus peuvent utiliser la fonction de saisie de texte de GPT-4. Cependant, la possibilité d'introduire des images n'a pas encore été annoncée.