Neueste OpenAI-Version: Alles, was Sie über GPT-4 wissen müssen

Anfang März 2023 veröffentlichte OpenAI das größte multimodale GPT-4-Modell. Dieses größere Sprachmodell akzeptiert sowohl Bilder als auch Text und generiert Ergebnisse. Es ist in der Lage, in verschiedenen professionellen und akademischen Benchmark-Tests Leistungen auf menschlichem Niveau zu zeigen. 

Generative Pre-Trained Transformers (GPT) generieren mithilfe eines Deep-Learning-Modells menschenähnlichen Text. Es gibt unzählige Anwendungen, die vom Generieren von Gesprächen und und reichen Códigos, Fragen beantworten, Texte zusammenfassen oder sogar in andere Sprachen übersetzen. GPT-Modelle können mit spezifischen Daten abgestimmt werden, um noch bessere Ergebnisse zu erzielen. 

GPT-4-Neuigkeiten

In den letzten zwei Jahren hat OpenAI den gesamten Deep-Learning-Stack neu aufgebaut und gemeinsam mit Azure einen Supercomputer entwickelt. Bei der Durchführung des GPT-3.5-Tests wurden Fehler behoben und die theoretischen Grundlagen verbessert. Dadurch wurde der GPT-4 zu einem stabileren und größeren Modell. GPT-4 ist zuverlässiger, kreativer und in der Lage, viel differenziertere Anweisungen zu verarbeiten als GPT-3.5.

GPT-4 verfügt über eine hervorragende Fähigkeit, Benutzerabsichten zu verfolgen und gleichzeitig wahrheitsgetreue Ergebnisse zu generieren. Der Unterschied zwischen GPT-3.5 und GPT-4 Es kann subtil sein. Der Unterschied wird jedoch deutlich, wenn die Komplexität der Aufgabe einen ausreichenden Schwellenwert erreicht. 

Leistungsverbesserungen

GPT-4 ist ein eher improvisiertes Modell als GPT-3.5 hinsichtlich der sachlichen Richtigkeit der Antworten. Laut dem internen Leistungsbenchmark von OpenAI macht GPT-4 weniger Sach-/Begründungsfehler. GPT-4 erzielt eine um 40 % höhere Punktzahl als GPT-3.5 und ist somit zuverlässiger. 

OpenAI testete eine Vielzahl von Benchmarks, indem es Prüfungen anregte, die ursprünglich für Menschen entwickelt wurden. Es wurde anhand der neuesten öffentlich verfügbaren Prüfungen getestet. Für diese Prüfungen wurde keine spezielle Schulung angeboten. 

Angeregte PrüfungenGPT-4 (geschätztes Perzentil)GPT-3,5 (geschätztes Perzentil)
SA Math700/800 (-89º)590/800 (-70º)
Quantitativer GRE163/170 (-80º)147/170 (-25º)
GRE verbal169/170 (-99º)154/170 (-63º)
GRE-Schreiben4/6 (-54º)4/6 (-54º)
Programm zur Selbstbewertung medizinischer Kenntnisse75%53%

Visuelle Eingaben

Ein Benutzer kann mithilfe von GPT-4 jede beliebige Seh- oder Sprachaufgabe angeben. Es kann sowohl Text als auch Bilder akzeptieren. GPT-4 generiert Textausgaben (natürliche Sprache oder Code), wobei die Eingaben aus eingestreutem Text und Bildern bestehen. Es verfügt über ähnliche Funktionen bei Dokumenten, Diagrammen, Screenshots und Fotos wie bei Nur-Text-Einträgen. 

OpenAI bewertete auch die Leistung von GPT-4 bei einer Reihe standardmäßiger akademischer Sehtests. Die folgenden Zahlen geben jedoch nicht das Ausmaß seiner Leistungsfähigkeit wieder. 

BezugspunktGPT-4
TextVQA VQA-Score (Wert)78,0 % 0 Schüsse
ChartQA entspannte Präzision (Test)78.5%
Diagramm A12 (AI2D) Genauigkeit (Test)78,2 % 0 Schüsse
DocVQA ANLS-Score (Test)88,4 % 0-Shot (nur Pixel)

Wendigkeit

Open AI hat 6 Monate damit verbracht, GPT-4 sicherer und abgestimmter zu machen. Bei GPT-4 ist die Wahrscheinlichkeit, dass auf Anfragen nach unzulässigen Inhalten reagiert wird, um 82 % geringer.

Das klassische GPT hielt sich an eine feste Ausführlichkeit, einen festen Ton und einen festen Stil. ChatGPT-Benutzer können jetzt in der „System“-Nachricht den Stil ihrer KI vorgeben. API-Benutzer können ihr Erlebnis mithilfe von Systemmeldungen innerhalb bestimmter Grenzen anpassen. Open AI hat erklärt, dass die Grenzen nicht perfekt sind. Benutzer werden jedoch ermutigt, sie auszuprobieren. 

Sicherheit und Ausrichtung

Open AI hat menschliches Feedback einbezogen, um das Verhalten von GPT-4 zu verbessern. Um die Risiken besser zu verstehen, hat OpenAI mehr als 50 Experten für Cybersicherheit, Risiko, internationale Sicherheit und KI-Ausrichtungsrisiken engagiert, um das Modell kontradiktorischen Tests zu unterziehen. 

Da immer mehr Menschen es verwenden, wird OpenAI GPT-4 in regelmäßigen Abständen weiter verbessern. Das Sicherheits- und Überwachungssystem von GPT-4 basiert auf weiteren Erkenntnissen aus früheren Modellen. Zu den erweiterten Funktionen gehört auch die GPT-4-unterstützte Sicherheitsforschung für Schulungen, Bewertungen und Überwachung. 

Vorhersehbare Skalierung

OpenAI hat eine Infrastruktur und Optimierung mit vorhersehbarem Verhalten auf mehreren Ebenen entwickelt. Während des Tests hat OpenAI den möglichen Verlust von GPT-4 in der internen Codebasis im Voraus genau vorhergesagt. Es wurde die gleiche Methodik verwendet, jedoch mit 10.000-mal weniger Rechenaufwand. 

OpenAI ist davon überzeugt, dass die Vorhersage zukünftiger maschineller Lernfähigkeiten ein wichtiger Teil der Sicherheit ist. Allerdings wird ihm im Hinblick auf seine möglichen Auswirkungen keine Beachtung geschenkt. 

OpenAI-Tests

Eine „Bewertung“ ist eine Aufgabe, mit der die Qualität des Verhaltens eines Systems bewertet wird. OpenAI Evals ist ein Software-Framework, mit dem Sie Benchmarks zur Bewertung von Modellen erstellen und ausführen können (GPT-4). Dies hilft, die Leistung stichprobenweise zu überprüfen. 

Benutzer können Wenden Sie Evaluierungen an, um die Leistung zu verfolgen zwischen Modellversionen und sich entwickelnden Modellintegrationen. Eval ist mit der bestehenden Benchmark-Anwendung kompatibel. Open AI hat als Beispiel Notebooks und Teilmengenintegrationen von CoQA einbezogen. OpenAI lädt Benutzer ein, Modelle zu testen und interessante Beispiele an Evals zu senden. 

Fazit

OpenAI führt ständig Tests durch, um GPT-4 zu einem wertvollen Werkzeug für Menschen zu machen. Es hat viele Anwendungen und Prozesse verbessert. Allerdings ist OpenAI davon überzeugt, dass es noch viel Raum für Verbesserungen gibt. Kollektive Gemeinschaftsanstrengungen können zur Verbesserung des Modells beitragen. 

Häufig gestellte Fragen (FAQs)

Was ist die Geschichte der GPT-Modelle?

Beginnend mit Googles BERT im Jahr 2017 wurde die KI-Revolution durch die Erfindung transformativer Modelle möglich. Bisher erfolgte die Textgenerierung durch rekursive neuronale Netze (RNN) und kurzfristige Gedächtnis-Neuronale Netze (LSTM). 

Wie verbessert sich GPT-4 gegenüber früheren Modellen?

GPT-4 kann den Absichten des Benutzers folgen und weniger gefährliche Ergebnisse generieren. Verbessert die Sach- und Denkfähigkeit. Es kann das Verhalten basierend auf Benutzeranforderungen ändern. Darüber hinaus verwendet GPT-4 neben Text auch Bilder. 

Wie kann ich auf GPT-4 zugreifen?

Benutzer von ChatGPT Plus können die Texteingabefunktion von GPT-4 nutzen. Die Möglichkeit der Einführung von Bildern wurde jedoch noch nicht angekündigt.