Multimodalität von GPT-4o

GPT-4o vs. GPT-4: Wie Chatbot-Benutzer vom LLM-Wettbewerb profitieren

Das neueste GPT-Release von OpenAI ist nun schon einige Wochen alt. Wir wollten es zunächst selbst intensiv testen, um einschätzen zu können, wie unsere Kunden und ihre KI-Chatbots davon profitieren können. Mehr dazu in diesem Blog-Eintrag:

Wie sich GPT-4o von seinem Vorgänger GPT-4 unterscheidet
Wie wir mit dem rasanten technologischen Fortschritt der Large-Language-Modelle umgehen
Was die Multimodalität der Large-Language-Modelle für die Zukunft der Chatbots bedeutet

Preis & Geschwindigkeit: Warum GPT-4o ein Meilenstein ist

Wenn Sie das Release-Video von GPT-4o noch nicht kennen, empfehlen wir Ihnen, es sich anzusehen. Dort sehen Sie eindrucksvoll, wie das Large-Language-Modell nicht nur auf natürliche Spracheingaben in Text und Audio reagiert, sondern auch visuellen Input verarbeiten und formatübergreifende Schlussfolgerungen ziehen kann. OpenAI ist aber nicht nur technologisch führend, sondern betreibt auch Marketing auf Champions-League-Niveau. Die Release-Demos entwerfen Zukunftsbilder, die gefühlt gar nicht so weit vom praktisch Möglichen entfernt sind. Tatsächlich sind die großen Errungenschaften des neuen Releases ganz pragmatischer Natur, aber für die Geschäftsentwicklung von LLM-basierten Lösungen von großer Bedeutung: GPT-4o ist doppelt so schnell und halb so teuer! Durch Effizienzsteigerungen in der Architektur werden deutlich weniger Token benötigt, was eine neue Preis- und Produktpolitik des LLM-Anbieters ermöglicht.

Inhaltlicher Vergleich von GPT-4o und GPT-4: Was auffällt

Bei einem strukturierten inhaltlichen Vergleich von GPT-4o mit seinem Vorgängermodell fällt jedoch auf, dass GPT-4 je nach Anwendungsfall teilweise immer noch besser abschneidet. Wir haben die gleichen Datenquellen und Abfragen für beide LLMs in über hundert Beispielen verwendet und dabei folgendes festgestellt: GPT-4 halluziniert deutlich mehr und verweigert regelmäßig eine Aussage ganz, wo GPT-4 eindeutig richtige Antworten liefern kann. Dort, wo beide Modelle richtig antworten, ist GPT-4o in der Lage, prägnantere Aussagen zu treffen, während GPT-4 zu weitschweifigeren Aussagen neigt. Die Reasoning Skills des neuen Modells dürften zugunsten von Preis und Geschwindigkeit zurückgegangen sein. Damit wollen wir aber keineswegs eine inhaltliche “Minderwertigkeit” des neuen Modells zum Ausdruck bringen. Unsere Überlegungen gehen vielmehr dahin, dass möglicherweise andere Prompting-Strategien angewendet werden müssen, um mit GPT-4o treffsichere Ergebnisse zu erzielen. Bei der Arbeit mit multimedialen Inhalten wird GPT-4o seinem Releaseversprechen durchaus gerecht: Bilder werden mit hoher Wahrscheinlichkeit eindeutig identifiziert. So konnten wir unsere Unternehmenspräsentation mit Schaubildern hochladen und um einen Vortragstext bitten, der strukturell und inhaltlich als Vorlage gut passte, wenn auch, wie gewohnt, noch eher generell ist. In Kombination mit weiteren Methoden wie RAG eröffnet die zukünftige Multimodalität der Large-Language-Modelle jedenfalls weitere spannende Möglichkeiten im Bereich der effektiven Informationssuche.

aiStudio und die Möglichkeiten von ChatGPT

Was bedeutet diese und kommende neue LLM-Versionen für unsere Kunden? Im aiStudio können Sie zwischen verschiedenen Modellen wählen und mit Ihren Inhalten außerhalb des Live-Betriebs testen. Noch ist beispielsweise GPT-4o in Europa nicht vollständig verfügbar, aber wir gehen davon aus, dass wir bei unseren Kunden eine Mischung aus beiden Modellen einsetzen werden. Wo Bildmaterial verwendet wird, ist GPT-4o eindeutig die richtige Wahl, und wo inhaltliche Themen komplexer werden, wird GPT-4 aus Qualitätsgründen weiterhin eine wichtige Rolle spielen. Die zunehmende Vielfalt an Large-Language-Modellen bietet uns als Plattformanbieter und Chatbot-Berater jedenfalls sehr effektive Möglichkeiten, Chatbots je nach Anwendungsfall optimal für Sie zu gestalten.

Erfahren Sie mehr in unserem KI-Leitfaden

Wenn Sie mehr über die technischen Grundlagen und Projektphasen einer Chatbot-Implementierung erfahren wollen, ist unser kostenfreier KI-Leitfaden ein guter Startpunkt.

Jetzt kostenfrei downloaden