ChatGPT Agent: Reasoning und Action-Modell kombiniert

vor 5 Stunden 2

OpenAI hat mehrere seiner Modelle vereint: Heraus kam der ChatGPT Agent. Er ist eine Mischung aus dem Operator, der mit Webseiten interagieren kann, Deep-Research für die tiefe Auseinandersetzung mit Themen, und ChatGPT für die Konversationsfähigkeit. Das heißt, der neue Agent übernimmt selbstständig Aufgaben und nutzt dafür eine Art virtuellen Computer. Was er konkret kann: einen freien Termin im Kalender finden, ein Restaurant mit gewünschter Speisekarte und Preisklasse heraussuchen und sogleich einen Tisch reservieren.

Der ChatGPT Agent greift auf eine Reihe von Tools zu, sogenannte Connectors. Auf diese kann ChatGPT bereits seit Längerem zugreifen. Dazu gehören Google Drive, GitHub, SharePoint und weitere. Eine Liste aller Connector hat OpenAI auf seiner Webseite gesammelt, dort ist auch zu sehen, welche bisher nicht in der EU verfügbar sind. Unklar ist allerdings der Umgang der Connector mit der Memory-Funktion und dem ChatGPT Agent. Während die Connector Zugriff auf das Gedächtnis haben dürfen, soll der ChatGPT Agent diese Informationen noch nicht nutzen. Dazu seien erst noch weitere Sicherheitsprüfungen nötig, sagt OpenAI auf Nachfrage.

Möchte man den neuartigen Agenten nutzen, greift man auf die bekannte Bedienoberfläche zurück. Dort findet er sich in der Modellauswahl. Man gibt einen Prompt ein und beschreibt seinen Wunsch, also etwa im Fall des Beispiels, das OpenAI bei einem Media Briefing zeigt: Man fordert ChatGPT auf, den Kalender zu nutzen und ein Restaurant zu finden, das beispielsweise indisches Essen anbietet. In einem Fenster innerhalb des Dialogfeldes erscheint dann der Denkprozess, diesen kann man also überwachen. Ebenso muss man das Ergebnis gegebenenfalls absegnen. Kreditkartendaten werden nicht einfach für ein neues Paar Schuhe genutzt, ohne dass es den entsprechenden Auftrag auch wirklich gibt.

Da es nicht zwingend nur ein Restaurant mit indischem Essen in einer Stadt gibt, erscheint am Ende des Prozesses etwa eine Tabelle mit einer Übersicht, welche Restaurants geeignet wären. Natürlich kann man den Prozess auch verfeinern und zusätzliche gewünschte Details prompten.

Weitere Beispiele, die OpenAI für den Einsatz des ChatGPT Agent nennt: "Finde eine japanisch angelehnte Vintage-Samsara-Lampe für unter 200 US-Dollar bei Etsy. Priorisiere qualitativ hochwertige Bilder und gute Bewertungen des Verkäufers." Oder: "Suche bei LinkedIn alle Entwickler in New York City, die mehr als zehn Jahre Arbeitserfahrung haben und bei Unternehmen angestellt sind, die wachsen." Die Aufgaben können aber auch deutlich komplexer sein und Börsenwerte umfassen oder Preislisten und Abomodelle von verschiedenen Produkten auswerten.

OpenAI stellt klar, dass es sich um erste Gehversuche des Agenten handelt und daher Fehler möglich sind – wie üblich bei KI. Die System Card mit weiteren Informationen zum ChatGPT Agent wird noch veröffentlicht. Darin erklärt OpenAI auch die Sicherheitsvorkehrungen.

(emw)

Gesamten Artikel lesen