Shopping, Pages, Podcasts, Search und Deep Research: Microsoft kündigt für den KI-Assistenten Copilot eine Reihe neuer Funktionen an. Nach 50 Jahren scheint das Software-Unternehmen zu einem KI-Unternehmen geworden zu sein. Zumindest geht es thematisch bei der 50-Jahr-Feier vor allem darum.
Mustafa Suleyman, CEO bei Microsoft AI, sagt, die Einfachheit und Kraft, mit der Bill Gates vor all den Jahren den PC auf jeden Schreibtisch gebracht hat, inspiriere ihn. "Bei Microsoft AI werden wir vom selben Geist angetrieben." Der Copilot soll ein AI Companion für jeden werden. Wie das genau aussehen werde, könne man nicht sagen, denn ein jeder werde ihn anders bedienen und von ihm bedient.
Suleyman kündigt auch an, der Copilot werde, mit entsprechender Erlaubnis, alles erinnern, was man besprochen hat, was einem gefällt, was man nicht mag. Er werde den Namen des Hundes und des schwierigen Projekts behalten. Ob dieses Versprechen bei allen Menschen so gut ankommt, ist fraglich. Nicht jeder möchte diese Daten freigeben, aber es soll ja auch eine "Erlaubnis" geben – also auch eine Möglichkeit, das zu verhindern. Für alle anderen ändere sich die Dynamik und die Beziehung, die man mit einer Technologie hat. Es sei eine neue Ära.
Copilot: Gedächtnis, Podcasts, Recherche und KI-Suche
Zu den neuen Funktionen gehört ein Gedächtnis und eine Möglichkeit für die Personalisierung. Die gespeicherten Daten sollen über ein Dashboard bearbeitet werden können. Microsoft betont, dass der Nutzer die Kontrolle behält. Noch als erste Experimente sind Gestaltungsmöglichkeiten für den Copilot selbst angekündigt.
Mit Actions ist die Fähigkeit gemeint, die gemeinhin auch als KI-Agent oder agentisch bezeichnet wird. Der Copilot kann handeln: Per Prompt Tickets für Veranstaltungen kaufen oder einem Freund ein Geschenk bestellen. Die Copilot Actions sollen auf den meisten Webseiten funktionieren. Es gibt aber auch konkrete Partner, dazu gehören Booking.com, Expedia, OpenTable und mehr. Wie genau der KI-Agent technisch funktioniert, erklärt Microsoft zunächst nicht. Ähnliche Funktionen anderer Anbieter basieren in der Regel auf Screenshots, die dann von den Modellen verarbeitet werden können, um dort wiederum beispielsweise Eingabefelder zu erkennen, die wiederum von einem Modell ausgefüllt werden können.
Copilot Vision ist bereits für das Web verfügbar und kommt nun in Windows und mobile Anwendungen. Dahinter verbirgt sich die Möglichkeit, mit dem Copilot über das zu sprechen, was auf dem Bildschirm zu sehen ist – wahlweise Fotos oder auch in Echtzeit per geöffneter Kamera. Vision ist via iOS und Android-App verfügbar, die neue Windows-App soll die Funktion auch im Arbeitsumfeld nutzbar machen.
Pages ist eine Art Canvas, wie es bei OpenAI und Google heißt. Damit kann man Ideen, Skizzen und mehr auf eine leere Art von Leinwand laden. Der Copilot hilft bei Bedarf noch beim Sortieren und Bearbeiten. Auch eine Podcast-Funktion gibt es bereits von konkurrierenden Anbietern – etwa NotebookLM von Google. Nun kann der Copilot KI-generierte Podcasts erstellen. Gemeint ist, dass man Inhalte vom KI-Assistenten in einen Podcast umwandeln lassen kann. Während man diesen hört, kann man zudem noch Fragen bezüglich der Inhalte stellen.
Shopping soll Produkte im Blick behalten, über Preisvergünstigungen informieren und den Kauf direkt in der App möglich machen. Dazu dürfte der Agent losziehen. Konkreter wird es bei der Funktionsweise aber auch hier noch nicht. Deep Research ist für komplexe Fragestellungen und mehrstufige Aufgaben zuständig. Damit kann der Copilot auch größere Mengen an Inhalten verarbeiten. Auch OpenAI und Google haben eine Recherche-Funktion in petto.
(Bild: Microsoft)
Copilot Search ist die KI-Suche in Bing, wobei Bing eigentlich schon lange eine KI-Suche war. Mit der neuen Copilot-Funktion sollen KI-Suche und die traditionelle Suche vereint werden und einem Cross-Check dienen, um möglichst gute Ergebnisse zu liefern.
(emw)