Google-Managerin mit Smart-Glasses: Ernsthafte Konkurrenz für Metas Ray-Ban-Brillen?
Foto: Jeff Chiu / AP PhotoFür Stammgäste war schon frühmorgens klar: Diese Keynote zur Google I/O wird anders als sonst. In früheren Jahren war man gut beraten, einen Pullover und eine Daunenjacke mitzubringen, weil das Shoreline Amphitheatre, in dem der Konzern seine Neuheiten präsentiert, vormittags im Schatten liegt. Doch an diesem Dienstag zeigte das Thermometer schon frühmorgens 19 °C an. Bei solchen T-Shirt-Temperaturen fiel es Google-Chef Sundar Pichai und seinen Kollegen sichtbar leicht, zu zeigen, wie sich das Internetunternehmen seine KI-Zukunft vorstellt.
Dass sogenannte Agenten dabei eine Rolle spielen würden, war schon zuvor klar. Dass sie derart dominant sein würden, nicht. Insgesamt 174-mal tauchen in Google Blogposts zur I/O die Begriffe Agent und agentisch auf. Künstliche Intelligenzen, die teils komplexe Aufgaben autark erledigen können, sind das generelle Oberthema der Konferenz.
Google I/O: Selfie mit dem Logo
Foto: Andrej Sokolow / dpaAugen auf beim Brillenkauf
Doch so spannend die neuen Agenten sind, als Highlight der Show wurden Brillen präsentiert. Natürlich weder Sonnen- noch Lesebrillen, sondern KI-Brillen, »Smart Eyewear«, wie Google sie nennt. Im Herbst will Google »Audio-Brillen« auf den Markt bringen, die im Grunde so funktionieren wie Metas Ray-Ban-Brillen. Sie haben also kein Display, werden ausschließlich per Stimme gesteuert und reagieren mit einer Stimme. Mit im Boot sind neben Samsung die Brillenhersteller Gentle Monster und Warby Parker.
Wie bei fast allen neuen Google-Produkten steckt hier Gemini im Kern. Auf der Bühne wurde mit Prototypen gezeigt, wie die natürlich die Interaktion mit der KI sein kann. So wurde Gemini etwa aufgefordert: »Bestell bei dem Coffeeshop, über den wir gesprochen haben, meinen Lieblingskaffee und lass ihn zu mir liefern«, was die KI dann auch umgehend tat. Weltbewegend ist das alles nicht, nachdem Meta schon Millionen smarte Brillen, die ähnlich funktionieren, verkauft hat. Trotzdem dürften Googles Brillen – und solche von Samsung – eine feine Alternative sein, wenn man sich lieber in Googles, als in Metas Ökosystem einspannen lassen möchte. Das gilt auch für Apple-Fans, denn Googles Audiobrillen werden nicht nur mit Android-Handys, sondern auch mit iPhones funktionieren.
Ein Agent als Rechnungsprüfer
Doch zurück zu KI-Agenten: Googles Agenten sollen beim Onlineshopping helfen, Websuchen automatisieren, beim Programmieren helfen und ihren Nutzerinnen und Nutzern viele Alltagsaufgaben abnehmen. Pichai schwärmt, die KIs würden eine »neue Welt der Agenten und agentischen Fähigkeiten« eröffnen. Bisher hatte Google solche Möglichkeiten Firmenkunden vorbehalten, nun sollen sie auch ganz normalen Google-Nutzerinnen und -Nutzern helfen.
Einer dieser Agenten heißt Gemini Spark. Der soll beispielsweise wiederkehrende Aufgaben autonom erledigen können. Er soll etwa die monatliche Kreditkartenabrechnung auf versteckte Abogebühren prüfen, Gmail nach anstehenden Terminen durchsuchen oder aus Gesprächsnotizen ein schickes Protokoll erstellen können.
Berichte mit KI erstellen: Schreiben lassen, statt selbst zu schreiben
Foto: GoogleBemerkenswert: Google will Spark auch in die Gemini-App für macOS integrieren. Dort soll der Agent Arbeitsabläufe automatisieren und mit lokal gespeicherten Dateien umgehen können. Auch die verbesserte Spracherkennung, die Google gerade für Android angekündigt hat, soll dort eingebaut werden.
Apple wird das keine Sorgen machen, der Konzern setzt für seine nächste KI-Offensive ohnehin auf Gemini als Grundlage. Anfang Juni wird der iPhone-Konzern auf seiner Entwicklerkonferenz WWDC erklären, wie das im Detail ausgestaltet werden soll.
Mindestens ebenso bemerkenswert: Wenn Spark kommende Woche als Betaversion an den Start geht, werden nur Kunden der von Gemini AI Ultra – Monatspreis ab 100 Dollar – ausprobieren können, was die Agenten-KI wirklich kann. Und auch das nur, wenn sie ein Google-Konto in den USA haben.
Schneller ist besser
Die Grundlage für all das liefert das neue KI-Modell Gemini 3.5 Flash, für das der Konzern beeindruckende Leistungswerte verspricht. Googles neue KI soll mit »Flaggschiff-KI-Modellen« der Konkurrenz, wie dem neuen ChatGPT 5.5, mithalten können, sie in manchen Bereichen gar übertrumpfen. Wie man das bei Computerkram gern macht, wurden schier endlose Tabellen von Benchmark-Tests gezeigt, um diese Aussagen zu untermauern. Wichtig ist primär, dass Gemini 3.5 Flash laut Google viele Aufgaben schneller – und billiger – erledigen kann als seine Vorgänger. Eine noch leistungsfähigere Pro-Version wird derzeit getestet und soll nächsten Monat kommen.
Google-Chef Sundar Pichai: Agenten als Universalhelfer
Foto: Manuel Orbegozo / REUTERSSuchen lassen, statt selber zu suchen
Selbst der Google-Klassiker, Websuche, wird künftig von Gemini Flash 3.5 unterfüttert. Das Suchfeld, in dem man seine Anfragen eingibt, wird zu einem Eingabefeld für KI-Prompts. So wie man mit einem Chatbot spricht, soll man auch Fragen an die Suchfunktion stellen können. Dabei soll das Suchfeld seine Größe dynamisch an die Länge der Eingaben anpassen. Zudem kann man seine Suchanfragen um Bilder, Videos und andere Daten ergänzen und Nachfragen zu der Antwort, die Google liefert, stellen. Such-Chefin Liz Reid bezeichnet dies als »das größte Upgrade des Suchfelds seit 25 Jahren«.
Einen Schritt weiter sollen sogenannte »Informations-Agenten« gehen. Im Grunde sind das Suchroboter, die man mit seinen Anforderungen füttern kann, sodass sie das Web, Diskussionsforen und soziale Medien nach passenden Antworten und Nachrichten durchsuchen, ohne dass man sie aktiv beaufsichtigen müsste. Finden sie einen Treffer, melden sie sich.
KI-Suchfunktion in YouTube: Das System um Hilfe für spezielle Probleme bitten
Foto: GoogleAls Beispiel nannte Reid die Wohnungssuche, für die man das System mit den Eckdaten seiner Traumwohnung füttern kann und – wenn alles funktioniert, wie versprochen – automatisch informiert wird, sobald eine passende Immobilie angeboten wird. Anders als die KI-Suche, die allen Nutzenden zur Verfügung steht, muss man ein Pro- oder Ultra-Abo von Google AI haben, um diese Möglichkeiten ausnutzen zu können, wenn sie im Sommer starten.
Eine allwissende Video-KI
Nach dem Erfolg der Bilder-KI Nano Banana, geht jetzt Gemini Omni an den Start. Der Name soll hier Programm sein, denn Omni wird als omnipotent beschrieben, soll aus »beliebigem Input beliebigen Output« erzeugen können. Das gilt allerdings nur, solange der Output ein Video ist.
In Beispielen wurde gezeigt, wie mächtig und zugleich einfach das neue System ist. So kann man Omni beauftragen: »Erstelle ein Video, das mir die Proteinfaltung erklärt«. Als Ergebnis erhält man ein kurzes Lehrvideo, dessen Stil man dann noch verfeinern kann. Hier vereint Google die Videofähigkeiten seiner KI mit dem Wissen um so ziemlich alles in der Welt. Was nicht bedeutet, dass man mit Omni nur Lehrvideos produzieren kann. Es mag aber hilfreich sein, dass sie weiß, wie beispielsweise Gravitation die Welt beeinflusst.
Spaßig waren auf der Keynote Videos, die zeigten, wie man Selfie-Videos mit Omni manipulieren, sich selbst etwa zum Astronauten machen oder ins Tudor-England versetzenn kann. Hilfreicher dürfte sein, dass man mit Omni nicht nur Linseneffekte, Kamerafahrten etc. simulieren, sondern auch eigene Avatare agieren lassen kann. Wobei diese auch konsistent ihren Look beibehalten, also wiedererkennbar sein sollen. Für serielle Formate wie »Chloe VS History « ein unverzichtbares Feature, aber vorerst nur auf Englisch und nur für Abonnenten nutzbar.
Ist das echt?
Um sicherzustellen, dass solche Videos auch als KI-Erzeugnisse erkennbar sind, werden sie, wie auch Nano-Banana-Bilder, mit einem sogenannten SynthID-Wasserzeichen versehen. Diese digitalen Markierungen sollen auch eine nachträgliche Bearbeitung, etwa mit Fotofiltern, überstehen. Ohnehin, so sagte ein Google-Manager, würden bereits Millionen Menschen die Möglichkeit nutzen, Bilder und Videos per Gemini zu untersuchen. Mehr als 50 Millionen Mal sei der Gemini-App die Frage gestellt worden, »Ist das mit KI erzeugt worden?«. Per C2PA-Technologie soll das System nun auch erkennen können, ob und mit welchen Tools ein Foto bearbeitet worden ist.
Shopping auf Automatik
Mit dem »Universal Cart« will Google seine Ki zum Shoppingassistenten machen. Der Gedanke: Egal wo man ein Produkt findet, das man gerne haben möchte – Webseiten, YouTube, Gmail –, man legt es in Googles virtuellen Einkaufswagen und der kümmert sich um den Rest. Sprich: Die KI sucht im Hintergrund nach den besten Angeboten, erzeugt Preisstatistiken und benachrichtigt ihre Nutzer, wenn einst vergriffene Produkte wieder lieferbar sind.
Außerdem soll der Universal Cart Probleme erkennen, wenn man etwa den falschen Prozessor zu einem Mainboard zu bestellen versucht. Und es soll Tipps geben, um etwa bestimmte Bestellungen mit passenden Kundenkarten zu koppeln, um Punkte zu sammeln. Was in Googles Ausführungen bisher fehlt, sind Angaben dazu, ob und wie das Unternehmen womöglich an Einkäufen über dieses System profitieren wird. Damit Unternehmen bei diesem System mitmachen können, müssen ihre Systeme das Universal Commerce Protocol (UCP) unterstützen, einen Internetstandard für agentisches Einkaufen. Wohlö auch deswegen sind bestimmte Shoppingfunktionen zum US-Start in diesem Sommer nur bei Partnerfirmen wie Target, Walmart und Shopify verfügbar.
Shopping mit Google-KI: Vorsicht, der Prozessor passt nicht!
Foto: GoogleOhnehin gilt: Nicht alles, was Google heute vorgestellt hat, ist auch für alle verfügbar. Wie bei US-Firmen üblich, werden einige neue Funktionen zuerst in den USA eingeführt und erst später in anderen Teilen der Welt. Einige sind zudem nur Kunden zugänglich, die bei Google ein KI-Abo abgeschlossen haben. Komplexe KI-Dienstleistungen sind offensichtlich zu teuer, um sie zu verschenken. Laut Sundar Pichai will Google in diesem Jahr 180 bis 190 Milliarden Dollar investieren. KI-Abos dürften zumindest ein Teil des Weges sein, solche Summen wieder einzuspielen.

vor 1 Stunde
1








English (US) ·