KI-Update: Deepl Voice, Gemini 2.5, Bau neuer KI-Zentren, Veo 3, Anthropic

vor 8 Stunden 1

Google Gemini 2.5 revolutioniert Bildanalyse mit natürlicher Sprache

Googles KI-Modell Gemini 2.5 erhält ein Update, das die Bildanalyse grundlegend verbessert. Die neue "conversational image segmentation" erlaubt Nutzern, Bildinhalte mittels natürlicher Sprache zu analysieren und zu markieren – ein deutlicher Fortschritt gegenüber herkömmlichen Systemen mit vordefinierten Kategorien.

Das Modell versteht jetzt komplexe sprachliche Beschreibungen wie "die Person mit dem Regenschirm", logisch konditionierte Anfragen ("alle Personen, die nicht sitzen") und abstrakte Konzepte wie "Unordnung". Die Anwendungsmöglichkeiten sind vielfältig: Designer könnten per Sprachbefehl Bildbereiche auswählen, Versicherungssachbearbeiter könnten Sturmschäden automatisch markieren lassen. Entwickler können auf die Funktion über die Gemini API zugreifen, die Ergebnisse im JSON-Format mit Koordinaten, Pixelmasken und Bezeichnungen liefert.

Oracle und OpenAI errichten massives KI-Rechenzentrum in Texas

Oracle, ein Softwarekonzern, und OpenAI, ein KI-Modellhersteller, bauen in Texas ein gewaltiges Rechenzentrum zum Training von KI-Algorithmen. Die erste Phase mit zwei großen Gebäudekomplexen und einem Energiebedarf von 200 Megawatt ist bereits in Betrieb. Bis Sommer 2026 sollen sechs weitere Komplexe folgen, die dann insgesamt 800.000 Blackwell-Beschleuniger beherbergen werden.

Der Energiebedarf wird auf 1.200 Megawatt steigen, was ein enormer Sprung verglichen mit früher üblichen 30 Megawatt für große Rechenzentren ist. Für die Infrastruktur kooperieren die Unternehmen mit Firmen, die Erfahrung im Bau von Krypto-Mining-Anlagen haben. Obwohl OpenAI die Anlagen als Stargate-Sites vermarktet, entstehen sie offenbar außerhalb des von Trump verkündeten 500-Milliarden-Dollar-Joint-Ventures, an dem SoftBank als Geldgeber beteiligt sein sollte.

Großbritannien und OpenAI schmieden strategische KI-Partnerschaft

Großbritannien und OpenAI haben eine strategische Partnerschaft vereinbart, die das Vereinigte Königreich als führende KI-Nation positionieren soll. Die Kooperation umfasst gemeinsame Forschung zur KI-Sicherheit und mögliche Investitionen in britische Rechenzentren und KI-Infrastruktur.

Die britische Regierung plant, eine Milliarde Pfund in Rechenleistung zu investieren. Von der Initiative erhofft sie sich ein jährliches Produktivitätswachstum von 1,5 Prozent, was über zehn Jahre wirtschaftliche Vorteile von rund 47 Milliarden Pfund bringen soll. Premierminister Keir Starmer und Technologieminister Peter Kyle sehen in der Zusammenarbeit einen wichtigen Schritt zur Transformation des Gesundheitswesens, der Bildung und des Wirtschaftswachstums.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Podcasts immer laden

EU-Kommission fordert 2.500 zusätzliche IKT-Fachkräfte

Die EU-Behörden kämpfen mit erheblichen Personallücken, besonders im Bereich der Informations- und Kommunikationstechnik, IT-Sicherheit und Künstlicher Intelligenz. Im neuen Budgetvorschlag für 2028 bis 2034 fordert die EU-Kommission für die ersten drei Jahre 2.500 zusätzliche Vollzeitstellen.

Der Bericht betont, dass rechtzeitige Investitionen in IT, einschließlich KI-Werkzeuge, entscheidend sind, um künftig Kosten zu senken. Der gesamte Haushaltsentwurf beläuft sich auf fast 2 Billionen Euro über sieben Jahre – ein deutlicher Anstieg gegenüber den 1,2 Billionen der auslaufenden Periode. Mehrere Mitgliedstaaten haben bereits signalisiert, dass ihnen die geforderte Summe zu hoch erscheint.

Googles Veo 3 kämpft mit hartnäckigem Untertitel-Problem

Googles neues KI-Modell zur Videogenerierung, Veo 3, erstellt zwar hochwertige kurze Videoclips, fügt jedoch oft sinnlose Untertitel hinzu – selbst wenn Nutzer ausdrücklich darum bitten, darauf zu verzichten. Um die Untertitel zu entfernen, müssen Clips neu generiert werden, was zusätzliche Kosten verursacht und keine Erfolgsgarantie bietet.

Der Fehler liegt vermutlich in den Trainingsdaten, die wahrscheinlich YouTube-Videos, Vlogs und TikTok-Edits mit eingebetteten Untertiteln enthalten. Da diese Untertitel Teil der Videobilder sind und keine separaten Textspuren, gestaltet sich ihre Entfernung vor dem Training schwierig. Eine Lösung würde erfordern, dass Google jedes Frame jedes Trainingsvideos überprüft – ein zeitaufwändiges Unterfangen, das Wochen dauern könnte.

Anthropic-Chef gibt Kompromisse mit autoritären Geldgebern zu

Dario Amodei, Chef des KI-Unternehmens Anthropic, hat in einer internen Mitteilung eingeräumt, dass sein Unternehmen im globalen KI-Wettlauf Kompromisse bei der Investorenwahl eingehen muss. In einer von WIRED veröffentlichten Nachricht schreibt er: "Leider denke ich, dass 'Keine schlechte Person sollte jemals von unserem Erfolg profitieren' ein ziemlich schwieriges Prinzip ist, um ein Unternehmen zu führen"

Der Anthropic-Chef bestätigt, dass das Unternehmen Investitionen aus den Vereinigten Arabischen Emiraten und Katar anstreben wird, obwohl dies "Diktatoren" bereichern könnte. Dies widerspricht seiner früheren Position, wonach "Demokratien in der Lage sein müssen, die Bedingungen festzulegen, unter denen mächtige KI in die Welt gebracht wird". Als Begründung für diesen Kurswechsel verweist Amodei auf die enormen Kapitalmengen im Nahen Osten, die für die Wettbewerbsfähigkeit seines Unternehmens notwendig seien.

(mali)

Gesamten Artikel lesen