TranslateGemma ist eine frei verfügbare KI-Modell-Familie, die auf Übersetzungsdienste spezialisiert ist. Sie basiert auf Gemma 3, Googles derzeit leistungsfähigstem offenem Modell. 55 verschiedene Sprachen beherrscht TranslateGemma.
Das Modell gibt es in drei Größen (4B, 12B, 27B). Für die Entwicklung wurde das Verfahren der Model-Destillation genutzt, also das Wissen eines größeren Modells für das kleinere, schnellere Modell verfügbar gemacht. Deshalb soll etwa das mittelgroße Modell mit 12 Milliarden Parametern in Benchmarks, die auf Übersetzungen abzielen, besser abschneiden als das multimodale Modell Gemma 3 mit 27 Milliarden Parametern, das nicht auf die Übersetzung spezialisiert ist.
Google schreibt im Blogbeitrag, man erreiche so eine bessere Übersetzungsleistung bei geringerer Latenz – was dann auch kostengünstiger ist. Trotz der großen Auswahl an Trainingsmaterial sei TranslateGemma ideal für Entwickler, die darauf aufbauend noch ein Finetuning aufsetzen und die Übersetzungsfähigkeiten für weniger genutzte Sprachen optimieren wollen.
Übersetzungsmodell mit multimodalen Fähigkeiten
Zudem schreibt Google, würden die Modelle Anweisungen weiterhin sehr exakt befolgen können. Diese Fähigkeit verliert sich oftmals bei der Spezialisierung eines Modells. Auch der Text auf Bildern kann weiterhin übersetzt werden. Eine multimodale Fähigkeit von Gemma 3.
Das Training von TranslateGemma ist in zwei Schritten gelaufen; zunächst mit Paralleldaten, also menschlichen und synthetisch übersetzten Texten. In der Folge wurde Reinforcement Learning eingesetzt, um die Qualität der Übersetzungen zu verbessern. Das heißt, Bewertungsmodelle haben die Antworten begutachtet, die Ergebnisse sind an das Modell zurückgeflossen.
TranslateGemma ist via HuggingFace oder etwa Vertex AI verfügbar. Einen technischen Report hat Google außerdem veröffentlicht. Das Modell entspricht wie auch die Vorgänger nicht der Definition von Open-Source, kann jedoch als offen bezeichnet werden.
OpenAI hat erst vor wenigen Tagen ChatGPT Translate eingeführt. Ein geschlossener Übersetzungsdienst, ähnlich DeepL oder dem bisherigen Google Übersetzer.
(emw)












English (US) ·