Bei der Entwicklerkonferenz Google I/O 2024 am Dienstag kündigte Google an, dass es Gemini Nano, das kleinste seiner KI-Modelle, direkt in den Chrome-Desktop-Client integrieren wird, beginnend mit Chrome 126.
Laut dem Unternehmen ermöglicht dies Entwicklern, das On-Device-Modell zur Unterstützung ihrer eigenen KI-Funktionen zu nutzen. Google selbst plant, diese neue Funktionalität zu nutzen, um Features wie das bestehende „Hilf mir beim Schreiben“-Tool aus dem Workspace Lab in Gmail zu unterstützen.
Das Unternehmen gibt an, dass die kürzlich erfolgte Arbeit an der WebGPU- und WASM-Unterstützung in Chrome es ermöglicht, dass diese Modelle mit angemessener Geschwindigkeit auf einer Vielzahl von Hardware laufen.
In einem Briefing vor der Ankündigung am Dienstag sagte Jon Dahlke, Google-Direktor für Produktmanagement für Chrome, dass Google Gespräche mit anderen Browser-Anbietern führe, um diese - oder eine ähnliche Funktion - auch in deren Browsern zu ermöglichen.
„Wir haben begonnen, mit anderen Browsern zusammenzuarbeiten und werden ein frühes Vorschauprogramm für Entwickler starten“, schrieb Dahlke in der Ankündigung vom Dienstag. „Mit WebGPU, WASM und Gemini in Chrome glauben wir, dass das Web KI-bereit ist.“
Es ist jedoch fraglich, ob die meisten Chrome-Mitbewerber ausschließlich auf die KI-Modelle von Google setzen möchten. Sinnvoller erscheint es, Browsern - und Entwicklern - zu ermöglichen, das Modell ihrer Wahl auszuführen. Google würde sich natürlich für die Ausführung von Gemini für seine Anwendungen entscheiden, aber diese Modelle sind klein genug, um Entwicklern die Wahl zu lassen, welches sie für ihre Anwendungen verwenden möchten.
Googles Einsatz besteht jedoch darin, eine Reihe von Hochleistungs-APIs in Chrome zu aktivieren, um Text im Browser mithilfe seiner Gemini-Modelle zu übersetzen, zu betiteln und abzutranskribieren.
„Um dieses Feature zu liefern, haben wir unsere effizienteste Version von Gemini feinabgestimmt und Chrome optimiert“, sagte Dahlke während des heutigen Entwickler-Keynotes bei der I/O. „Jetzt möchten wir Ihnen den Zugriff auf Gemini-Modelle in Chrome ermöglichen. Unsere Vision besteht darin, Ihnen die leistungsstärksten KI-Modelle in Chrome zur Verfügung zu stellen, um Milliarden von Nutzern zu erreichen, ohne sich um promptes Engineering, Feinabstimmung, Kapazität und Kosten sorgen zu müssen. Alles, was Sie tun müssen, ist, ein paar Hochleistungs-APIs aufzurufen - übersetzen, betiteln, abtranskribieren. Dies ist eine große Veränderung für das Web, und wir wollen es richtig machen.“
Für Entwickler nutzt Google jetzt auch das integrierte Gemini Nano-Modell, um einige neue Funktionen in der Chrome DevTools Console zu unterstützen. Dank dessen können die Chrome-Dev-Tools Fehler erklären und Debugging-Lösungen direkt in der Konsole bereitstellen.
Wir starten einen KI-Newsletter! Melden Sie sich hier an, um ab dem 5. Juni in Ihren Posteingängen damit zu beginnen.