Alphabet CEO Sundar Pichai betrat am Mittwoch die Bühne einer von der Wirtschaftsschule der Stanford-Universität veranstalteten Veranstaltung, um einige kleine Einblicke darüber zu geben, was er über die Leitung eines der wertvollsten Technologieunternehmen der Welt denkt.
Es war ein bemerkenswerter Auftritt, denn Pichai hatte in letzter Zeit ein paar Schwierigkeiten. Google wird weithin als spät gestartet bei generativer KI angesehen, hinter dem von Microsoft finanzierten OpenAI zurück. Das, obwohl das Unternehmen unter Pichai in den letzten zehn Jahren den Fokus auf KI gelegt hat und Google-Forscher das wegweisende Papier zu Transformer-Modellen geschrieben haben, das die generative KI-Revolution wirklich in Gang gebracht hat. In jüngerer Zeit wurde Alphabets Gemini LLM dafür kritisiert, dass es bizarr ungenaue Bilder von historischen Situationen generiert hat, wie z.B. die Darstellung der Gründerväter Amerikas als Schwarze oder amerikanische Ureinwohner, anstelle von weißen englischen Männern, was auf eine Überkorrektur für bestimmte Arten von Vorurteilen hinweist.
Der Interviewer, der Dekan der Stanford Graduate School of Business, Jonathan Levin, war nicht gerade ein feindlicher Fragesteller - am Ende enthüllte er, dass die Söhne der beiden Männer einmal in einer Mittelschulband gespielt hatten -, und Pichai ist geschickt darin, schwierige Fragen zu beantworten, indem er sie als weitere Fragen darüber, wie er denkt, stellt, anstatt direkte Antworten zu geben. Aber es gab ein paar interessante Details während des Gesprächs.
Zu einem Zeitpunkt fragte Levin, was Pichai tun wollte, um ein Unternehmen von 200.000 Personen innovativ zu halten gegen all die Startups, die darum kämpfen, sein Geschäft zu stören. Offensichtlich ist dies etwas, worüber sich Pichai Sorgen macht.
Er bot keine spezifischen Taktiken an, die sich bei Google bewährt haben, sondern wies darauf hin, wie schwierig es ist, die richtigen Anreize zu schaffen.
Google pausiert die Fähigkeit des KI-Tools Gemini, Bilder von Menschen zu generieren, nach historischen Ungenauigkeiten
„Ein Beispiel dafür ist ... wie belohnt man Anstrengung und Risikobereitschaft und gute Ausführung, und nicht immer nur Ergebnisse? Es ist einfach zu denken, dass man Ergebnisse belohnen sollte. Aber dann fangen die Leute an, es zu manipulieren, richtig? Die Leute treffen konservative Entscheidungen, bei denen sie ein gutes Ergebnis bekommen werden.“
Später fragte Levin, worauf Pichai sich in diesem Jahr am meisten freue.
Zunächst nannte er die Multimodalität des neuesten LLM von Google - das heißt, seine Fähigkeit, verschiedene Arten von Inputs, wie Video und Text, gleichzeitig zu verarbeiten.
„Alle unsere KI-Modelle verwenden bereits Gemini 1.5 Pro; das ist ein 1-Millionen-Kontextfenster und es ist multimodal. Die Fähigkeit, enorme Informationsmengen in jeder Art von Modalität auf der Eingangsseite zu verarbeiten und auf der Ausgangsseite zu geben, finde ich faszinierend auf eine Weise, die wir noch nicht vollständig verarbeitet haben.“
Zweitens hob er die Fähigkeit hervor, verschiedene diskrete Antworten zu verknüpfen, um intelligentere Workflows zu ermöglichen. „Wo Sie heute die LLMs nur als eine Informationsquelle nutzen, aber sie auf eine Weise miteinander verbinden, um Workflows anzugehen, das wird außerordentlich mächtig sein. Es könnte vielleicht Ihr Abrechnungssystem im Stanford Hospital etwas einfacher machen“, scherzte er.
Sie können das gesamte Interview, zusammen mit einem Interview mit Fed-Chef Jerome Powell, der zuvor stattgefunden hat, auf YouTube ansehen. Levin und Pichai beginnen etwa 1 Stunde und 18 Minuten in.