Google hat auf seiner jährlichen Entwicklerkonferenz Google I/O eine neue Generation seiner KI-Modelle vorgestellt: Gemini 3.5. Die neue Modellfamilie kombiniert nach Angaben des Unternehmens Frontier-Intelligenz mit agentenbasierter Handlungsfähigkeit und markiert laut Google einen bedeutenden Fortschritt auf dem Weg zu leistungsfähigeren, autonomen KI-Agenten. Den Auftakt der Serie macht Gemini 3.5 Flash, das ab sofort weltweit für Milliarden von Nutzern verfügbar ist.
Gemini 3.5 Flash: Leistungsdaten und Verfügbarkeit
Gemini 3.5 Flash ist das erste Modell der neuen Serie und ab sofort in mehreren Umgebungen zugänglich: über die Gemini-App und den KI-Modus in Google Search, über die Entwicklerplattform Google Antigravity sowie über die Gemini API in Google AI Studio und Android Studio. Für Unternehmenskunden steht das Modell in der Gemini Enterprise Agent Platform und in Gemini Enterprise bereit.
Google beschreibt 3.5 Flash als das bislang stärkste agentische und Coding-Modell der Gemini-Reihe. Konkret übertrifft es laut Google seinen Vorgänger Gemini 3.1 Pro auf anspruchsvollen Benchmarks für Coding und agentische Aufgaben:
- Terminal-Bench 2.1: 76,2 %
- GDPval-AA: 1.656 Elo
- MCP Atlas: 83,6 %
- CharXiv Reasoning (multimodale Verständnisfähigkeit): 84,2 %
Besonders hervorgehoben wird die Geschwindigkeit: Gemini 3.5 Flash soll bei der Ausgabe von Token viermal schneller sein als andere Frontier-Modelle. Laut Google landete das Modell im Artificial Analysis Index im oberen rechten Quadranten, was sowohl hohe Intelligenz als auch hohe Ausgabegeschwindigkeit bedeutet, ein Bereich, in dem bislang kaum ein Modell vertreten war.
Agentische Fähigkeiten im Mittelpunkt
Das Herzstück der Gemini-3.5-Architektur ist die agentische Ausrichtung des Modells. Gemini 3.5 Flash wurde explizit darauf optimiert, komplexe, mehrstufige Aufgaben über längere Zeiträume hinweg selbstständig zu planen, auszuführen und zu verfeinern, sogenannte „Long-Horizon Tasks". Google gibt an, dass Aufgaben, die einen Entwickler früher Tage oder einen Prüfer Wochen in Anspruch nehmen konnten, durch 3.5 Flash in einem Bruchteil der Zeit erledigt werden können, und das oft zu weniger als der Hälfte der Kosten anderer Frontier-Modelle.
Entscheidend für diese Fähigkeiten ist die Kombination mit dem aktualisierten Antigravity-Framework. Dieses sogenannte Harness erlaubt es, kollaborative Subagenten zu koordinieren und parallel einzusetzen, die gemeinsam an komplexen Aufgaben arbeiten. Konkrete Demonstrationen auf der Google I/O zeigten unter anderem:
- Die automatische Umbenennung und Kategorisierung unstrukturierter Assets auf Basis dynamischer Kriterien
- Die Synthese des wissenschaftlichen AlphaZero-Papers und die Programmierung eines vollständig spielbaren Spiels in sechs Stunden durch zwei koordinierte Agenten
- Die Migration einer veralteten Legacy-Codebase zu Next.js
- Die Erstellung vollständiger Stadtlandschaften in Antigravity durch parallele Subagenten
- Einen selbstverbessernden Entwicklungsloop, bei dem ein Builder-Agent und ein Player-Agent gemeinsam ein Spiel iterativ weiterentwickeln
Darüber hinaus demonstrierte Google, dass 3.5 Flash in der Lage ist, reichhaltigere und interaktivere Web-UIs sowie Grafiken zu generieren, darunter interaktive Animationen für wissenschaftliche Paper, UI-Varianten für Checkout-Flows in unter 60 Sekunden sowie vollständige Branding-Konzepte, die parallel entwickelt werden.
Unternehmenspartner setzen bereits auf Gemini 3.5 Flash
Google hat nach eigenen Angaben bei der Entwicklung der 3.5-Modellserie eng mit Industriepartnern zusammengearbeitet, um Schwachstellen und Komplexitätspunkte in realen Workflows zu identifizieren. Mehrere bekannte Unternehmen setzen das Modell bereits produktiv ein:
- Shopify nutzt parallele Subagenten, um komplexe Datensätze über lange Zeiträume zu analysieren und so präzisere Wachstumsprognosen für Händler auf globaler Ebene zu erstellen.
- Macquarie Bank erprobt den Einsatz von 3.5 Flash zur Beschleunigung des Kunden-Onboardings, indem das Modell über komplexe Dokumente mit mehr als 100 Seiten reasont, relevante Informationen extrahiert und zuverlässige Empfehlungen mit niedrigen Latenzzeiten ausspricht.
- Salesforce integriert 3.5 Flash in seine Agentforce-Plattform, um komplizierte Unternehmensaufgaben mit mehreren kontextbewussten Subagenten zu automatisieren.
- Ramp setzt das Modell für intelligenteres OCR durch multimodales Verständnis komplexer Rechnungsdokumente in Kombination mit historischen Mustern ein.
- Xero setzt Agenten ein, die mehrstufige Workflows über mehrere Wochen autonom verwalten, etwa die Identifizierung von Lieferanten und das Sammeln von Informationen für 1099-Steuerformulare.
- Databricks verwendet agentische Workflows zur Echtzeitüberwachung und Fehlerdiagnose in komplexen Datensätzen.
Gemini Spark: Persönlicher KI-Agent für Endnutzer
Gemini 3.5 Flash bildet auch die technische Grundlage des neuen Gemini Spark, einem persönlichen KI-Agenten, der laut Google rund um die Uhr läuft und Nutzer dabei unterstützt, ihr digitales Leben zu navigieren und Aufgaben in deren Auftrag zu erledigen. Gemini Spark ist ab sofort für ausgewählte Tester verfügbar; die Betaversion soll in der folgenden Woche nach der Ankündigung für Google AI Ultra-Abonnenten in den USA ausgerollt werden. Gleichzeitig ist 3.5 Flash das neue Standardmodell für die Gemini-App und den KI-Modus in der Google-Suche, weltweit.
Sicherheit und Frontier Safety Framework
Google betont, dass Gemini 3.5 in Übereinstimmung mit dem unternehmenseigenen Frontier Safety Framework entwickelt wurde. Im Vergleich zu Vorgängermodellen wurden die Schutzmaßnahmen in den Bereichen Cybersicherheit sowie CBRN (chemische, biologische, radiologische und nukleare Risiken) verstärkt. Das Modell soll seltener schädliche Inhalte erzeugen und gleichzeitig seltener fälschlicherweise harmlose Anfragen ablehnen.
Ausblick: Gemini 3.5 Pro
Neben dem bereits veröffentlichten 3.5 Flash arbeitet Google nach eigenen Angaben intensiv an Gemini 3.5 Pro. Das leistungsstärkere Modell der Serie wird intern bereits genutzt; Google plant, es im Laufe des folgenden Monats nach der Ankündigung breit auszurollen. Damit zeichnet sich ab, dass Google die Gemini-3.5-Reihe als strategische Plattform für agentische KI-Anwendungen sowohl im Consumer- als auch im Enterprise-Bereich positioniert, mit dem erklärten Ziel, Frontier-Intelligenz mit der Fähigkeit zur eigenständigen Handlung zu verbinden.
Quellen:
Google Blog: Gemini 3.5: frontier intelligence with action



