Google Gemma 4: Open-Source-KI, die auf deinem Smartphone läuft

07. April 20264 Min. Lesezeit

Google DeepMind hat am 2. April 2026 die Gemma-4-Modellfamilie veröffentlicht. Vier KI-Modelle, komplett quelloffen unter der Apache-2.0-Lizenz, die direkt auf Smartphones, Laptops und sogar einem Raspberry Pi laufen. Das Flaggschiff-Modell belegt aktuell Platz 3 unter allen Open-Source-Modellen auf dem Arena-AI-Leaderboard.

Was ist Gemma 4?

Gemma 4 ist Googles neueste Familie offener KI-Modelle. Anders als Googles kommerzielle Gemini-Modelle kannst du Gemma 4 kostenlos herunterladen, auf eigener Hardware betreiben und kommerziell nutzen. Die Modelle basieren auf derselben Forschung wie Gemini 3, wurden aber speziell für den Einsatz auf lokalen Geräten optimiert.

Das Besondere: Alle vier Modelle sind multimodal. Sie verarbeiten nicht nur Text, sondern auch Bilder, Video und Audio. Und das auf Geräten, die in jeder Hosentasche Platz finden.

Die vier Modelle im Überblick

Gemma 4 E2B (2,3 Milliarden Parameter)

Das kleinste Modell der Familie. Läuft auf Smartphones und unterstützt Bilderkennung sowie Spracherkennung. Kontextfenster von 128.000 Tokens. Ideal für mobile Apps und IoT-Geräte.

Gemma 4 E4B (4,5 Milliarden Parameter)

Die mittlere Variante mit ebenfalls 128.000 Tokens Kontext. Unterstützt wie das E2B-Modell Audio-Input für Spracherkennung und Übersetzung. Gut geeignet für Laptops und leistungsstärkere Endgeräte.

Gemma 4 26B MoE (26 Milliarden Parameter, 4B aktiv)

Ein Mixture-of-Experts-Modell, das nur 4 Milliarden Parameter pro Anfrage aktiviert. So bleibt der Speicherbedarf niedrig, während die Leistung hoch ist. Unterstützt Video-Verständnis bis 60 Sekunden und ein Kontextfenster von 256.000 Tokens. Platz 6 unter den Open-Source-Modellen auf dem Arena-AI-Leaderboard mit 1.441 Elo.

Gemma 4 31B Dense (31 Milliarden Parameter)

Das Flaggschiff. Ein klassisches Dense-Modell mit voller Parameterzahl und 256.000 Tokens Kontext. Platz 3 unter den Open-Source-Modellen auf dem Arena-AI-Leaderboard mit 1.452 Elo (Platz 27 im Gesamtranking). Unterstützt ebenfalls Video-Input.

Was Gemma 4 besser macht als seinen Vorgänger

Die Leistungssprünge gegenüber Gemma 3 sind beeindruckend:

Mathematik (AIME 2026): Von 20,8 % auf 89,2 %
Programmierung (LiveCodeBench): Von 29,1 % auf 80,0 %
Wissenschaft (GPQA): Von 42,4 % auf 84,3 %

Dazu kommen neue Fähigkeiten wie Multi-Step-Planning, Function-Calling und strukturierte JSON-Ausgaben. Gemma 4 kann also nicht nur Fragen beantworten, sondern eigenständig Aufgaben in mehreren Schritten abarbeiten. Google nennt das "agentic capabilities". Außerdem unterstützen die Modelle nativ über 140 Sprachen.

Was bedeutet das für dein Unternehmen?

Gemma 4 ist aus drei Gründen relevant, wenn du KI im Geschäftsalltag nutzt:

Datenschutz ohne Kompromisse: Weil die Modelle lokal laufen, verlassen deine Daten nie das Gerät. Keine Cloud, kein Drittanbieter, keine Auftragsverarbeitungsverträge nötig. Für DSGVO-sensible Anwendungen ist das ein echter Vorteil.

Keine Lizenzkosten: Apache 2.0 bedeutet: Du kannst die Modelle kommerziell einsetzen, ohne Gebühren zu zahlen. Keine Nutzer-Obergrenzen, keine Nutzungsbeschränkungen. Gerade für Startups und kleine Teams interessant.

Offline-fähig: Gemma 4 funktioniert komplett ohne Internetverbindung. Das eröffnet Einsatzszenarien, die mit Cloud-KI nicht möglich sind, etwa in der Produktion, auf Baustellen oder bei Kundenterminen mit schlechtem Netz.

Konkrete Einsatzszenarien für KMU:

Dokumentenanalyse: Verträge, Rechnungen oder Angebote lokal auf dem Laptop analysieren, ohne sensible Geschäftsdaten in die Cloud zu schicken
Kundenservice: Chatbots, die direkt auf dem Firmenserver laufen und Kundenanfragen in über 140 Sprachen verstehen
Qualitätskontrolle: Bilder und Videos von Produkten oder Baustellen vor Ort auswerten, auch ohne WLAN
Übersetzung und Transkription: Meetings oder Kundengespräche in Echtzeit transkribieren und übersetzen

Gut zu wissen: Für KI-Anwendungen, die keine lokale Installation erfordern, bietet ConRat AI eine fertige Plattform mit mehreren KI-Modellen in einer Oberfläche. Im KI-Chat stehen dir unter anderem GPT-4.1, GPT-5 Mini, Claude, Llama 4 und DeepSeek zur Verfügung. Alle Modelle laufen über EU-Server, DSGVO-konform, und du brauchst keine eigene Infrastruktur aufzusetzen.

Einordnung: Open Source holt auf

Gemma 4 zeigt einen klaren Trend: Offene KI-Modelle nähern sich der Leistung kommerzieller Spitzenmodelle. Das 31B-Modell liegt auf Platz 3 der Open-Source-Rangliste und konkurriert mit Modellen, die 20-mal so groß sind. Und das bei einem Bruchteil der Modellgröße.

Für Unternehmen bedeutet das mehr Auswahl und mehr Verhandlungsmacht. Wer heute eine KI-Strategie plant, muss sich nicht mehr zwischen "leistungsstark" und "datenschutzfreundlich" entscheiden. Beides ist möglich.

Allerdings gilt: Lokale Modelle erfordern technisches Know-how für Installation, Wartung und Optimierung. Für Teams ohne eigene IT-Abteilung bleiben Cloud-basierte KI-Plattformen oft der pragmatischere Weg.

Unser Fazit

Google Gemma 4 setzt neue Maßstäbe für Open-Source-KI. Die Kombination aus starker Leistung, lokaler Ausführung, multimodalen Fähigkeiten und einer freien Lizenz macht die Modelle besonders für datenschutzbewusste Unternehmen interessant. Wer die technischen Ressourcen hat, bekommt mit Gemma 4 eine leistungsstarke und kostenlose Alternative zu kommerziellen KI-Diensten.

Quellen: