April 4, 2025
Googles Gemma 3 stellt einen bedeutenden Fortschritt im Bereich der offenen Sprachmodelle (Open-Weight Language Models) dar, indem es multimodale Fähigkeiten mit Hardware-Effizienz kombiniert. Veröffentlicht im März 2025, basiert diese Modellfamilie auf der Gemini 2.0-Technologie und ist für den Einsatz auf einem einzigen Beschleuniger (Single-Accelerator) optimiert.
Gemma 3 markiert einen wichtigen Meilenstein in der Entwicklung offener LLMs, da es eine bislang unerreichte Skalierbarkeit mit multimodalen Eingaben (Text und Bild) sowie breiter, mehrsprachiger Unterstützung vereint.
Gemma 3 ist in vier Größen erhältlich:
1B, 4B, 12B und 27B Parameter – geeignet für Anwendungen von Mobilgeräten bis hin zu groß angelegter Cloud-Infrastruktur.
Die Modelle (4B, 12B, 27B) unterstützen Kontextfenster bis zu 128.000 Tokens, was die effektive Verarbeitung großer Informationsmengen ermöglicht.
Ab der 4B-Version integriert Gemma 3 einen SigLIP Vision Encoder mit 400 Millionen Parametern für Bild- und Videoanalyse.
Mit erweiterten Tokenizern, die über 140 Sprachen unterstützen, eignen sich die Modelle hervorragend für globale und sprachlich diverse Anwendungsfälle.
Gemma 3 nutzt einen hybriden Aufmerksamkeitsmechanismus mit einem Verhältnis von 5:1 für lokale zu globalen Attention-Layern. Dies senkt den Speicherverbrauch bei langen Kontexten (bis zu 128k Tokens).
Das Modell verwendet vortrainierte SigLIP-Encoder, die während des Fine-Tunings eingefroren bleiben. Das sorgt für Trainingsstabilität und verhindert typische Probleme wie „Mode Collapse“, die bei gemeinsamen Trainingsansätzen auftreten.
Gemma 3 unterstützt quantisierte Ausführungen, inklusive offizieller 4-Bit-Varianten. Dies ermöglicht eine effiziente lokale Ausführung auf GPUs mit geringeren Speicher- und Rechenanforderungen.
Gemma 3 wird nativ unterstützt von:
Verfügbar auf:
Einsatz in Android- und Webumgebungen ist durch das Google AI Edge SDK möglich.
Jurist:innen und Forschende können Gemma 3 nutzen, um umfangreiche Dokumente zu analysieren und Erkenntnisse aus großen Textsammlungen zu gewinnen.
Internationale Unternehmen können Gemma 3-basierte Chatbots einsetzen, um konsistente und lokalisierte Nutzererlebnisse in verschiedenen Sprachen zu bieten.
Im Gesundheitswesen kann Gemma 3 helfen, Anomalien in radiologischen Bildern zu erkennen und mit der Patientenhistorie in Textform zu verknüpfen.
$ ollama pull gemma3:24b
pulling manifest
pulling afa0ea2ef463... 100% ▕██████████████████████████████████████████████████████████████████████▏ 17 GB
pulling e0a42594d802... 100% ▕██████████████████████████████████████████████████████████████████████▏ 358 B
pulling dd084c7d92a3... 100% ▕██████████████████████████████████████████████████████████████████████▏ 8.4 KB
pulling 0a74a8735bf3... 100% ▕██████████████████████████████████████████████████████████████████████▏ 55 B
pulling 9e5186b1ce17... 100% ▕██████████████████████████████████████████████████████████████████████▏ 490 B
verifying sha256 digest
writing manifest
success
$ ollama run gemma3:24b "Describe this image in detail. Is the image related to an OS?" ./tux.png
Okay, let's break down the image "tux.png".
**Description:**
The image depicts a cartoon penguin. It's a friendly-looking, upright penguin with a cheerful expression. It has a relatively
simple design, with black and white coloring. The penguin is facing forward, and appears to be standing or waddling. It has a
small, orange beak and feet.
**Is it related to an OS?**
**Yes, absolutely!** This penguin is **Tux**, the official mascot of the **Linux** operating system.
Here's the story behind it:
* **Origin:** In 1996, Larry Ewing created Tux as part of a contest to find a mascot for the Linux kernel.
* **Why a Penguin?** Linus Torvalds (the creator of Linux) was at the time bitten by a penguin during a visit to a zoo. He
mentioned this incident in a mailing list, and the idea of a penguin as a mascot stuck. It was also a bit of a playful choice,
as penguins are not native to the Arctic, and Linux was a relatively new and unexpected operating system.
* **Symbolism:** Tux represents the Linux kernel and the open-source community. He's a symbol of the OS's friendly,
approachable, and robust nature.
**In summary:** The image is a clear depiction of Tux the penguin, the iconic mascot of the Linux operating system. It's a
widely recognized symbol within the open-source world.
Google hat für Gemma 3 umfangreiche Sicherheitsmaßnahmen implementiert, um eine verantwortungsvolle Nutzung sicherzustellen. Diese beinhalten:
Gemma 3 markiert einen Meilenstein in der Entwicklung offener LLMs. Es vereint Skalierbarkeit und Vielseitigkeit in einer öffentlich zugänglichen Modellreihe. Durch die Förderung offener Innovationsökosysteme, die auf vielfältiger und inklusiver Zusammenarbeit basieren, leistet Gemma 3 einen bedeutenden Beitrag zur verantwortungsvollen und nachhaltigen Weiterentwicklung künstlicher allgemeiner Intelligenz (AGI).
Zukünftige Entwicklungen umfassen: