Kurze Zusammenfassung
Das Video behandelt Google Gemini 3 und seine Fähigkeiten. Es werden beeindruckende Beispiele für Intelligenz und Multimodalität gezeigt, aber auch Seltsamkeiten und potenzielle Probleme angesprochen. Abschließend wird Googles Aufstieg im KI-Bereich und die Auswirkungen auf den Markt diskutiert.
- Gemini 3 zeigt beeindruckende Intelligenz und Multimodalität.
- Es gibt jedoch auch Seltsamkeiten und potenzielle Probleme.
- Google hat im KI-Bereich aufgeholt und übertrifft die Konkurrenz.
Einleitung und erste Eindrücke von Gemini 3 [0:00]
Der Sprecher äußert sich zunächst skeptisch gegenüber dem Hype um neue KI-Produkte, zeigt sich dann aber von Google Gemini 3 beeindruckt. Er beschreibt ein "Wow-Gänsehaut-Gefühl" und den Eindruck, einen Funken echter Intelligenz und gleichzeitig eine gewisse Gefährlichkeit zu spüren. Er kündigt anschauliche Beispiele, aber auch Seltsamkeiten an, darunter eine möglicherweise problematische Funktion, die Google entfernen könnte. Außerdem erwähnt er Tools wie Antigravity und die Bildgenerierung Nano Banana Pro.
Sponsor Incogni und Zugang zu Gemini 3 [1:51]
Der Sponsor des Videos ist Incogni, ein Dienst, der Nutzer automatisch aus Datenbanken von Datenhändlern löscht, um das Risiko von Identitätsdiebstahl und Scam zu reduzieren. Mit dem Couponcode CT3003 gibt es 60% Rabatt auf das Jahresabo. Anschließend wird erklärt, wie man Gemini 3 auf Gemini.google.com nutzen kann. Es ist eine Anmeldung im Google-Account erforderlich, wobei kostenlose Accounts auf fünf Fragen und zwei Bilder pro Tag beschränkt sind. Für umfangreichere Nutzung gibt es kostenpflichtige Abos wie AI Pro, Plus und Ultra.
Beispiel 1: Website-Erstellung mit überraschenden Details [4:03]
Der Sprecher beauftragt Gemini 3, eine persönliche Website für ihn als Tech-Journalist zu erstellen, die auf seine verschiedenen Kanäle verlinkt. Die erstellte Website ist zwar eher 08/15, aber eine Detailbeschreibung des YouTube-Kanals mit dem Zusatz "Tech-Videos mit Tiefe, Meinung und manchmal Kettensägen" überrascht ihn. Gemini erklärt, dass es sich dabei um einen "Deep Cut" handelte, der auf der technischen Bezeichnung für Stihl-Kettensägen (3003) und einem Temu-Video mit einer Mini-Kettensäge basiert. Der Sprecher ist beeindruckt von dieser unerwarteten Zusatzleistung und dem Schlussfolgern von Gemini.
Beispiel 2: Analyse eines Insekts mit zusätzlichen Informationen [7:09]
Der Sprecher zeigt ein totes Insekt und bittet Gemini 3 um eine Analyse. Während ChatGPT das Insekt korrekt als Hornissenschwebfliege identifiziert, liefert Gemini einen fesselnden Text mit zusätzlichen Informationen über Mimikry, Tarnung und Unterschiede zu Wespen. Der Sprecher empfindet diese Informationen als interessant und über den typischen LLM-Sound hinausgehend.
Beispiel 3: Analyse eines selbstgemachten Liedes [9:16]
Der Sprecher lädt ein selbstgemachtes, unveröffentlichtes Lied hoch und lässt es von Gemini 3 analysieren. Die Analyse ist sehr gut, sowohl musikalisch als auch in Bezug auf den Text, der als moderne Interpretation des Pygmalion-Mythos oder Ex Machina erkannt wird. Der Sprecher ist beeindruckt von der Fähigkeit von Gemini, den Text so präzise zu interpretieren.
Beispiel 4: Psychologische Analyse eines Podcasts [10:52]
Der Sprecher gibt Gemini 3 die erste Folge seines Podcasts 4004 und fordert eine psychologische Analyse der Sprecher, ihrer Beziehung zueinander, des Subtextes, der Herkunft und des Intelligenzquotienten. Gemini liefert eine detaillierte Analyse, die regionale Färbungen erkennt und den Intelligenzquotienten des Sprechers schätzt. Der Sprecher hält die Schätzung des Intelligenzquotienten für gefährliche Schmeichelei, da sie zu Identitätskonflikten führen könnte. Er betont die Unschärfe der Analyse und die fragwürdige Aussagekraft von Diagnosen über mentale Krankheiten oder Intelligenz auf Basis von Audioaufnahmen.
Weitere Beobachtungen und Bildgenerierung mit Nano Banana Pro [14:52]
Gemini oszilliert zwischen Intelligenz-Simulationen und echter Intelligenz, macht aber auch dumme Fehler und halluziniert. Bei der Analyse eines Fotos einer Statue in Hannover sind alle Angaben falsch. Die Bildgenerierungsfähigkeiten von Nano Banana Pro werden demonstriert, wobei besonders die gute Typografie in den generierten Bildern hervorgehoben wird. Es wird auch die einfache Bildbearbeitung mit Gemini gezeigt.
Probleme mit der Bildgenerierung und Videogenerierung [17:13]
Zeitweise vergisst Gemini, dass es Bilder generieren kann und erfindet eine fiktive Software namens Nano Banana Pro. Nach Aufforderung erinnert es sich jedoch an die Google-eigene Bildgenerierung. Passend zur Song-Analyse wird ein Musikvideo generiert, das thematisch passt, aber generisch wirkt. Die Videogenerierung heißt VO3 und kann über Gemini.google.com oder Google AI Studio genutzt werden.
Antigravity: Eine KI-gestützte Entwicklungsumgebung [19:04]
Antigravity ist eine integrierte Software-Entwicklungsumgebung, die sich selbst bedienen kann. Der Sprecher demonstriert ein in kurzer Zeit erstelltes Programm, das YouTube-Videos mit Filtern abspielt. Er plant ein ausführliches Video über Entwicklung mit KI, warnt aber vor möglichen Problemen wie dem Löschen der Festplatte. Gemini.google.com kann auch Code ausspucken, wie z.B. ein HTML mit einer Voxel-Szene, die aus einem Foto generiert wurde.
Fazit: Google Gemini 3 als "intelligentestes" LLM und Ausblick [20:35]
Der Sprecher kommt zu dem Schluss, dass Google Gemini 3 das "intelligenteste" LLM ist und Gemini 2.5 deutlich übertrifft. Er verweist auf ein Ranking, das Gemini 3 mit großem Abstand anführt. Dies zeigt, dass LLMs noch nicht am Ende ihrer Entwicklung angelangt sind und stellt die Nvidia-Dominanz in Frage, da Google eigene Hardware (TPUs) nutzt. Der Aktienkurs von Google zeigt einen deutlichen Anstieg nach der Veröffentlichung von Gemini 3. Der Sprecher ist gespannt auf die weitere Entwicklung von ChatGPT, Claude und Co. und fordert die Zuschauer auf, ihre Meinung zu Gemini 3 in den Kommentaren zu hinterlassen und den Podcast c't 4004 zu abonnieren.