Google lanceert Gemini 3: Slimme redeneervaardigheden -

Google lanceert Gemini 3 met geavanceerde redeneervaardigheden, ‘generatieve gebruikersinterface’ voor antwoorden en meer

Google kondigde vandaag Gemini 3 aan met als doel om “elke gedachte tot leven te brengen.” Het eerste model in deze serie is Gemini 3 Pro, waarvan de uitrol vandaag start voor de Gemini-app en de AI Modus.
Met Gemini 1.0 richtte Google zich op native multimodaliteit en een lange contextvenster. Een jaar later bracht Gemini 2.0 geavanceerd redeneren en de eerste agentachtige mogelijkheden, terwijl Gemini 2.5 diepe redeneervaardigheden en programmeermogelijkheden introduceerde.
Gemini 3 — waarbij de “.0” valt weg — is Google’s “meest intelligente model” en gepositioneerd als een hulpmiddel om jou te helpen “elke gedachte tot leven te brengen.”
Het model begint met het beter begrijpen van de context en de intentie van je verzoek, zodat “je krijgt wat je nodig hebt met minder aanwijzingen.” Gemini 3 is toonaangevend op het gebied van redeneren met het vermogen om “diepgang en nuance te doorgronden,” zoals “het waarnemen van subtiele aanwijzingen in een creatief idee of het uit elkaar halen van de overlappende lagen van een moeilijk probleem.”
De antwoorden van Gemini 3 Pro zijn gericht op “slim, beknopt en direct” te zijn, waarbij clichés en vleierij worden ingewisseld voor oprechte inzichten.

Het fungeert als een echte denkpartner die je nieuwe manieren geeft om informatie te begrijpen en jezelf uit te drukken, van het vertalen van complexe wetenschappelijke concepten tot het genereren van code voor hoogwaardige visualisaties en creatieve brainstormsessies.

Prestatie-indicatoren

Gemini 3 Pro behaalde een score van 1501 op LMArena en overtreft daarmee 2.5 Pro (1451), dat tot nu toe de beste was. Het presteert op alle belangrijke benchmarks aanzienlijk beter dan het model dat het vervangt:

…toont redeneren op PhD-niveau met top scores op Humanity’s Last Exam (37,5% zonder het gebruik van hulpmiddelen) en GPQA Diamond (91,9%).
…zet een nieuwe standaard voor grensverleggende modellen in wiskunde met een nieuwe state-of-the-art score van 23,4% op MathArena Apex.
Naast tekst herdefinieert Gemini 3 Pro multimodaal redeneren met doorbraakscores van 81% op MMMU-Pro en 87,6% op Video-MMMU.
…behaalt een toonaangevende 72,1% op SimpleQA Verified, wat grote vooruitgang toont op het gebied van feitelijke nauwkeurigheid.
…staat bovenaan het WebDev Arena-leaderboard met een indrukwekkende 1487 ELO-punten.
…behaalt 54,2% op Terminal-Bench 2.0, dat het vermogen van een model test om hulpmiddelen te gebruiken via een terminal.
…presteert aanzienlijk beter dan 2.5 Pro op SWE-bench Verified (76,2%), een benchmark die programmeeragents meet.

Dit betekent dat Gemini 3 Pro zeer bekwaam is in het oplossen van complexe problemen op een breed scala aan onderwerpen zoals wetenschap en wiskunde met een hoge mate van betrouwbaarheid.
Google kondigde vandaag ook de Gemini 3 Deep Think-modus aan met zelfs betere redeneervaardigheden en multimodale begrip. Deze overtreft Gemini 3 Pro op Humanity’s Last Exam (41,0% zonder hulpmiddelen) en GPQA Diamond (93,8%). Deze modus zal de komende weken beschikbaar worden voor AI Ultra-abonnees.
Daarnaast behaalt het een ongekende 45,1% op ARC-AGI (met code-uitvoering), wat de vaardigheid aantoont om nieuwe uitdagingen op te lossen.

Generatieve gebruikersinterface

Gemini 3 maakt generatieve UI mogelijk (of generatieve interfaces), waarbij grote taalmodellen niet alleen inhoud, maar ook volledige gebruikerservaringen genereren. Dit omvat webpagina’s, games, hulpmiddelen en applicaties die “automatisch worden ontworpen en volledig worden aangepast als reactie op elke vraag, instructie of prompt.”

Dit werk vormt een eerste stap richting volledig AI-gegenereerde gebruikerservaringen, waarbij gebruikers automatisch dynamische interfaces krijgen die zijn afgestemd op hun behoeften, in plaats van te moeten kiezen uit een bestaande catalogus van applicaties.
Achter de schermen maakt Gemini 3 Pro gebruik van toegankelijkheid tot hulpmiddelen zoals webzoekopdrachten en beeldgeneratie, evenals “zorgvuldig geformuleerde systeeminstructies.”
Het systeem wordt geleid door gedetailleerde instructies die het doel, planning, voorbeelden en technische specificaties omvatten, waaronder opmaak, handleidingen voor hulpmiddelen en tips om veelvoorkomende fouten te voorkomen.
Tot slot wordt de output verwerkt via nabewerkers die “potentiële veelvoorkomende problemen” aanpakken.
Vandaag wordt dit gelanceerd in de Gemini-app als experimenten. In de dynamische weergave ziet Gemini 3 een “volledig aangepaste interactieve respons voor elke prompt ontwerpen en coderen.”
Het personaliseert de ervaring met het besef dat het uitleggen van het microbioom aan een vijfjarige ander inhoud en andere functies vereist dan aan een volwassene, net zoals het maken van een galerij met sociale mediaberichten voor een bedrijf een volledig andere interface vraagt dan het genereren van een plan voor een komende reis.

Post Views: 14