BitcoinWorld
Google DeepMind Combineert Street View met Genie 3 om Interactieve AI-Werelden te Creëren
Google DeepMind heeft een belangrijke stap gezet in het overbruggen van de fysieke en digitale werelden door zijn Street View-beelden rechtstreeks te integreren in Project Genie, het algemene wereldmodel van het bedrijf. Aangekondigd op de Google I/O-ontwikkelaarsconferentie, stelt de integratie gebruikers in staat om interactieve, verkenbare omgevingen te genereren die zijn verankerd aan echte locaties die zijn vastgelegd in twee decennia aan Street View-gegevens.
Gedurende 20 jaar heeft Google meer dan 280 miljard afbeeldingen verzameld in 110 landen met behulp van auto's uitgerust met camera's en rugzak-gemonteerde trackers. Nu voedt die enorme dataset Genie 3, een wereldmodel dat in staat is diverse, interactieve 3D-omgevingen te genereren op basis van tekstprompts of afbeeldingen. Jack Parker-Holder, een onderzoekswetenschapper bij het open-endedness-team van DeepMind, legde aan Bitcoin World uit dat de combinatie van echte werelddata met generatieve simulatie krachtige toepassingen opent voor zowel robotica als menselijke verkenning.
"Het is echt krachtig voor zowel de agent [en robotica] use case als voor mensen om mee te spelen," zei Parker-Holder. Hij beschreef een scenario waarbij een robot ingezet in Londen — een stad die zelden zon ziet — getraind zou kunnen worden op gesimuleerde zonnige dagen gegenereerd uit Street View-gegevens, zodat de plotselinge glinstering van zonlicht op Victoriaanse woningen zijn sensoren niet verstoort. Evenzo zou een reiziger die een reis naar New York City in de winter plant, het hulpmiddel kunnen gebruiken om een besneeuwde versie van een specifiek blok te visualiseren, waarbij weersomstandigheden op aanvraag worden aangepast.
Genie 3 wordt al gebruikt door Waymo, Google's dochteronderneming voor zelfrijdende auto's, om uiterst zeldzame gebeurtenissen te simuleren — zoals tornado's of onverwachte dierontmoetingen — voor de training van autonome voertuigen. Parker-Holder merkte op dat hoewel Waymo zijn eigen simulator heeft gericht op het gezichtspunt van de auto, Street View-integratie het mogelijk maakt om het perspectief te verschuiven naar andere agenten, zoals voetgangers of bezorgrobots, waardoor uitgebreidere trainingsscenario's mogelijk worden.
De mogelijkheid om simulaties te verankeren aan echte geografische locaties zou Waymo's uitbreiding naar nieuwe steden over de hele wereld kunnen versnellen, waardoor zijn AI-bestuurder blootstelling krijgt aan diverse wegindelingen, bewegwijzering en omgevingsomstandigheden zonder fysieke vlootimplementatie te vereisen.
Ondanks de indrukwekkende demo's — waaronder een onderwatersimulatievan een wijk — blijft de technologie experimenteel. Diego Rivas, een productmanager bij DeepMind, waarschuwde dat Street View in Genie nog in ontwikkeling is. In de voorbeelden die aan journalisten werden getoond, waren de omgevingen herkenbaar, maar van videogamekwaliteit in plaats van fotorealistisch. De modellen missen ook fysisch bewustzijn: in één simulatie liep een vrouw die door een besneeuwd Joshua Tree-landschap rende dwars door cactussen en struiken heen.
Parker-Holder erkende de kloof en vergeleek Genie's huidige nauwkeurigheid met die van videogeneratiemodellen van zes tot twaalf maanden geleden. "Ik denk dat het iets is wat we zullen oplossen," zei hij, en merkte op dat begrip van fysica intuïtief ontstaat door passieve observatie, vergelijkbaar met hoe levende wezens leren.
Jonathan Herbert, directeur van Google Maps en een 12-jaar Street View-veteraan, benadrukte dat de echte doorbraak ruimtelijke continuïteit is. Wanneer een gebruiker 360 graden draait, onthoudt de AI de omgeving achter hen correct en simuleert deze, en bouwt vervolgens nieuwe omgevingen op basis van dat begrip. "We hebben lang nagedacht over hoe we het beste en rijkste model van de wereld kunnen opbouwen op basis van Street View-gegevens," zei Herbert.
Google lanceert Street View in Genie vandaag voor geselecteerde Ultra-gebruikers in de Verenigde Staten, met bredere toegang in de VS die geleidelijk wordt uitgerold. Wereldwijde Ultra-gebruikers krijgen de komende weken toegang. Het doel van de onderzoekers, volgens Rivas, is om de mogelijkheid in zo veel mogelijk handen te krijgen, hoewel hij benadrukte dat nauwkeurigheidsverbeteringen een prioriteit blijven.
Door twee decennia aan echte wereldbeelden te verbinden met generatieve AI, legt Google DeepMind de basis voor een nieuwe klasse van interactieve simulaties. Hoewel nog in een vroeg stadium, vertegenwoordigt de integratie van Street View in Genie 3 een betekenisvolle stap richting AI-systemen die de fysieke wereld kunnen begrijpen, simuleren en ermee kunnen interageren — met implicaties voor robotica, autonoom rijden, stedelijke planning en meeslepend onderwijs.
V1: Wat is Genie 3?
Genie 3 is Google DeepMind's algemene wereldmodel dat interactieve, verkenbare 3D-omgevingen kan genereren op basis van tekstprompts of afbeeldingen. Het is ontworpen voor roboticatraining, gaming en educatieve ervaringen.
V2: Hoe werkt Street View-integratie?
De integratie stelt Genie 3 in staat om Google's enorme Street View-beeldendataset te gebruiken — meer dan 280 miljard afbeeldingen uit 110 landen — als basis voor het genereren van simulaties die zijn verankerd aan echte locaties. Gebruikers kunnen deze omgevingen interactief verkennen en omstandigheden zoals het weer aanpassen.
V3: Is de simulatie fysisch nauwkeurig?
Nog niet. De huidige versie mist fysisch bewustzijn, wat betekent dat objecten mogelijk niet realistisch interageren (bijv. een personage dat door vaste objecten heen loopt). Google verwacht dat dit in de komende 6–12 maanden zal verbeteren naarmate het model fysica intuïtief leert via meer gegevens.
Deze post Google DeepMind Combineert Street View met Genie 3 om Interactieve AI-Werelden te Creëren verscheen eerst op BitcoinWorld.


