Niantic presentó un innovador proyecto de Gran Modelo Geoespacial (LGM, por sus siglas en inglés), impulsado por inteligencia artificial. Este modelo estará basado en datos recolectados a través de sus servicios, como Pokémon Go, y buscará desarrollar capacidades avanzadas de “comprensión espacial”.
La “comprensión espacial” permite visualizar e inferir elementos de una escena faltante o imaginarla desde otros ángulos, una tarea que resulta natural para los humanos, pero extremadamente compleja para las máquinas. Niantic pretende superar este desafío mediante el LGM, descrito como una herramienta con capacidades de “inteligencia espacial”.
Pokémon PlayGrounds: Cómo la realidad aumentada lleva Pokémon a ubicaciones reales con precisión
El modelo se entrenará usando aprendizaje automático a gran escala. Su objetivo será analizar y conectar millones de escenas globales, lo que podría revolucionar sectores como realidad aumentada, robótica y sistemas autónomos.
El LGM se alimentará de los datos recolectados por el Sistema de Posicionamiento Visual (VPS) de Niantic. Este sistema utiliza más de 50 millones de redes neuronales con 150 billones de parámetros, cubriendo más de un millón de ubicaciones en todo el mundo. VPS, tecnología central en juegos como Pokémon Go, ofrece precisión a nivel centimétrico y adapta el contenido digital según el comportamiento del usuario.
Una característica clave del VPS es su capacidad para identificar la posición y orientación de un usuario con solo una imagen de un smartphone. Esto se logra mediante un mapa 3D construido con información compartida por los jugadores. Este enfoque único incluye perspectivas peatonales, capturando áreas inaccesibles para otros métodos.
Niantic asegura que cada red local del VPS contribuye al modelo global, creando una “comprensión compartida” de ubicaciones aún no exploradas completamente. El LGM permitirá a las máquinas no solo entender el entorno físico, sino también interactuar con él de formas innovadoras.
Este avance, según la empresa, es crucial para tecnologías emergentes como gafas de realidad aumentada y la creación de contenidos interactivos. Además, Niantic destacó que el LGM operará de manera similar a los modelos de lenguaje de gran tamaño (LLM), pero basado en imágenes geolocalizadas. Miles de millones de imágenes se integrarán en un modelo que ofrecerá un entendimiento profundo de ubicaciones y estructuras.
*La creación de este contenido contó con la asistencia de inteligencia artificial. La información fue proporcionada y revisada por un periodista para asegurar su precisión. El contenido no se generó automáticamente.