Google Desvela Gemini, su Revolucionaria Inteligencia Artificial Multimodal

por majo

Google ha presentado su última hazaña en inteligencia artificial: Gemini, un modelo multimodal que promete redefinir el panorama tecnológico. Este anuncio, comparable en magnitud al impacto de ChatGPT, marca un paso crucial hacia la realización de una Inteligencia Artificial General (AGI).

Detalles de Funcionamiento: La Era Multimodal de Gemini

Gemini destaca por su capacidad multimodal, no solo interpretando texto sino también imágenes, videos, audio e incluso código de programación. Este avance desafía a modelos anteriores, como DALL-E y Whisper, al fusionar diversas modalidades en una única plataforma.

En una demostración visual, Gemini responde a comandos de voz, identificando y describiendo objetos en tiempo real. Además, muestra habilidades de traducción y participa en interacciones complejas, proponiendo ideas de juego y completando dibujos en juegos clásicos.

 

Tres Versiones para Diversas Aplicaciones

Gemini se presenta en tres versiones: Nano, para dispositivos Android nativos y offline; Pro, potenciando los servicios de IA, incluido el chatbot Bard; y Ultra, el LLM más poderoso destinado a tareas en centros de datos y aplicaciones corporativas.

Visión a Futuro y Responsabilidad

Sundar Pichai, CEO de Google, destaca que Gemini marca una nueva era para la IA dentro de la compañía. Demis Hassabis, director ejecutivo de Google DeepMind, revela planes de expandir las capacidades de Gemini, haciéndolo más consciente y preciso, superando sesgos y alucinaciones.

Google enfatiza la responsabilidad en el desarrollo de Gemini, subrayando su objetivo final de alcanzar una AGI que supere las capacidades humanas. Hassabis enfatiza la necesidad de abordar esta “tecnología activa” con cautela, combinando prudencia con optimismo en el camino hacia la AGI.

Leer mas  Pergamino: El Barrio 9 de Julio se suma al Plan de Pavimentación

Publicaciones Realcionadas

Deja un comentario