Durante años, Google ha liderado el mercado de búsquedas en internet. Pero OpenAI dio un giro de 360 grados al sistema al desarrollar un modelo de inteligencia artificial (IA), ChatGPT, que es actualmente uno de los recursos más usados como buscador y, además, es valorado por su capacidad de comprender el contexto y generar respuestas relevantes en todos los ámbitos desde consultas cotidianas hasta en programación.
¿Qué es Gemini?
Gemini es una plataforma de inteligencia artificial multimodal que puede procesar y generar texto, código, imágenes, audio y vídeo desde distintas fuentes de datos.
“Gemini es nuestro mayor y más capaz modelo de IA”, asegura Collins, vicepresidente de productos en Google DeepMind, quien explica que está “inspirado en la forma en que las personas entienden el mundo e interactúan con él”. “Se percibe más como un colaborador útil y menos como una pieza inteligente de programación”, afirma.
Gemini no es una aplicación sino la plataforma para llevar este último modelo IA a los servicios existentes, desde Bard, el chat de Google competidor de ChatGPT, hasta el buscador, los gestores de servicios, los móviles con Android o los centros de datos a gran escala.
Bard ahora es Gemini
Bard se presentó como una IA conversacional o chat de Google pero fue desde el año 2023 que identificaron que muchas personas de todo el mundo utilizaban Bard de una manera completamente nueva: para prepararse para entrevistas de trabajo, depurar códigos, generar nuevas ideas de negocios o, incluso ahora, para crear cautivadoras imágenes.
¿Y por qué el cambio?
En palabras de Google, “nuestra misión con Bard siempre ha sido brindarles acceso directo a nuestros modelos de IA y Gemini representa nuestra familia de modelos de lenguaje más capaz. Para poder reflejar esto de manera más clara, desde hoy Bard será conocido simplemente como Gemini.
Gemini pretende ser no solo un sustituto del buscador, sino también, según Sissie Hsiao, vicepresidenta de Google, “un verdadero asistente de inteligencia artificial, conversacional, multimodal y más útil que nunca”.
Gemini ha nacido como multimodal; es decir, no se ha entrenado con diferentes modalidades de datos y se han unificado luego las capacidades diferenciadas, sino que su programación ya parte de la diversidad de fuentes. Según explica Collins, “esto ayuda a Gemini a comprender sin problemas todo tipo de entradas mucho mejor que los modelos existentes y sus capacidades son de última generación”.
También es capaz de programar incluyendo desarrollos complejos. En este sentido, Amin Vahdat, vicepresidente en Google Cloud, asegura: “En el futuro, veremos a los programadores haciendo uso de modelos de IA de alta capacidad como herramientas colaborativas que ayudan con todo el proceso de desarrollo de software, desde el razonamiento sobre los problemas hasta la asistencia con la implementación, el rendimiento y las capacidades”.
Sobre la seguridad, Google afirma que Gemini supera “las evaluaciones más completas de todos los modelos hasta la fecha”. La compañía asegura que ha sometido a la plataforma a todos los riesgos existentes y potenciales y que mantiene un examen continuo que incluye “pruebas de estrés”. También se han aplicado los principios de IA de la propia compañía, que establecen las normas éticas de sus desarrollos.
Gemini Advanced
Sundar Pichai, CEO de Google, presentó la versión Gemini Advanced, que estará disponible por suscripción, “es más capaz de razonar, seguir instrucciones, codificar y colaborar de forma creativa” añadió. Algunos de los ejemplos de las funcionalidades son:
- Gemini Advanced puede ser un tutor personal: crea instrucciones paso a paso, cuestionarios de muestra o debates de ida y vuelta adaptados al estilo de aprendizaje.
- Puede ayudar con escenarios de programación más avanzados, sirviendo como caja de resonancia para ideas y ayudando a evaluar diferentes enfoques de código.
- Puede ayudar a los creadores digitales a pasar de la idea a la creación generando contenido nuevo, analizando tendencias y generando ideas sobre mejores formas de hacer crecer sus audiencias.
Esta versión avanzada, como se anunció durante su presentación y recuerda ahora Pichai, “utiliza una combinación de 57 materias, incluidas matemáticas, física, historia, derecho, medicina y ética, con las que se pone a prueba tanto el conocimiento como la capacidad de resolución de problemas”.
Gemini Advanced estará disponible a través del nuevo plan Google One AI Premium por US$ 19,99 al mes, comenzando con una prueba de dos meses sin costo. y, con la suscripción, compatible con hasta cinco usuarios, se podrá utilizar con Gmail, Docs, Sheets, Slides y Meet. Incluye soporte técnico, edición profesional de imágenes, recomendaciones y acceso anticipado a funciones de prueba.
La versión Duet AI, más orientada a empresas y desarrolladores, se convertirá en Gemini para Google Workspace y Google Cloud. Este último modelo dispone de habilidades específicas de gestión de procesos, desarrollo de programas y protección ante ciberataques, según la compañía.
En conclusión, Google está plenamente en la era Gemini y comprometido a hacer que la inteligencia artificial sea útil para todos. Su misión es organizar la información globalmente, haciéndola accesible a través de cualquier salida e integrar la información global con la información personal de manera útil para cada individuo. Este compromiso refleja su visión de un futuro donde la tecnología se adapte y sirva a las necesidades de cada uno de los usuarios de manera efectiva.
Edición: Sol Seguil