Bienvenidos a Gemini la nueva IA de Google

Estas en: Portada » Diseño/programación » Bienvenidos a Gemini la nueva IA de Google

por Josep M Tapia · Publicada 22 diciembre, 2023 · Actualizado 8 febrero, 2024

Google lleva un par de meses hablando de Gemini, su modelo de IA más capaz y generalista hasta la fecha. Gemini es multimodal, lo que significa que puede comprender y operar de manera fluida en diferentes tipos de información, como texto, código, audio, imagen y video. Gemini también es el modelo más flexible de Google hasta ahora, y puede ejecutarse de manera eficiente en todo, desde centros de datos hasta dispositivos móviles. Sus capacidades de vanguardia mejorarán significativamente la forma en que los desarrolladores y los clientes empresariales crean y escalan con la IA.

Índice de contenidos

Características principales de Gemini:

Razonamiento sofisticado: Gemini 1.0 puede entender y razonar sobre información compleja escrita y visual. Esto lo hace único en su capacidad para descubrir conocimientos que pueden ser difíciles de discernir entre grandes cantidades de datos.
Comprensión de texto, imágenes, audio y más: Está entrenada para reconocer y comprender texto, imágenes, audio y más al mismo tiempo, por lo que comprende mejor la información matizada y puede responder a preguntas relacionadas con temas complicados. Esto lo hace especialmente bueno para explicar la lógica en temas complejos como matemáticas y física.
Código avanzado: La primera versión de Gemini puede entender, explicar y generar código de alta calidad en los lenguajes de programación más populares del mundo, como Python, Java, C ++ y Go. Su capacidad para trabajar en diferentes idiomas y razonar sobre información compleja lo convierte en uno de los principales modelos de lenguaje de programación en el mundo.
Más fiable, escalable y eficiente: Según Google está entrenada a gran escala en la infraestructura de IA optimizada utilizando los Tensor Processing Units (TPUs) v4 y v5e de diseño interno de Google. También está diseñada para ser el modelo más confiable y escalable para entrenar y más eficiente para servir.
Construido con responsabilidad y seguridad en el centro: Google, está comprometido con el avance de la IA de forma responsable. Basada en los Principios de IA de Google y las políticas de seguridad sólidas en nuestros productos, estan agregando nuevas protecciones para tener en cuenta las capacidades multimodales de Gemini. En principio en cada etapa del desarrollo, se van a considerar los riesgos potenciales y trabajar para mitigarlos.

Las tres versiones de Gemini:

Gemini Nano es la versión más pequeña y eficiente de Gemini. Está diseñada para su uso en dispositivos móviles y otros dispositivos con recursos limitados. Está disponible en los teléfonos Pixel 8 Pro y estará disponible en más dispositivos en el futuro. Tamaño reducido y bajo consumo de energía. Esto es genial porque no tendrás que usar la app para conectarte al servidor, la tendrás implementada en el móvil y podrá trabajar sin conexión..
Gemini Pro es la versión intermedia de Gemini. Es una buena opción para una amplia gama de tareas, desde la creación de contenido creativo hasta la resolución de problemas complejos. Es la versión que se utilizará en los productos de Google, como Bard, el asistente de voz de Google. Gemini Pro está ya disponible para desarrolladores y clientes empresariales .
Gemini Ultra es la versión más potente y capaz de Gemini. Está diseñada para tareas complejas que requieren un alto rendimiento, como la traducción automática y la comprensión del lenguaje natural. Está actualmente disponible para determinados clientes y se lanzará al público en general a principios del próximo año. Consume una gran cantidad de memoria, requiere de mucha capacidad de procesamiento y tiene la mayor capacidad de aprendizaje

Aplicaciones de Gemini:

Búsqueda: Gemini está mejorando la experiencia de búsqueda generativa (SGE) de Google, lo que la hace más rápida y precisa para los usuarios.
Bard: Gemini está proporcionando a Bard nuevos conocimientos y capacidades para comprender mejor el contexto y responder a las preguntas de los usuarios de manera más completa y relevante.
Pixel: Gemini está impulsando nuevas características en Pixel 8 Pro, como Summarize en la aplicación Recorder y Smart Reply en Gboard.
Desarrollo: Gemini está disponible para que los desarrolladores y los clientes empresariales accedan a través de la API de Gemini en Google AI Studio o Google Cloud Vertex AI.

Coste

El coste de las versiones de Gemini varía en función de la cantidad de recursos que se utilicen. Gemini Nano es gratuito para uso personal. Gemini Pro y Gemini Ultra tienen precios basados en el uso, similar a Firebase.

A quién van dirigidas

Gemini Nano es una buena opción para los desarrolladores individuales que quieran utilizar la IA en sus aplicaciones móviles o web. Es gratuita y fácil de usar, por lo que es una buena manera de empezar a experimentar con la IA.

Las versiones Pro y Ultra van dirigidas a empresas que necesitan una IA potente para llevar a cabo tareas complejas. Están disponibles a través de la plataforma Vertex AI de Google, que ofrece una amplia gama de funciones y servicios para ayudar a las empresas a sacar el máximo partido a la IA.

Gemini vs. Bard

Como hay un poco de confusión entre estos dos conceptos simplemente explicar que Gemini es el modelo de lenguaje que se utiliza como motor de Bard, mientras que Bard es la interfaz que los usuarios utilizan para interactuar con Gemini. Es decir seria como el frontend y el backend. En otras palabras, Gemini es el motor que hace que Bard funcione, y Bard es la forma en que interactuas con Gemini.

Conclusiones

Según Demis Hassabis, director ejecutivo y cofundador de Google DeepMind, Gemini es el resultado de esfuerzos colaborativos a gran escala por parte de todos los equipos de Google. Se ha construido desde cero para ser multimodal, lo que significa que puede comprender, operar en diferentes dominios y combinar diferentes tipos de información, como texto, código, audio, imagen y vídeo. Es un hito significativo en el desarrollo de las IAs, y el comienzo de una nueva era para Google. Se debe seguir innovando rápidamente y avanzando de forma responsable en las capacidades de todos estos modelos.
Se irá desplegando poco a poco, ya esta la versión Pro en algunos países no europeos y sólo (de momento) en ingles, y paulatinamente ira apareciendo en los móviles Pixel de gama alta, llegará a otros servicios como el propio buscador etc.
Pues eso, después de unos inicios titubeantes donde Microsofot parecía que tomaba la delantera Google se ha puesto las pilas, veremos como acaba la fiesta 🙂

Fuente: Google Deep Mini

Descarga el informe técnico oficial

Bard ahora es Gemini

Facebook Tweet LinkedIn Email