Google Lanza Gemini 1 5 Flash Más Velocidad y Mejor Comprensión de Imágenes
Si tienes alguna inquietud recuerda contactarnos a través de nuestras redes sociales, o regístrate y déjanos un comentario en esta página para poder ayudarte. También puedes participar en el WhatsApp Ecuador.
La Inteligencia Artificial es el área de mayor desarrollo tecnológico de los últimos años. Y actores como Meta y Google también se suman para competir y liderar en el sector. Gemini 1.5 Flash es la plataforma de Google mejorada para mayor velocidad y comprensión de las imágenes. Con su nuevo modelo, ya son cuatro los que ofrece Google: Gemini Nano, Flash, Pro y Ultra.
En la Google I/O se habló del futuro de Android y de la Inteligencia Artificial con la presentación de Gemini 1.5 Flash y su gran incremento en velocidad y calidad de las respuestas. La encrucijada de Google es muy llamativa, porque la empresa está especializada en Inteligencia Artificial. Fue la empresa que creó las principales herramientas para entrenar las IA, pero ya no ocupa el podio en modelos de lenguaje e inteligencia generativa. Open AI es la empresa de referencia en el sector, y la innovación no se detiene con el reciente lanzamiento de GPT-4o que sigue en lo alto. La respuesta de Google con Gemini 1.5 Flash no se hizo esperar.
Gemini 1.5 Flash, una IA recortada pero enfocada en la velocidad
Al comparar las inteligencias artificiales de Google y Open AI, saltaba a la vista la diferencia en términos de velocidad. El modelo Chat-GPT 4o hizo que la valoración de orden y la escritura palabra por palabra alcanzará nuevos niveles. Y Google no quiere quedarse atrás.
Que la IA tarde en responder le resta naturalidad al modelo de aprendizaje y respuestas generativas. Por eso la nueva Gemini 1.5 Flash apunta a acelerar los tiempos de respuesta, pero sin perder el comportamiento multimodal. La última versión de la IA de Google no pierde su capacidad de entendimiento, sigue analizando el contexto y puede interpretar palabras e imágenes. Pero con un tiempo de respuesta realmente mejorado. Su entrenamiento toma como base la versión Gemini 1.5 Pro y le quita algunos procesos, para optimizar la velocidad de ejecución al máximo.
Lo que se pudo ver en Google I/O da cuenta de una mejora notable. El avance en velocidad habilita a extraer documentos, resumir correos electrónicos, interpretar tablas y muchas otras funciones. Además de este nuevo modelo, Google también optimizó el funcionamiento de Gemini 1.5 Pro. Este es el modelo que actualmente da vida al chatbot gratuito de Google. El chatbot entiende con mayor amplitud las instrucciones y se pueden usar distintos formatos. También tiene capacidad para interpretar estilos, y desde Google aseguran que el comportamiento es un poco más humano que en versiones anteriores.
Los cambios en la IA también afectan a la versión Gemini Nano. En este caso, la IA generativa a nivel de los dispositivos Pixel también se vuelve multimodal. Esto quiere decir que además de entendimiento de texto, puede analizar imágenes. Está disponible en Google Pixel 8 y seguirá siendo la versión 1.0, a diferencia de la 1.5 de sus otras tres iteraciones. También se anunció que llegará a otros modelos de Google Pixel. La nueva Gemini 1.5 Flash está disponible en la API de Google para los desarrolladores y en el chatbot de la empresa para todos los usuarios. En cuanto al despliegue de Gemini Nano, se irá volcando a diferentes Google Pixel con el paso de los días.}
¿En qué se diferencian los modelos de Inteligencia Artificial de Google?
Las tres principales inteligencias artificiales que promueve Google se llaman Gemini 1.5, Pro y Flash. Son similares, pero tienen diferencias sustanciales que permiten variar en la elección de acuerdo al uso y necesidades de cada plataforma. Las tres funcionan en la nube, por eso comparten el eje principal de funcionamiento.
Google Gemini es el nombre de los modelos de inteligencia, pero también es la forma de denominación del chatbot conversacional de Mountain View. El Gemini que tiene un número de versión no es el asistente de Inteligencia Artificial, sino que referencia a la tecnología subyacente.
¿Qué es Gemini 1.5?
La última versión del modelo de IA de Google fue presentado en febrero de 2024. Es un modelo que compite con otros como GPT. Actualmente es el motor del botón de Inteligencia Artificial que se llama Gemini, y compite directamente con la propuesta de Open AI ChatGPT.
Gemini 1.5 surgió originalmente con la idea de ofrecer un asistente personal, así como una herramienta de negocios. El modelo es ultimodal, entiende mensajes de texto y el contexto de una fotografía. Si cargamos una foto, la IA será capaz de entender lo que rodea y significa el pedido y cómo extraer diferentes datos.
Su enfoque cuenta con una arquitectura mejorada denominada Mixture-of-Experts. Su ventaja es que logra mayor eficiencia, y sus campos expertos internos permiten acelerar las respuestas y la calidad de las respuestas, sin importar el tipo de consulta.
Cuando hacemos una consulta con Gemini 1.5, solamente se activan los módulos de búsqueda expertos para cada temática. Así, el tipo de recomendación o búsqueda se vuelve mucho más centrado y específico. Un reclamo que se había vuelto bastante recurrente en comparación con las respuestas de Chat GPT-4o.
Las mejoras de Gemini 1.5 Pro
La versión más avanzada y profesional de Gemini 1.5. Es un modelo de Inteligencia Artificial de tamaño medio, optimizado para mejorar el rendimiento en una amplia gama de acciones diferentes. Puede procesar lenguaje natural para la generación de textos, resumirlos, responder preguntas y analizar código en diferentes lenguajes. Además detecta errores y puede ser tu asistente y generar código propio según indicaciones. Al ser multimodal, también procesa imágenes e identifica elementos, los clasifica y describe.
Su principal diferencia es que tiene una ventana de comprensión de 1 millón de tokens, frente al estándar de la versión base que se reduce a 128.000. A más tokens, mayor precisión y fluidez en las respuestas que brinda. Gemini 1.5 Pro también es capaz de procesar y entender lo que sucede en un vídeo y resumir contenidos directamente desde una base audiovisual.
La propuesta de Gemini 1.5 Flash
Por último, la inteligencia artificial de Gemini 1.5 Flash es más ligera y eficiente, pero con algunas reducciones que aceleran su respuesta. Comparte con Pro la ventana 1 millón de tokens y es capaz de interpretar audio, fotos, vídeos o texto. Está diseñada para trabajar en asistentes virtuales, chatbots y sistemas de moderación de contenido en redes sociales.