Hasta ahora había un clarísimo dominador en materia de inteligencia artificial. El modelo de lenguaje GPT-4 de OpenAI, que generó una gigantesca explosión en 2023, hizo que las grandes tecnológicas dirijan su esfuerzo -y las inversiones-para ponerse a la altura. Google lanzó Bard, su IA conversacional que imita el estilo de GPT, y en un principio, aunque sus resultados fueron buenos, no estaban ni de cerca a la altura de ChatGPT.
Con el paso del tiempo, la compañía detrás del buscador de internet se involucró de lleno en el tema y logró crear modelos de lenguaje cada vez más complejos.
Esto se terminó de desvelar con el lanzamiento de Gemini y ahora quedó demostrado como el verdadero ganador. Al menos después de superar a la versión base de GPT-4 y se haya alzado en los primeros puestos de los rankings de rendimiento como una de las IA más potentes que existen en la actualidad.
El rendimiento de las IA: la lucha por el primer puesto
(Foto: EFE)Actualmente, OpenAI lidera el sector de inteligencia artificial para consumidores con ChatGPT a la vanguardia, potenciado por GPT-4. Esta tecnología en la que Microsoft invirtió 10 mil millones de dólares, la utilizó para potenciar a Copilot y complementarse con DALL-E 3 como generador de imágenes.
Sin embargo, Google no está dispuesto a quedarse atrás, y sus movimientos recientes demuestran que pretende ser bastante exitoso en esta carrera por el predominio de la IA.
Una de las primeras iniciativas de Google fue la presentación de Bard, una inteligencia artificial diseñada para cambiar por completo la forma en que buscamos. Sin embargo, no cumplió completamente las expectativas debido a diversas deficiencias y a una fuerte competencia.
Para corregir estas deficiencias, el creador del lanzó recientemente sus nuevos modelos de inteligencia artificial llamados Gemini Nano, Gemini Pro y Gemini Ultra, con mejoras significativas sobre su modelo anterior y que, a primera vista, han obtenido una gran ventaja. Esto se refleja en la plataforma lmsys.org, que clasifica los modelos de inteligencia artificial según su rendimiento.
Google Bard tiene versiones tanto en computadoras como celulares. Foto: BloombergEn particular, Google Bard con Gemini Pro se encuentra actualmente en la segunda posición en el ranking de IAs más potentes, solamente superado por GPT-4 Turbo, la IA más poderosa del mercado.
Esto se puede ver en el ranking de IAs de LMSYS, y aunque no es exacto, ya que muchos preferirán una u otra IA dependiendo de para qué la usen, está claro que ofrece una visión bastante interesante de cuáles son las empresas que más están despuntando en los últimos tiempos en el desarrollo de los chatbots más inteligentes.
Sin embargo, esta carrera podría dar un giro. El éxito de Gemini Pro solo intensifica la curiosidad sobre Gemini Ultra, que aún no fue presentado y es el modelo más potente de la empresa. Además, la atención también se centra en GPT-5 de OpenAI, con resultados muy esperados. Esto genera una auténtica carrera para ver quién lanzará primero su nueva IA.
Los expertos advierten que si OpenAI no introduce rápidamente un nuevo modelo, corre el riesgo de perder la ventaja que tiene actualmente.
Es crucial tener en cuenta que, además de Google, Meta también está desarrollando su propio modelo con el potencial de superar a GPT-4. Por lo tanto, esta competencia finalmente resultará en que los usuarios tengan mejores herramientas para su uso a diario.
Cada vez hay más empresas tratando de lograr la hegemonía de la IA, algo que parece que cada vez es más complicado. Sin embargo, se empiezan a perfilar un tipo concreto de marca clara detrás de los modelos de lenguaje más potentes: una IA potente, de código propietario, con un datashet gigantesco y que posiblemente haya vulnerado los derechos de autor para aprender.
Así, aunque hay modelos de código abierto, como es el caso de LLaMA 2 de Meta, nos encontramos con que los procesos de entrenamiento de la IA suelen ser bastante opacos y nos ofrecen un nivel bastante cuestionable de garantías a la hora de saber cómo y en qué sentido han sido entrenados. Esto hace que, inevitablemente, las IA enfrenten sesgos y problemas en su propia estructura.
En cualquier caso, se puede extraer claramente que el modelo de lenguaje Gemini Pro de Google consiguió hacer que su IA alcance el potencial necesario dentro de este mercado.
Lo nuevo de Bard: creación de imágenes, validación de datos y más
Google Bard recibió una importante actualización.La reciente actualización de la IA de Google, que anunció el jueves, permite que sus usuarios puedan crear imágenes fotorrealistas de alta calidad en base a simples indicaciones escritas y hacer realidad cualquier idea.
Además, presentaron nuevas actualizaciones para mejorar la capacidad de la herramienta: desde corroborar respuestas arrojadas en conversaciones y la disponibilidad de Gemini Pro en todos los idiomas.
La capacidad de crear imágenes, como sus rivales Midjurney o Dall-E, surge de la integración de la tecnología de procesamiento de texto a imagen más avanzada de la compañía “Imagen 2”, que permite a todas las personas repensar la forma de hacer las cosas y recibir ayuda creativa con Bard. Por el momento, estará disponible en inglés en la mayoría de los países y territorios donde ya funciona la herramienta.
Para ayudar a todas las personas a diferenciar las imágenes originales de las generadas con Inteligencia Artificial, Bard emplea SynthID, una herramienta desarrollada por Google DeepMind, que agrega una marca de agua imperceptible directamente en los píxeles de las nuevas imágenes.
Las imágenes de alta calidad que puede generar Bard, la IA de Google.A su vez, presentó la nueva función “Doble verificación” para corroborar todas las respuestas que Bard ofrezca, que estará disponible en más de 40 idiomas y 230 países y territorios.
Al iniciar una conversación, debajo de la respuesta aparecerá el ícono “G” que permitirá Buscar en Google las respuestas generadas por Bard y profundizar en esa información, así como identificar distintas fuentes que validen dichos datos. También se podrá hacer clic en frases resaltadas para obtener información que respalde o contradiga lo que responde.
SL