GTP-4o muestra una capacidad de interactuar como una persona real, hablando por un micrófono y leyendo imágenes en tiempo real. Lo nuevo de OpenAI.
***
OpenAI lanzó su nuevo modelo de IA: GPT-4o
Puede hablar, captar imágenes y texto desde un dispositivo móvil
La experiencia es casi como interactuar con una persona real
OpenAI acaba de presentar su nuevo modelo de inteligencia artificial (IA) generativa llamado GPT-4o.
La directora técnico de OpenAI, Muri Murati, introdujo a una audiencia el modelo durante el evento Spring Update, que se está transmitiendo en vivo en este momento por YouTube.
Murati explicó que GPT-4o proporciona una inteligencia “del nivel de GPT-4″, pero con mejoras notables, ya que el nuevo modelo cuenta con capacidades de voz, texto y visión. Estas capacidades presentan una experiencia de usuario renovada que colocan al alcance de la mano de cualquier persona un asistente integral de IA con habla desde un smartphone.
See you soon: https://t.co/yM7TCDoQpF pic.twitter.com/jWDQSXJwQe
— OpenAI (@OpenAI) May 13, 2024
El modelo anterior, GPT-4, se entrenaba combinando imágenes y texto, y podía analizar imágenes y texto para realizar tareas como extraer texto a partir de imágenes o incluso describir el contenido de esas imágenes. Ahora finalmente todo está integrado.
Durante la demostración en vivo, el equipo de la compañía logró mostrar cómo se puede interactuar con el sistema hablando y dando instrucciones directamente al micrófono de un dispositivo móvil.
GPT-4o se ha mostrado capaz de responder rápidamente a las instrucciones humanas haciendo tareas diversas como brindar consejos sobre manejo de nervios, resolver ecuaciones matemáticas desde un escrito en papel, contar un cuento con diferentes tonos y voces, traducir conversaciones en otros idiomas en tiempo real.
También ha sido capaz de leer emociones faciales de un humano desde la cámara de un celular y muchas otras cosas más durante la demostración de este lunes.
En general, las pruebas del nuevo modelo de IA lanzado por OpenAI dan la impresión de estar interactuando con una persona real, y recuerdan a la asistente de IA Samantha en la cinta de ficción “Her” (2013) del director Spike Jonze.
“Sabemos que estos modelos son cada vez más complejos, pero queremos que la experiencia de interacción sea más natural y sencilla, y que el usuario no se centre en la interfaz de usuario, sino en la colaboración con las GPT“, comentó Muri en el evento, según citó TechCrunch.
Entre los anuncios que se han realizado, OpenAI anunció el lanzamiento de una versión de escritorio de ChatGPT y una interfaz de programación de aplicaciones (API) renovada que promete ser más rápida y 50% más económica que GPT-4.
El equipo GPT-4o estará disponible de forma gratuita para los usuarios.
Artículo de Hannah Estefanía Pérez / DiarioBitcoin
Imagen de Unsplash
DiarioBitcoin