OpenAI presenta GPT-4o: es más rápido y soporta texto, video y audio.

OpenAI presenta GPT-4o: es más rápido y soporta texto, video y audio.
OpenAI, la empresa fundada por Sam Altman, ha llevado a cabo un evento esta tarde en el que hemos tenido la oportunidad de presenciar varias demostraciones de las últimas actualizaciones de ChatGPT y GPT-4. El momento más destacado fue la presentación de su nuevo modelo de lenguaje, GPT-4o, que es más rápido y tiene la capacidad de procesar texto, video y audio, lo que permitirá darle instrucciones mediante comandos de voz. Además, se ha confirmado la versión de ChatGPT para escritorio.

Así es GPT-4o, el nuevo modelo de lenguaje más avanzado de OpenAI

El innovador GPT-4o, la última versión del modelo de lenguaje de OpenAI, mantiene la inteligencia de GPT-4 y se destaca por su incremento en velocidad y sus avanzadas capacidades en procesamiento de texto, análisis de imagen y reconocimiento de audio. Este modelo integral, conocido como ‘Omnimodel’, debe su nombre a la inclusión de la letra ‘o’. Ofrece una velocidad duplicada, un límite de procesamiento cinco veces superior (para usuarios premium) en comparación con GPT-4 Turbo y reduce los costos a la mitad para acceder a más funcionalidades. Además, está disponible tanto para miembros gratuitos como de pago. La empresa lo promociona como un modelo más accesible y eficaz.

Uno de los aspectos más destacados presentados en el evento es la habilidad del GPT-4o para transformar las interacciones mediante su función de voz, proporcionando una voz conversacional en tiempo real con un rango dinámico extenso, lo que promete una experiencia comunicativa más fluida y natural para los usuarios. Este modelo iguala la eficiencia de GPT-4 Turbo en textos en inglés y presenta una mejora considerable en el manejo de textos en otros idiomas.

 

El GPT-4o es capaz de procesar entradas de audio en apenas 232 milisegundos, con un promedio de 320 milisegundos, cifra que se equipara al tiempo de reacción humana en diálogos cotidianos. Los usuarios tienen la posibilidad de interrumpir en medio de una respuesta para modificar el prompt inicial, sin experimentar retrasos. La comunicación con el GPT-4o se ha vuelto más ágil gracias a la notable disminución de la latencia entre servicios, y ahora soporta 50 idiomas.

Este servicio se ofrece de manera gratuita, permitiendo que cualquier persona pueda acceder a las extraordinarias funcionalidades del GPT-4o sin coste alguno. Integrando capacidades de voz, texto y visión en una única solución, el GPT-4o representa un avance significativo. Además, ChatGPT implementará una nueva característica denominada Memory para todos los usuarios, la cual le permitirá recordar interacciones previas con el usuario, haciendo que las tareas sean menos redundantes y más eficientes.

Demostración de GPT-4o y versión de escritorio de ChatGPT

Durante la demostración, se ha evaluado al nuevo modelo de lenguaje solicitándole la creación de un código de programación. Es notable que ahora ejecuta todas las tareas mediante comandos de voz, manteniendo la misma eficacia que el chatbot actual. Además, se le ha desafiado a narrar una historia variando los tonos, utilizando voz de robot y hasta cantando. El desempeño ha sido, sinceramente, sorprendente. Cabe mencionar que, en este diálogo, el chatbot procesa y responde todo oralmente, sin convertir nada a texto escrito.

También se le ha presentado una gráfica para su análisis, y ha ofrecido conclusiones basadas en lo observado en la imagen. Su habilidad para resolver problemas matemáticos también ha sido demostrada. Se podrá suministrar una fotografía o captura de pantalla para su evaluación. Continuando con las innovaciones, se ha anunciado la versión de escritorio de ChatGPT, lo que facilitará a los usuarios interactuar con la herramienta directamente desde su escritorio, sin necesidad de un navegador web.

Disponibilidad de GPT-4o

OpenAI ha anunciado el inicio del lanzamiento progresivo de GPT-4o, lo que significa que se irá habilitando para todos los usuarios en distintas fases. Respecto a las actualizaciones en el manejo de texto e imágenes, los usuarios de ChatGPT y ChatGPT Plus podrán disfrutar de estas funcionalidades desde el día de hoy. Además, GPT-4o no se limitará a estar presente en ChatGPT, sino que también estará integrado en la API.