#21 ChatGPT4o, batalla para la dominación de la IA
Impulsando Negocios, Potenciando Personas
Se desata la batalla para el dominio de la IA Generativa. Esta semana empezamos con la presentación por parte de OpenAI de su nueva solución, ChatGPT4o. Se trata de una nueva versión evolucionada de su chatbot que lo convierte en multimodal, es decir, es capaz de trabajar con voz, video y audio sin necesidad de tenerlo que convertirlo a otro formato para utilizarlo (la mayoría de las soluciones de IA Generativa convierte la imagen en texto para poder interpretarla, por ejemplo). Junto a esto, la nueva solución ha mejorado en velocidad (duplicándola) y haciéndolo mucho más eficiente en el consumo de datos (y por lo tanto reduciendo el coste).

Pocas horas después, Google iniciaba su evento anual, Google I/O 2024, en el que presentaba su nueva versión de Gemini así como otras iniciativas con las que está trabajando. Para la nueva versión de Gemini, Google utiliza una de sus ventajas competitivas, son los que más datos tienen y con esto mejoran sobre manera el entreno al que someten a su solución. Junto a esto, Google presentó su proyecto ASTRA, un asistente por Inteligencia Artificial que se relaciona de forma multimodal con el mundo a través de interpretar lo que visualiza a través de una cámara.
No te pierdas en este vídeo la demo que han lanzado desde Google para Astra.
3 cosas me han llamado la atención de esta vorágine de novedades:
1) Incapacidad para estar al día (efecto Wow)
Diariamente constato que estamos en pleno tsunami, con presentaciones de novedades, noticas sobre avances increíbles, nombres imposibles de recordar acerca de nuevas aplicaciones, LLM’s o versiones. En mi caso me dedico profesionalmente a ello, me apasiona y me siento retado constantemente por las oportunidades que puedo imaginar (tanto que he decidido casi a los 50 realizar mi doctorado sobre este tema); pero reconozco mi dificultad por seguirlo todo, por poder conectar todos los puntos, incluso para comprender tu verdadero significado o impacto.
Decía en un artículo anterior (después de leer un artículo de Esteve Amirall) que las tecnologías no las incorporamos en nuestro día a día en función de su velocidad de desarrollo, sino a partir de la capacidad humana para entenderlas. Y creo que aquí está la clave.
Uno de los esfuerzos de Open AI en su última presentación ha sido presentarnos casos de uso que podemos (en su mayoría) incorporar a nuestro día a día y que, sobre todo, ya son reales y no promesas de cosas que pueden pasar en el futuro. Y quizás no entendamos la innovación tecnológica que suponen, pero quizás si podemos encontrar utilidad en nuestro día a día.
Hemos visto cómo usar la nueva versión de ChatGPT para poder hacer traducciones en tiempo real (no se olviden el teléfono en su próximo viaje al extranjero) o como pedirle que nos explique cómo si fuera un profesor la resolución de un ejercicio de matemáticas. Incluso hemos llegado a cosas más mundanas a la vez que útiles.
El trozo de pastel que quedaba en casa fue fotografiado, subido a la app de chatGPT y cuestionado acerca de que producto era y cuál era la receta para hacerlo. Sólo me falta el enlace a la compra de los ingredientes.
Separa el efecto wow de las utilidades reales y comprender en que puede aportarnos valor, más allá del nombre y versión es el auténtico reto.
2) Profesional aumentado
Un segundo elemento de reflexión tiene que ver con mi obsesión por el concepto de profesional aumentado, es decir, con entender que el auténtico valor de la IA generativa en entornos profesionales se produce cuando la usamos para algo sobre lo que tenemos conocimiento previo.
Uso como ejemplo la funcionalidad de traducción simultánea que presenta GPT4o a la que han seguido múltiples artículos que ya hacen desaparecer la función del traductor. ¿seguro? Si algo hemos entendido es que una cosa es traducir de forma adecuada y la otra es entender el contexto donde esa traducción se produce y los matices que eso incorpora. Si pensáis, por ejemplo, en una negociación multilateral entre delegaciones de varios países, muchas veces el reto no es el idioma sino que el reto tiene que ver con entender el contexto cultural, el significado más allá de las palabras y la intención o tono de las palabras.
Las nuevas soluciones seguramente traducen las palabras mejor que un humano, mi duda es si saben incorporar el contexto y los matices.
3) Búsqueda de nuevos modelos de negocio
Dejo para el final el tema que más me ha hecho pensar esta semana, ¿Qué modelo de negocio hay detrás de las innovaciones que estamos viendo en IA generativa?
Hasta la fecha, y para simplificar mucho, visualizo tres modelos:
Freemium: chatGPT o Gemini ofrecen un servicio gratuito y luego una versión de pago con mejores funcionalidades.
Integración: se desarrollan funcionalidades para ser integradas en dispositivos o productos de terceros (por ejemplo funcionalidades de Gemini para integrarse en servicios dentro de lo teléfonos Android) que generan un pago por parte del integrador.
Uso: todas estas soluciones disponen de una API que permite construir modelos que se conectan con el motor para usarlo y generar valor. Quien genera el servicio paga por el uso de la API o por el uso de los datos o procesos.
Pero el lanzamiento de GPT4o quiebra estos tres modelos. Se trata de funcionalidades nuevas que se están desplegando para todos los usuarios (sean o no de pago de ChatGPT) sin que tengan que pagar por ello. Y esto nos abre la puerta a un cuarto modelo, no usado hasta el momento, un modelo de plataforma. La lógica es que poner a disposición de todo el mundo estas funcionalidades busca incentivar la innovación en la creación de nuevos servicios por parte de terceras personas o empresa ajenas a Open AI (como ya hiciera hace unos meses con el tema de los GPT’s) así como el uso por parte de cualquier otro de estas soluciones.
Estamos ante la creación de un nuevo ecosistema donde OpenAI se coloca en el centro, genera oferta y demanda, y genera un modelo de ingresos por los dos lados del modelo.
Estamos, como cada semana, ante una nueva ola que amenaza de transformarlo todo, que nos obliga a estar casi 24x7 pendientes de lo que llega y se consolida… prometo intentar estar al tanto y traeros a esta publicación mi interpretación de los que tenemos ante nosotros.
Noticias:
Ya tenemos nuevos cargo, empiezan a desarrollarse los Chief Artificial Intelligence Officer.
Llega a Europa Anthropic, un nuevo competidor para ChatGPT, Copilot o Gemini, que promete más rapidez y menos errores. Además llega con la noticia de la contratación del Cofundador de Instagram como responsable de prodcuto.
Nile está desarrollando su propio modelo de IA para diseñar nuevos modelos de zapatillas.
Aplicaciones interesantes:
🙌 BlendAI: permite centralizar todos los modelos de IA que quieras utilziar en un único punto
Y, como siempre, Seguimos!
Hola Marc, genial el artículo! Y también ando por los 50 y tantos en mi caso, haciendo un doctorado pensando como la IAG viene a generar más profesionales exponenciales o humanos aumentados.
Gracias por compartir!
Intentar estar al día de todo lo que sale es como escuchar audios al 1'5x. Crees que estás escuchando, pero hay mucha info que se te está quedando por el camino ^_^