En el episodio de hoy de Un podcast ninja sobre Big Data hablamos de OpenAI, la empresa detrás de ChatGPT, GPT-3, DALL·E2 y todos estos modelos tan chulos.
OpenAI nació en San Francisco en diciembre del año 2015.
La idea inicial es que fuera una organización sin ánimo de lucro con el objetivo de hacer progresar el campo de la Inteligencia Artificial de una manera segura y beneficiosa para la humanidad.
Todo esto surge de una cena de verano de 2015 organizada por Sam Altman, que por aquel entonces era el CEO de una incubadora de startups, Y Combinator.
También estaba Elon Musk y Greg Brockman, CTO de Stripe y otras gentes notables que también se dedicaban a invertir entre otras cosas.
Entre los primeros inversores de OpenAI estaban:
Algunos de los asistentes a la cena tenían experiencia en Inteliegencia Artificial y otros menos pero todos ellos creían en que la Inteligencia Artificial General o Fuerte es posible y estaban preocupados de que cayera en malas manos.
Además por aquel entonces Google acababa de comprar DeepMind y claro había riesgo de monopolio si conseguían que aquello despegara.
Así que salieron de aquella cena con el objetivo de crear una organización que fuera capaz de impedir este monopolio.
Además al ser una organización sin ánimo de lucro, al contrario que Google, podrían centrarse en democratizar los beneficios de modelos avanzados de Machine Learning.
Y al ser una organización sin ánimo de lucro pues podrían publicar todos sus trabajos de investigación, liberar sus soluciones y ser transparentes.
De ahí su nombre: OpenAI
Así que estas personas en diciembre de 2015 consiguieron recaudar mil millones de dólares para fundar OpenAI y se fueron a buscar talento para su empresa.
De hecho, Greg Brockman se cogió un cuadernito, llamó a Yoshua Bengio, uno de los padres del Deep Learning, y los dos hicieron una lista de los mejores investigadores en el campo del Machine Learning.
Después se fue a llamar a sus puertas.
De ahí salieron los primeros 9 empleados de OpenAI.
Obviamente, al ser una organización sin ánimo de lucro no podía ofrecer los sueldos que ofrecían en Google o en Facebook donde también se hace mucho Machine Learning peeero al ya tener grandes nombres y una misión puramente enfocada en la propia investigación más allá de los objetivos de beneficios económicos pues esto hacía que fueran capaces de atraer mucho talento sin tener la capacidad de ofrecer sueldos altísimos.
Lo que pasa es que lo que sí tenían que pagar sí o sí era la capacidad de cómputo que usaban para entrenar sus modelos que iban desarrollando. En 2017 llegaban a gastar un cuarto de todo su presupuesto operacional sólo en pagar a los proveedores de computación en la nube, casi 8 millones de dólares.
Y aún les costaba atraer talento y necesitaban más capacidad de computación.
Así que en 2019, pasaron de ser una organización sin ánimo de lucro a una empresa de las de toda la vida, de las que ganan dinero con la salvedad de que el beneficio estaría capado a 100 veces la inversión.
O más bien pasaron de ser una organización sin ánimo de lucro a desdoblarse en dos:
OpenAI se transformaba en una empresa normal para poder atraer inversión y talento y así poder competir con grandes como Google o Meta.
Y en cuanto abrieron las puertas a la inversión apareció Microsoft con mil millones de dólares.
En esa época, en Microsoft estaban un poco desesperados por demostrar que su empresa podía jugar con los mayores a eso de la Inteligencia Artificial.
La cuestión es que no conseguían que investigadores potentes fueran a trabajar para ellos pero lo que sí que estaban haciendo era invertir en capacidad de computación: La nube de Azure.
Justo lo que OpenAI necesitaba: poder de computación para sus modelos de lenguaje.
Esto era julio de 2019.
A partir de ahí, en 2020 OpenAI anunció GPT-3, un modelo del lenguaje que es capaz de generar texto a partir de otro texto. El predecesor de ChatGPT.
Y además desarrolló una API para que la gente pudiera integrar GPT-3 en sus propias aplicaciones, lo que sería el primer producto comercial de OpenAI.
En 2021, OpenAI presentó DALL·E, un modelo de aprendizaje profundo que genera imágenes digitales a partir de descripciones en lenguaje natural y al cual mejoró mucho en abril de 2022 con su versión DALL·E2, que ya dio el salto al público general.
Y en diciembre de 2022 OpenAI ya lo petó con ChatGPT, que es un chatbot basado en GPT-3.5 y que ofrecieron en una beta abierta y gratuita a todo el mundo que se quisiera registrar.
ChatGPT superó el millón de usuarios 5 días después de su lanzamiento y llegó incluso a las portadas de periódicos y telediarios.
Visto el éxito, en enero de 2023 Microsoft anunció una nueva inversión repartida en varios años de, se comenta, 10000 millones de dólares en OpenAI.
Con esta nueva inversión, después de que los primeros inversores de OpenAI recuperen su capital inicial, Microsoft tendrá derecho al 75% de las ganancias de OpenAI hasta que recupere los $13 mil millones que ha invertido.
Después, la participación de Microsoft se reducirá al 49%, hasta que obtenga unas ganancia de $92 mil millones.
Mientras tanto, los otros inversores de capital riesgo y los empleados de OpenAI también tendrán derecho al 49% de las ganancias de OpenAI hasta que ganen unos $150 mil millones.
Si se alcanzan estos límites, lo que sobre iría a la parte sin ánimo de lucro de OpenAI.
Esos tiempos podrían alargarse bastante porque OpenAI tiene ingresos bastante modestos y gastos bastante elevados, de nuevo volvemos a todo lo que gasta en capacidad de computación en la nube para entrenar sus modelos.
El año pasado, se suponía que iban a generar poco menos de $30 millones en ingresos y que iban a gastar $416,45 millones en computación y datos y casi $90 millones en personal.
Además, mientras ChatGPT sea gratis las pérdidas pueden ir a más ya que el mismo Altman decía que cada consulta de usuarios a ChatGPT le estaba costando a OpenAI algunos centavos.
Pero recordad que en solo 5 días ya había un millón de usuarios haciendo consultas a chatgpt, así que imaginad.
Aunque Microsoft tarde algún tiempo en recuperar su inversión no creo que les importe mucho porque ya ha integrado un montón de productos de OpenAI en su nube Azure, incluyendo GPT y DALL·E.
También ha integrado un generador de imágenes basado en DALL·E en su buscador Bing y pretende integrar además a ChatGPT.
Por si no fuera poco, al estar asociado con OpenAI, que está ahora en auge de popularidad están mejorando su imagen de marca.
Lo que pasa es que con el cambio de modelo y la entrada tan fuerte de Microsoft se comenta que las prioridades de la startup están cambiando un poco.
Antes tocaban un poco todas las ramas de investigación dentro del Machine Learning y la Inteligencia Artificial y ahora se están centrando principalmente en el procesamiento del lenguaje natural.
Hay gente que dice que al tener estos modelos aplicaciones comerciales inmediatas a Microsoft, que es quien ha puesto los dólares, le interesan más.
También hay gente que piensa que ha pasado de ser una organización sin ánimo de lucro a una simple herramienta de una empresa tecnológica como Microsoft y que el enfoque ha derivado de responder preguntas sobre la Inteligencia Artificial General a crear productos que Microsoft pueda vender.
OpenAI es mucho menos abierta que en sus orígenes aunque sigue siendo más transparente que sus competidores, Google en particular.
Ya había dejado de publicar toda su investigación y abrir su código antes de la llegada de Microsoft, por si la tecnología no se utilizaba bien. Pero además, al hacer que sus modelos estén disponibles sólo a través de las API pueden rentabilizar en parte su trabajo.
Así que algo de intereses comerciales también puede ser que haya.
Estos cambios de estrategia respecto a sus inicios han hecho que algunos de los investigadores que llegaron a OpenAI atraidos por la idea tras su concepción, ser una organización sin ánimo de lucro enfocada en avanzar en el campo de la IA para beneficiar a toda la humanidad y alejada de las restricciones de tener que responder ante inversores, hayan decidido dejar la empresa.
Espero que os guste el episodio.
Si es así, no olvidéis dejar un «Me gusta» y algún comentario al episodio en Ivoox o una valoración de 5 estrellas del podcast en Apple podcasts, en Spotify, en Google podcasts o donde quiera que escuchéis el podcast.
Recordad que si tenéis cualquier duda o pregunta podéis contactar conmigo a través del formulario de contacto o podemos seguir la conversación en Twitter.
Muchas gracias por estar ahí y os espero en el próximo episodio de Un Podcast Ninja sobre Big Data.