Entrada

Vender granos de café a Starbucks – cómo la explosión de la IA podría dejar atrás a las mayores empresas de IA

Dos tazas de café blancas en una mesa con rayas naranjas bajo luz solar directa. Vista de arriba con sombra.

Dos tazas de café blancas en una mesa con rayas naranjas bajo luz solar directa. Vista de arriba con sombra.

¿Cuánto importan los modelos de fundación?

Podría parecer una pregunta tonta, pero ha surgido mucho en mis conversaciones con startups de AI, que cada vez están más cómodas con negocios que antes se consideraban como “envoltorios de GPT” o empresas que construyen interfaces sobre modelos de AI existentes como ChatGPT. Ahora, los equipos de startups se centran en personalizar modelos de AI para tareas específicas y en el trabajo de interfaz, y ven el modelo de fundación como un commodity que se puede cambiar según sea necesario. Esta actitud se hizo evidente especialmente en la conferencia Boxworks del año pasado, que parecía estar dedicada por completo al software de usuario final construido sobre modelos de AI.

Una parte de lo que está impulsando esto es que los beneficios de escalado de la pre-entrenamiento — ese proceso inicial de enseñar modelos de AI con grandes conjuntos de datos, que es el dominio exclusivo de los modelos de fundación — ha disminuido. No significa que AI haya dejado de progresar, pero los primeros beneficios de los modelos de fundación a gran escala han alcanzado un punto de disminución de rendimientos, y la atención se ha centrado en el post-entrenamiento y el aprendizaje por refuerzo como fuentes de progreso futuro. Si quieres hacer una mejor herramienta de codificación de AI, es mejor trabajar en el afinamiento y el diseño de la interfaz en lugar de gastar más de unos pocos miles de millones de dólares en tiempo de servidor para la pre-entrenamiento. Como muestra el éxito de Claude Code de Anthropic, las empresas de modelos de fundación son muy buenas en estos otros campos, pero no es una ventaja tan duradera como antes.

En resumen, el paisaje competitivo de AI está cambiando de maneras que socavan las ventajas de los mayores laboratorios de AI. En lugar de una carrera por una AGI todopoderosa que pueda igualar o superar las capacidades humanas en todas las tareas cognitivas, el futuro inmediato parece ser un frenesí de negocios discretos: desarrollo de software, gestión de datos empresariales, generación de imágenes y así sucesivamente. Excepto por una ventaja de primer movimiento, no está claro que construir un modelo de fundación te dé alguna ventaja en esos negocios. Peor aún, la abundancia de alternativas de código abierto significa que los modelos de fundación pueden no tener ninguna ventaja de precio si pierden la competencia en la capa de aplicación. Esto convertiría a empresas como OpenAI y Anthropic en proveedores de backend en un negocio de bajo margen – como dijo un fundador, “como vender granos de café a Starbucks”.

Es difícil exagerar cuánto cambiaría esto para el negocio de AI. Durante el auge contemporáneo, el éxito de AI ha estado inextricablemente ligado al éxito de las empresas que construyen modelos de fundación — específicamente, OpenAI, Anthropic y Google. Ser optimista con AI significaba creer que el impacto transformador de AI convertiría a estas empresas en importantes generacionalmente. Podríamos discutir cuál empresa saldría adelante, pero estaba claro que alguna empresa de modelo de fundación acabaría teniendo las llaves del reino.

En ese momento, había muchas razones para pensar que esto era cierto. Durante años, el desarrollo de modelos de fundación fue el único negocio de AI — y el ritmo de progreso hacía que su liderazgo pareciera insuperable. Y Silicon Valley siempre ha tenido una profunda admiración por la ventaja de la plataforma. La suposición era que, independientemente de cómo los modelos de AI acabaran haciendo dinero, la mayor parte del beneficio volvería a las empresas de modelos de fundación, que habían hecho el trabajo más difícil de replicar.

El último año ha complicado esa historia. Hay muchos servicios de AI de terceros exitosos, pero tienden a usar modelos de fundación de manera intercambiable. Para las startups, ya no importa si su producto se basa en GPT-5, Claude o Gemini, y esperan poder cambiar de modelo en medio de un lanzamiento sin que los usuarios noten la diferencia. Los modelos de fundación siguen haciendo progresos reales, pero ya no parece plausible que ninguna empresa pueda mantener una ventaja lo suficientemente grande como para dominar la industria.

Ya tenemos suficientes indicios de que no hay una ventaja de primer movimiento. Como señaló el inversor Martin Casado de a16z en un podcast reciente, OpenAI fue el primer laboratorio en lanzar un modelo de codificación, así como modelos generativos para imágenes y video — solo para perder en todas las categorías a competidores. “Como podemos ver, no hay una ventaja intrínseca en la pila tecnológica de AI”, concluyó Casado.

Por supuesto, no deberíamos descartar a las empresas de modelos de fundación tan pronto. Todavía tienen muchas ventajas duraderas, como reconocimiento de marca, infraestructura y reservas de efectivo desmesuradas. El negocio de consumo de OpenAI podría resultar más difícil de replicar que su negocio de codificación, y otras ventajas podrían emerger a medida que el sector madure. Dado el ritmo rápido del desarrollo de AI, el interés actual en el post-entrenamiento podría revertirse en los próximos seis meses. Lo más incierto de todo es que la carrera hacia la inteligencia general podría pagar con nuevos avances en farmacología o ciencia de materiales, cambiando radicalmente nuestras ideas sobre lo que hace valiosos a los modelos de AI.

Pero, de momento, la estrategia de construir modelos de fundación cada vez más grandes parece mucho menos atractiva que antes — y el gasto millonario de Meta en gastos parece cada vez más arriesgado.

Esta entrada está licenciada bajo CC BY 4.0 por el autor.