El lanzamiento de nuevos modelos de inteligencia artificial de la startup china DeepSeek , que dice están a la par o son mejores que los líderes del sector en Estados Unidos y a una fracción de su costo, amenaza con alterar el orden mundial de la tecnología.
La empresa ha atraído la atención en los círculos mundiales de la IA después de escribir en un artículo el mes pasado que el entrenamiento de DeepSeek-V3 requirió menos de 6 millones de dólares de potencia de cálculo de los chips Nvidia H800.
El asistente de IA de DeepSeek, basado en DeepSeek-V3, ha superado a su rival ChatGPT y se ha convertido en la aplicación gratuita mejor valorada de la App Store de Apple en Estados Unidos.
Este contenido se hizo gracias al apoyo de la comunidad de El Destape. Sumate. Sigamos haciendo historia.
Lo ocurrido ha suscitado dudas sobre el razonamiento que subyace a la decisión de algunas empresas tecnológicas estadounidenses de destinar miles de millones de dólares a inversiones en IA, y las acciones de varias, incluida Nvidia, se han visto afectadas.
A continuación, algunos datos sobre la empresa que está sacudiendo el sector de la IA en todo el mundo.
¿POR QUÉ DEEPSEEK ESTÁ CAUSANDO REVUELO?
El lanzamiento de ChatGPT de OpenAI a finales de 2022 provocó un revuelo entre las empresas tecnológicas chinas, que se apresuraron a crear sus propios chatbots basados en inteligencia artificial.
Sin embargo, tras el lanzamiento del primer equivalente chino de ChatGPT, creado por el gigante de los motores de búsqueda Baidu, hubo una decepción generalizada en China por la diferencia de capacidades de IA entre las empresas estadounidenses y chinas.
La calidad y la rentabilidad de los modelos de DeepSeek han cambiado la narrativa. DeepSeek-V3 y DeepSeek-R1, los dos modelos que han sido objeto de elogios por parte de ejecutivos de Silicon Valley e ingenieros de empresas tecnológicas estadounidenses, están a la altura de los más avanzados de OpenAI y Meta, según la empresa china.
Además, son más baratos. El DeepSeek-R1, lanzado la semana pasada, es entre 20 y 50 veces más barato de usar que el modelo o1 de OpenAI, dependiendo de la tarea, según un post en la cuenta oficial de WeChat de DeepSeek.
No obstante, algunos han expresado públicamente su escepticismo sobre el éxito de DeepSeek.
El presidente ejecutivo de Scale AI, Alexandr Wang, dijo el jueves durante una entrevista con la CNBC, sin aportar pruebas, que DeepSeek cuenta con 50.000 chips Nvidia H100, que, según dijo, no se revelarían porque violarían los controles de exportación de Washington, que prohíben vender chips de IA tan avanzados a empresas chinas.
DeepSeek no respondió inmediatamente a una solicitud de comentarios sobre la acusación.
Los analistas de Bernstein destacaron el lunes en una nota de investigación que se desconocían los costos totales de formación de DeepSeek para su modelo V3, pero que eran mucho más elevados que los 5,58 millones de dólares que la startup dijo haber empleado en potencia de cálculo.
Agregaron que no se habían revelado los costos de formación del modelo R1, igualmente aclamado.
¿QUIÉN ESTÁ DETRÁS DE DEEPSEEK?
DeepSeek es una startup con sede en Hangzhou cuyo accionista mayoritario es Liang Wenfeng, cofundador del fondo de cobertura cuantitativa High-Flyer, según los registros corporativos chinos.
El fondo de Liang anunció en marzo de 2023 en su cuenta oficial de WeChat que estaba "empezando de nuevo", yendo más allá del comercio para concentrar recursos en la creación de un "grupo de investigación nuevo e independiente, para explorar la esencia de la AGI (Inteligencia General Artificial)". DeepSeek se creó ese mismo año.
Los creadores de ChatGPT OpenAI definen la AGI como sistemas autónomos que superan a los humanos en la mayoría de las tareas económicamente valiosas.
No está claro cuánto ha invertido High-Flyer en DeepSeek, que tiene oficinas en el mismo edificio. La empresa es también propietaria de patentes relacionadas con clusters de chips usados para entrenar modelos de IA, según los registros corporativos chinos.
La unidad de IA de High-Flyer dijo en su cuenta oficial de WeChat en julio de 2022 que posee y opera un clúster de 10.000 chips A100.
¿QUÉ OPINA PEKÍN DE DEEPSEEK?
El éxito de DeepSeek ya se ha dejado notar en los altos círculos políticos chinos. El 20 de enero, día en que DeepSeek-R1 se hizo público, su fundador, Liang, asistió a un simposio a puerta cerrada para empresarios y expertos organizado por el primer ministro chino, Li Qiang, según la agencia estatal de noticias Xinhua.
La presencia de Liang en la reunión es potencialmente una señal de que el éxito de DeepSeek podría ser importante para el objetivo político de Pekín de superar los controles de exportación de Washington y lograr la autosuficiencia en industrias estratégicas como la IA.
A un simposio similar celebrado el año pasado asistió el presidente ejecutivo de Baidu, Robin Li.
Con información de Reuters