Las empresas estadounidenses de IA buscan refutar afirmaciones de DeepSeek

28 de enero, 2025 | 10.00

SAN FRANCISCO, 28 ene - Los desarrolladores de las principales empresas estadounidenses de IA alaban los modelos de IA de DeepSeek, al tiempo que tratan de rebatir la idea de que su tecnología, valorada en miles de millones de dólares, ha sido superada por la alternativa de bajo costo de un recién llegado chino.

El lunes, la empresa emergente china DeepSeek causó una ola de venta de acciones y su asistente de inteligencia artificial gratuito superó a ChatGPT, de OpenAI, en la App Store de Apple en Estados Unidos, gracias a un modelo que dijo haber entrenado en los procesadores H800 de Nvidia, de menor capacidad, con un costo inferior a 6 millones de dólares.

Mientras la preocupación por la competencia resonaba en el mercado bursátil estadounidense, algunos expertos en IA aplaudieron el sólido equipo y la investigación actualizada de DeepSeek, pero se mantuvieron imperturbables por su aparición, dijeron personas familiarizadas con el pensamiento de cuatro de los principales laboratorios de IA, que declinaron ser identificadas por no estar autorizadas a hablar en privado.

Este contenido se hizo gracias al apoyo de la comunidad de El Destape. Sumate. Sigamos haciendo historia.

SUSCRIBITE A EL DESTAPE

El CEO de OpenAI, Sam Altman, escribió en X que R1, uno de los varios modelos que DeepSeek lanzó en las últimas semanas, "es un modelo impresionante, sobre todo por lo que son capaces de ofrecer por el precio". Nvidia dijo en un comunicado que el logro de DeepSeek demostraba la necesidad de más de sus chips.

El desarrollador de software Snowflake decidió el lunes añadir los modelos de DeepSeek a su mercado de modelos de IA tras recibir una avalancha de consultas de clientes.

Aunque sus empleados también calificaron los modelos de DeepSeek de "asombrosos", el vendedor de software estadounidense sopesó los posibles riesgos de alojar tecnología de IA desarrollada en China antes de decidirse finalmente a ofrecerla a sus clientes, explicó Christian Kleinerman, vicepresidente ejecutivo de producto de Snowflake.

"Decidimos que mientras seamos claros con los clientes, no vemos ningún problema en apoyarla", afirmó.

En tanto, los desarrolladores estadounidenses de IA se apresuran a analizar el modelo V3 de DeepSeek. En diciembre, DeepSeek publicó un documento de investigación que acompaña al modelo, base de su popular aplicación, pero en él no se responde a muchas preguntas, como los costos totales de desarrollo.

China ha pasado de 18 a seis meses de retraso con respecto a los modelos de IA más avanzados desarrollados en Estados Unidos, según una persona. Sin embargo, la estrategia de lanzamiento gratuito de DeepSeek ha despertado tanto interés que la empresa podría quedarse pronto sin chips suficientes para satisfacer la demanda, predijo esta persona.

Los avances de DeepSeek no se deben únicamente a un presupuesto de 6 millones de dólares, una suma ínfima comparada con los 250.000 millones de dólares que los analistas calculan que las grandes empresas estadounidenses de la nube gastarán este año en infraestructura de IA. El documento de investigación señalaba que este costo se refería específicamente al uso de chips en su prueba de entrenamiento final, no al costo total del desarrollo.

El proceso de entrenamiento es la punta del iceberg en términos de costo total, dijeron a Reuters ejecutivos de dos de los principales laboratorios. El costo de determinar cómo diseñar ese ciclo de entrenamiento puede ser muchísimo mayor.

El documento afirmaba que la ejecución de entrenamiento para la V3 se llevó a cabo utilizando 2.048 de los chips H800 de Nvidia, que se diseñaron para cumplir los controles de exportación de Estados Unidos publicados en 2022, unas normas que, según dijeron los expertos a Reuters, apenas ralentizarían el progreso de la IA de China.

Fuentes de dos laboratorios de IA dijeron que esperaban que las primeras etapas de desarrollo se hubieran basado en una cantidad mucho mayor de chips. Una de las personas dijo que tal inversión podría haber costado más de 1.000 millones de dólares.

Algunos líderes estadounidenses de IA elogiaron la decisión de DeepSeek de lanzar sus modelos como código abierto, lo que significa que otras empresas o particulares son libres de utilizarlos o modificarlos.

"DeepSeek R1 es uno de los avances más asombrosos e impresionantes que he visto nunca y, como código abierto, un profundo regalo para el mundo", afirmó el domingo el inversor de capital riesgo Marc Andreessen en una publicación en X.

El reconocimiento de los modelos de DeepSeek subraya la viabilidad de la tecnología de IA de código abierto como alternativa a tecnologías costosas y estrictamente controladas como ChatGPT de OpenAI, según los observadores del sector.

Las empresas más valiosas de Wall Street se han disparado en los últimos años ante la expectativa de que sólo ellas tuvieran acceso al enorme capital y la potencia informática necesarios para desarrollar y ampliar la tecnología de IA emergente. Estas suposiciones se someterán a un nuevo escrutinio esta semana y la siguiente, cuando muchos gigantes tecnológicos estadounidenses presenten sus resultados trimestrales.

Con información de Reuters