Doble amenaza: DeepSeek desafía tanto a Silicon Valley como a Pekín
Detrás de la startup de IA no se encuentra una empresa estatal ni tampoco un centro de investigación del gobierno chino, sino Liang Wenfeng, un emprendedor independiente de 40 años
![Doble amenaza: DeepSeek desafía tanto a Silicon Valley como a Pekín](https://resizer.glanacion.com/resizer/v2/AC2NE7ZIBRFFRJT4WBBMVSF22I.jpg?auth=67727cc503a276020d0448d6a89e64cd54c90c02f0059be5764069d090d4b3cf&smart=true&width=2000&height=1333#)
Con el lanzamiento de su último modelo de inteligencia artificial (IA), DeepSeek, una empresa china poco conocida ha aniquilado varios años de políticas estadounidenses diseñadas para frenar la innovación china y, en el proceso, ha abierto un agujero en las valoraciones de empresas que van desde Nvidia, el campeón estadounidense de chips de IA, hasta Siemens Energy, un fabricante de equipos eléctricos utilizados en centros de datos. Al demostrar su capacidad para innovar a pesar de las restricciones de exportación de Estados Unidos, DeepSeek ha generado dudas sobre si el acceso a pilas de semiconductores de vanguardia y equipos relacionados es tan importante como se pensaba anteriormente para entrenar modelos de IA.
El hombre en el centro de todo esto es Liang Wenfeng, el fundador de DeepSeek, de 40 años. No está claro cuánto ha disfrutado del caos global que ha desatado. Un compañero de la escuela secundaria que habló recientemente con los medios locales dijo que Liang se estaba escondiendo en su ciudad natal durante el año nuevo lunar, que comenzó el 29 de enero. Burlado en las redes sociales chinas por su apariencia delgada y pálida, Liang sigue siendo un misterio para la mayoría de la gente. Aquellos que han tenido tratos profesionales con DeepSeek dicen que está obsesionado con la inteligencia artificial general (IAG) humana y el impacto que podría tener en el mundo. En su búsqueda de ello, el fundador de DeepSeek está trastornando las ideas sobre el progreso tecnológico tanto en Occidente como en China.
Apuesta a los ladrillos: la fórmula de Lego para ser cool y ecológico
La información pública sobre Liang es escasa. Nació en una familia de maestros en una aldea empobrecida cerca de la ciudad sureña de Zhanjiang en 1985, y fue un estudiante talentoso. Un ex profesor afirmó que dominó las matemáticas a nivel universitario cuando estaba en la escuela secundaria. En 2002 ingresó a un programa de grado en información electrónica en la Universidad de Zhejiang, una escuela prestigiosa en la ciudad oriental de Hangzhou. Un máster en la misma universidad, bajo la tutela de un reconocido científico de visión computacional, lo introdujo en el campo de la IA.
En ese momento, Hangzhou era un centro bullicioso para la tecnología de internet y hogar de empresas emergentes como Alibaba. Liang y varios compañeros se quedaron en la ciudad y comenzaron a experimentar con modelos de inversión cuantitativa, que no se basan en los fundamentos de las empresas, sino en procesar grandes cantidades de datos. En 2013, Liang y tres compañeros lanzaron un grupo de inversión llamado Yakebi en un intento de monetizar los modelos de comercio que habían construido.
Dos años después, Liang cofundó High-Flyer, un fondo de cobertura cuantitativo que creció rápidamente junto con docenas de empresas similares durante un período de desregulación y volatilidad del mercado en China. En 2021, afirmó gestionar hasta 100 .000 millones de yuanes (US$14.000 millones), aunque parece haberse reducido rápidamente en la segunda mitad de ese año. Los fondos han tenido frecuentes enfrentamientos con los reguladores chinos, que los ven como una forma de lucrarse con las caídas del mercado. Insiders de la industria afirman que High-Flyer se hizo famoso como uno de los fondos cuantitativos más agresivos, lo que regularmente le valió la ira de los reguladores de valores.
Reflexiones profundas
Para Liang, desarrollar modelos que utilicen menos poder de cómputo es un paso esencial en la búsqueda de su objetivo a largo plazo. “Nuestro objetivo es la IAG, lo que requiere que exploremos nuevas estructuras de modelo para lograr capacidades superiores con recursos limitados”, dijo a los medios locales.
El nuevo modelo R1 de DeepSeek, que ha sorprendido a Occidente, sugiere que está haciendo progresos. La empresa afirma que costó menos de US$6 millones entrenarlo, una fracción minúscula de los modelos comparables de empresas como OpenAI, creadora de ChatGPT. Sam Altman, el director de OpenAI, ha calificado al R1 de “impresionante” (aunque también ha prometido producir “modelos mucho mejores”, añadiendo que es “realmente estimulante tener un nuevo competidor”).
DeepSeek ciertamente tiene a sus detractores. Las primeras pruebas parecen confirmar que el R1 es tan poderoso como dice su creador. Pero algunos han cuestionado si la empresa ha subestimado la cantidad de chips de alto nivel que usó para desarrollar el modelo, aunque otros argumentan que sus afirmaciones son plausibles. También se especula que DeepSeek ha entrenado sus modelos estudiando los resultados de los modelos estadounidenses, un proceso conocido como “destilación”. OpenAI ha dicho que tiene evidencia de que DeepSeek ha destilado sus modelos, en violación de sus términos de servicio.
Incluso si las ganancias de eficiencia de DeepSeek no son tan impresionantes como se pensaba, siguen siendo un desafío para el pensamiento tanto en Silicon Valley como en Pekín. Los medios estatales chinos no tardaron en promover a DeepSeek como un activo nacional en la lucha del país por la supremacía en IA. Liang fue invitado a reunirse con Li Qiang, el primer ministro de China, el 20 de enero, junto con otros empresarios.
Sin embargo, como señala Zhang Zhiwei del fondo Pinpoint Asset Management, los logros de DeepSeek no surgieron de uno de los innumerables institutos de investigación respaldados por el gobierno de China ni de empresas controladas por el estado. Liang parece controlar la mayoría de las acciones de DeepSeek y ha evitado la industria de capital de riesgo dominada por el estado de China.
Liang ve el papel de China en los últimos 30 años como el de un “seguidor” tecnológico, construyendo sobre las bases desarrolladas en Occidente. La brecha entre Estados Unidos y China está entre la “originalidad y la imitación”, dijo en una entrevista con los medios locales en julio. El éxito de Nvidia, sostiene, no se ha basado únicamente en su propio desempeño, sino también en la colaboración tecnológica entre las empresas occidentales.
Los esfuerzos de China por imitar el poder de cómputo occidental han fracasado, en su opinión, porque carece de este tipo de colaboración, a pesar de un esfuerzo intensivo en capital liderado por el estado para crear una. DeepSeek puede no ser solo una llamada de atención para Silicon Valley, sino también para los líderes de China en Pekín.