La IA china que piensa en imágenes, no en palabras, desafía a EE UU

service
Compartir

Comparte este artículo

o copie el enlace

SenseTime, la empresa china de IA conocida por su tecnología de reconocimiento facial, presentó un nuevo modelo de código abierto que, según afirma, puede generar e interpretar imágenes mucho más rápido que los mejores modelos desarrollados por sus competidores estadounidenses. SenseNova U1 podría ayudar a la compañía a recuperar el terreno perdido tras haber salido del grupo de líderes en la carrera china por el desarrollo de la IA.

La clave del éxito del modelo reside en su capacidad para «leer» imágenes sin necesidad de convertirlas primero a texto, lo que acelera el proceso y reduce la potencia de cálculo requerida. «El proceso de razonamiento del modelo ya no se limita al texto. También puede razonar con imágenes», declaró Dahua Lin, cofundadora y científica jefa de SenseTime, en una entrevista con WIRED.

Lin, quien también es profesor de ingeniería de la información en la Universidad China de Hong Kong, afirma que los modelos capaces de procesar imágenes directamente permitirán a los robots comprender mejor el mundo físico en el futuro.

Con chips chinos

Al igual que el último modelo insignia de DeepSeek, SenseTime afirma que el U1 puede funcionar con chips de fabricación china. «Varios fabricantes de chips chinos ya han optimizado la compatibilidad con nuestro nuevo modelo», comenta Lin. El día del lanzamiento, diez diseñadores de chips chinos, entre ellos Cambricon y Biren Technology, anunciaron que su hardware es compatible con el U1.

Esa flexibilidad es importante porque los controles de exportación estadounidenses restringen el acceso de las empresas chinas a los chips de IA más avanzados del mundo, en particular a los utilizados para el entrenamiento, que actualmente son desarrollados principalmente por empresas occidentales como Nvidia. «Seguiremos impulsando el entrenamiento con chips más diversos», afirma Lin. Sin embargo, también reconoce que SenseTime «quizás necesite usar los mejores chips para garantizar la velocidad de nuestra iteración».

SenseTime lanzó U1 de forma gratuita en Hugging Face y GitHub, otra señal de cómo las empresas chinas se están convirtiendo en algunas de las contribuyentes más activas a la IA de código abierto.

Person working at desk

Todo lo que siempre quisiste saber sobre Linux, GNU y cómo las grandes empresas ganan dinero a costa del software libre basado en la colaboración.

Qué sabemos de SenseTime

SenseTime se fundó en 2014 y se convirtió en un líder mundial en visión por computadora, que se utiliza en aplicaciones como el reconocimiento facial y la conducción autónoma. Pero cuando ChatGPT y otros sistemas de IA impulsados por el procesamiento del lenguaje natural se convirtieron en tendencia en la industria tecnológica, SenseTime comenzó a luchar para obtener beneficios y cayó detrás de nuevas startups chinas como DeepSeek y MiniMax.

SenseTime confía en que la publicación de SenseNova-U1 para que cualquiera pueda utilizarla le ayude a alcanzar a las empresas de IA nacionales y occidentales. Lin afirma que la empresa tomó finalmente la decisión el año pasado de centrarse en el código abierto debido a los útiles comentarios que recibe de los investigadores, lo que le permite iterar con mayor rapidez. «Hoy en día, ser de código abierto o cerrado no es el factor ganador, sino la velocidad de iteración», explica Lin.

El código abierto también ayuda a SenseTime a seguir colaborando con investigadores internacionales sin interferencias geopolíticas. En los últimos años, el gobierno de Estados Unidos ha sancionado repetidamente a la empresa por acusaciones de que su tecnología de reconocimiento facial ayudaba a alimentar sistemas de vigilancia utilizados para vigilar y detener a uigures y otros grupos minoritarios en la región china de Xinjiang. Por ello, las empresas estadounidenses tienen prohibido invertir en SenseTime y venderle determinadas tecnologías sin licencia. SenseTime ha negado las acusaciones.

La IA china que piensa en imágenes, no en palabras, desafía a EE UU
wpChatIcon
    wpChatIcon