Nvidia deja de ser solo «el proveedor de chips» y podría buscar el trono de OpenAI
Nvidia gastará 26,000 millones de dólares en los próximos cinco años para crear modelos de IA de código abierto, según una presentación financiera de 2025. Los ejecutivos confirmaron la noticia, de la que no se había informado anteriormente, en entrevistas con WIRED.
Con esta cuantiosa inversión, Nvidia podría pasar de ser un fabricante de chips con una impresionante pila de software a convertirse en un auténtico laboratorio de vanguardia capaz de competir con OpenAI y DeepSeek. Se trata de un movimiento estratégico que podría afianzar aún más la posición de Nvidia como principal fabricante de chips del mundo de la IA, ya que los modelos están adaptados al hardware de la empresa.
La euforia por el código abierto
Los modelos de código abierto son aquellos en los que las ponderaciones o los parámetros que determinan el comportamiento de un modelo se hacen públicos, a veces con los detalles de su arquitectura y entrenamiento. Esto permite que cualquiera pueda descargarlo y ejecutarlo en su propia computadora o en la nube. En el caso de Nvidia, la compañía también revela las innovaciones técnicas que intervienen en la construcción y el entrenamiento de sus modelos, lo que facilita a las startups y a los investigadores modificar y construir sobre las innovaciones de la compañía.
A mediados de la semana, Nvidia también presentó Nemotron 3 Super, su modelo de IA de código abierto más capaz hasta la fecha. El nuevo modelo tiene 128,000 millones de parámetros, una medida del tamaño y la complejidad del modelo, lo que lo hace aproximadamente equivalente a la versión más grande de GPT-OSS de OpenAI, aunque la compañía afirma que supera a GPT-OSS y a otros modelos en varias pruebas comparativas.
En concreto, Nvidia afirma que Nemotron 3 Super ha obtenido una puntuación de 37 en el Índice de Inteligencia Artificial, que evalúa modelos en 10 pruebas diferentes. GPT-OSS obtuvo 33 puntos, pero varios modelos chinos obtuvieron puntuaciones más altas. Nvidia afirma que Nemotron 3 Super se probó en secreto en PinchBench, un nuevo punto de referencia que evalúa la capacidad de un modelo para controlar OpenClaw, y obtuvo el primer puesto en esa prueba.
Nvidia también presentó una serie de trucos técnicos que utilizó para entrenar a Nemotron 3. Entre ellos se incluyen técnicas de arquitectura y entrenamiento que mejoran la capacidad de razonamiento del modelo, el manejo de contextos largos y la capacidad de respuesta al aprendizaje por refuerzo.
«Nvidia se está tomando mucho más en serio el desarrollo de modelos abiertos. Y estamos logrando un gran progreso», afirma Bryan Catanzaro, vicepresidente de investigación aplicada de aprendizaje profundo en Nvidia.
Meta fue la primera de IA en lanzar un modelo abierto, Llama, en 2023
Recientemente, el CEO Mark Zuckerberg reinició los esfuerzos de IA de la compañía, y señaló que podría no hacer futuros modelos completamente abiertos. OpenAI ofrece un modelo abierto, llamado GPT-oss, pero es inferior a las mejores ofertas propietarias de la empresa y no se adapta bien a las modificaciones.
A los mejores modelos estadounidenses, de OpenAI, Anthropic y Google, solo se puede acceder a través de la nube o mediante una interfaz de chat. En cambio, los pesos de muchos de los mejores modelos chinos, de DeepSeek, Alibaba, Moonshot AI, Z.ai y MiniMax, se publican de forma abierta y gratuita. Como resultado, muchas nuevas empresas e investigadores de todo el mundo están construyendo sobre modelos chinos.
«Nos interesa ayudar a que el ecosistema se desarrolle», afirma Catanzaro, que se incorporó a Nvidia en 2011 y ayudó a encabezar el cambio de la empresa, que pasó de fabricar tarjetas gráficas para juegos a fabricar silicio para IA. Nvidia lanzó el primer modelo de Nemotron en noviembre de 2023. Catanzaro añade que Nvidia ha terminado recientemente el preentrenamiento de un modelo de 550,000 millones de parámetros. El preentrenamiento implica introducir enormes cantidades de datos en un modelo repartido entre un gran número de chips especializados que funcionan en paralelo.



