El evento más importante de hoy es la conferencia GTC de Nvidia, que es prácticamente una historia resumida de la humanidad versión IA.

robot
Generación de resúmenes en curso

Lo más importante de hoy es la conferencia GTC de NVIDIA, prácticamente una historia de la humanidad en versión IA.

Aún no ha subido al escenario, pero la cantidad de información filtrada ya da para escribir un libro.

晚晚 ha organizado los tres puntos principales, vamos, amigos, síganme.

1)El costo de cálculo de IA se reduce a una décima

La generación anterior, Blackwell, ya era muy potente, ¿verdad? Pronto se anunciará la producción en masa de la nueva generación de chips, Vera Rubin.

¿En qué es impresionante Vera Rubin? En dos palabras: barato.

Ejecutando el mismo modelo de IA, el número de chips se reduce a una cuarta parte, y el costo de inferencia cae un 90%. ¡Un 90% menos, amigos! AWS, Microsoft y Google, los tres principales proveedores de la nube, ya están en la primera ola de adopción.

2)Groq, comprado por 20 mil millones de dólares el año pasado, hoy entrega resultados

Antes, Huang Renxun dijo en la reunión de resultados que Groq se integraría como una arquitectura ampliada en el sistema de NVIDIA, como cuando adquirieron Mellanox para completar su capacidad de red.

El LPU de Groq y la GPU de NVIDIA en un mismo centro de datos, la GPU entiende los problemas, y el LPU se encarga de dar respuestas rápidamente.

La colaboración entre estos dos chips reduce la latencia en escenarios de agentes.

Un AI Agent realiza tareas humanas, y un solo trabajo puede requerir decenas de rondas de ajuste del modelo, cada una consumiendo potencia de inferencia, y los usuarios están esperando allí, si va más lento, la experiencia se rompe.

La inferencia consta de dos pasos: primero entender tu problema, luego generar la respuesta palabra por palabra.

La GPU es buena en el primer paso, pero en la velocidad y estabilidad para generar las palabras, el LPU de Groq es más fuerte.

¿200 mil millones de dólares es caro?

Piensa en que en el futuro cada empresa tendrá cientos de agentes, cada uno ajustando modelos miles de veces al día.

3)NemoClaw, la versión de NVIDIA de OpenClaw

Es una plataforma de código abierto, que las empresas pueden instalar para desplegar empleados IA que hagan tareas, procesen datos y gestionen proyectos en lugar de humanos. Se dice que ya están en conversaciones con Salesforce y Adobe.

Lo interesante es que NemoClaw no requiere que uses chips de NVIDIA. Mira qué lógica más interesante. Vender chips solo genera ganancias en hardware, pero establecer reglas permite ganar en toda la cadena. Huang Renxun tiene esto muy claro.

4)Huang Renxun dice que mostrará “chips que el mundo nunca ha visto”

Probablemente sea la arquitectura de la próxima generación, Feynman, que debutará en 2028 con producción en TSMC en su proceso más avanzado de 1.6 nm.

También hay un rumor poco conocido que me parece muy interesante.

NVIDIA lanzará procesadores para laptops, dos modelos, enfocados en juegos. Los que venden tarjetas gráficas ahora quieren competir por el mercado de CPUs.

晚晚 siento que Huang Renxun en el futuro será una gran figura.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado