CK Geek: Ya conocemos el secreto de la extrema eficiencia de DeepSeek: ha esquivado el estándar CUDA de NVIDIA

Ya conocemos el secreto de la extrema eficiencia de DeepSeek: ha esquivado el estándar CUDA de NVIDIA

Una de las claves del éxito de DeepSeek se llama PTX

En la receta del trepidante crecimiento que ha experimentado NVIDIA durante los últimos cinco años no intervienen solo sus GPU; la tecnología CUDA (Compute Unified Device Architecture) también tiene un rol esencial en su negocio. La mayor parte de los proyectos de IA que se están desarrollando actualmente están implementados sobre CUDA. Esta tecnología aglutina el compilador y las herramientas de desarrollo utilizados por los programadores para desarrollar su software para las GPU de NVIDIA, y reemplazarla por otra opción en los proyectos que ya están en marcha es un problema.

En Xataka

El plan "made in China 2025" de Xi Jinping se está haciendo realidad: así está conquistando las tecnologías clave del futuro

Los ingenieros de DeepSeek han decidido utilizar PTX para sacar el máximo partido posible a las GPU H800 que tenían en su poder

Este lenguaje es similar al ensamblador. De hecho, de alguna manera es el ensamblador que propone NVIDIA a los desarrolladores que utilizan sus GPU y necesitan implementar optimizaciones de bajo nivel en su código. Programar con PTX es más difícil y laborioso que hacerlo con CUDA, pero conlleva la ventaja de que permite a los desarrolladores escribir un código más eficiente, y, por tanto, capaz de aprovechar mejor los recursos que les ofrece el hardware de la GPU.

Presumiblemente los ingenieros de DeepSeek han decidido utilizar PTX para sacar el máximo partido posible a las GPU H800 que tenían en su poder. Una de las estratagemas que han ideado ha consistido en asignar solo 20 SM (Streaming Multiprocessors) de cada GPU a la comunicación entre los servidores, lo que les ha permitido dedicar los 112 SM restantes de cada chip a procesos de cálculo. En esencia, DeepSeek ha sido construido desde cero recurriendo a este tipo de optimizaciones, lo que en gran medida explica por qué este modelo de IA es tan eficiente.

Los programadores de esta compañía china objetivamente han materializado un logro en el ámbito de la ingeniería que con toda probabilidad va a tener un impacto profundo en la forma en que los desarrolladores de modelos de IA van a afrontar sus proyectos en el futuro. Esta es la prueba palpable de que China se está adaptando con éxito a la escasez de GPU que han desencadenado las sanciones de EEUU en sus empresas.

Imagen | NVIDIA

Más información | Mirae Asset Securities Korea

En Xataka | Nos podemos ir olvidando de una IA sin alucinaciones por ahora. El director general de NVIDIA explica por qué

-
La noticia Ya conocemos el secreto de la extrema eficiencia de DeepSeek: ha esquivado el estándar CUDA de NVIDIA fue publicada originalmente en Xataka por Juan Carlos López .

☞ El artículo completo original de Juan Carlos López lo puedes ver aquí

29 de enero de 2025

Ya conocemos el secreto de la extrema eficiencia de DeepSeek: ha esquivado el estándar CUDA de NVIDIA

Una de las claves del éxito de DeepSeek se llama PTX

No hay comentarios.:

Publicar un comentario