Una de las claves del éxito de DeepSeek se llama PTX
En la receta del trepidante crecimiento que ha experimentado NVIDIA durante los últimos cinco años no intervienen solo sus GPU; la tecnología CUDA (Compute Unified Device Architecture) también tiene un rol esencial en su negocio. La mayor parte de los proyectos de IA que se están desarrollando actualmente están implementados sobre CUDA. Esta tecnología aglutina el compilador y las herramientas de desarrollo utilizados por los programadores para desarrollar su software para las GPU de NVIDIA, y reemplazarla por otra opción en los proyectos que ya están en marcha es un problema.
Los ingenieros de DeepSeek han decidido utilizar PTX para sacar el máximo partido posible a las GPU H800 que tenían en su poder
Este lenguaje es similar al ensamblador. De hecho, de alguna manera es el ensamblador que propone NVIDIA a los desarrolladores que utilizan sus GPU y necesitan implementar optimizaciones de bajo nivel en su código. Programar con PTX es más difícil y laborioso que hacerlo con CUDA, pero conlleva la ventaja de que permite a los desarrolladores escribir un código más eficiente, y, por tanto, capaz de aprovechar mejor los recursos que les ofrece el hardware de la GPU.
Presumiblemente los ingenieros de DeepSeek han decidido utilizar PTX para sacar el máximo partido posible a las GPU H800 que tenían en su poder. Una de las estratagemas que han ideado ha consistido en asignar solo 20 SM (Streaming Multiprocessors) de cada GPU a la comunicación entre los servidores, lo que les ha permitido dedicar los 112 SM restantes de cada chip a procesos de cálculo. En esencia, DeepSeek ha sido construido desde cero recurriendo a este tipo de optimizaciones, lo que en gran medida explica por qué este modelo de IA es tan eficiente.
Los programadores de esta compañía china objetivamente han materializado un logro en el ámbito de la ingeniería que con toda probabilidad va a tener un impacto profundo en la forma en que los desarrolladores de modelos de IA van a afrontar sus proyectos en el futuro. Esta es la prueba palpable de que China se está adaptando con éxito a la escasez de GPU que han desencadenado las sanciones de EEUU en sus empresas.
Imagen | NVIDIA
Más información | Mirae Asset Securities Korea
-
La noticia Ya conocemos el secreto de la extrema eficiencia de DeepSeek: ha esquivado el estándar CUDA de NVIDIA fue publicada originalmente en Xataka por Juan Carlos López .
☞ El artículo completo original de Juan Carlos López lo puedes ver aquí
No hay comentarios.:
Publicar un comentario