El nuevo prototipo de chip, desarrollado por investigadores de IBM Research en EE UU, combina la computación y la memoria para procesar datos de manera eficiente con menor consumo energético.
Investigadores del laboratorio de IBM Research Almadén (California) han presentado en el último número de Science el chip NorthPole, una arquitectura inspirada en el cerebro que combina la computación con la memoria para procesar datos de forma eficiente a bajo coste energético.
Desde sus inicios, la informática se ha centrado en el procesador, separando la memoria del cálculo. Sin embargo, transportar grandes cantidades de datos entre la memoria y el cálculo tiene un alto coste en términos de consumo de energía, ancho de banda y velocidad de procesamiento.
Esto es especialmente evidente en el caso de las aplicaciones emergentes y avanzadas de inteligencia artificial (IA) en tiempo real, como el reconocimiento facial, la detección de objetos y la monitorización del comportamiento, que requieren un acceso rápido a grandes cantidades de datos.
Como resultado, la mayoría de las arquitecturas informáticas contemporáneas están alcanzando rápidamente cuellos de botella físicos y de procesamiento y corren el riesgo de volverse insostenibles desde el punto de vista económico, técnico y medioambiental, dados los crecientes costes energéticos que conllevan.
Sin embargo, el nuevo prototipo de chip, que lleva casi dos décadas desarrollándose, tiene el potencial de cambiar drásticamente la forma en que se podrá ampliar eficazmente los potentes sistemas de hardware de la IA, señalan los autores del trabajo.
Desde el nacimiento de la industria de los semiconductores, los chips informáticos han seguido principalmente la misma estructura básica, en la que las unidades de procesamiento y la memoria que almacena la información a procesar se almacenan de forma discreta.
El chip NorthPole en una tarjeta PCIe. / IBM Research
Aunque esta estructura ha permitido diseños más sencillos y escalables a lo largo de las décadas, ha creado lo que se denomina el cuello de botella de von Neumann, en el que se necesita tiempo y energía para intercambiar continuamente datos entre la memoria, el procesamiento y cualquier otro dispositivo de un chip.
El trabajo de Dharmendra Modha, de IBM Research, y sus colegas pretende cambiar esta situación inspirándose en la forma en que computa el cerebro.“Forja un camino completamente distinto al de la arquitectura von Neumann”, según Modha.
Durante los últimos ocho años, Modha ha trabajado en un nuevo tipo de chip digital de IA para la inferencia neuronal, al que llama NorthPole. Es una extensión de TrueNorth, el último chip inspirado en el cerebro en el que Modha trabajó antes de 2014.En las pruebas realizadas con los populares modelos de reconocimiento de imágenes ResNet-50 y detección de objetos YOLOv4, el nuevo prototipo de chip ha demostrado una mayor eficiencia energética y espacial y menor latencia que cualquier otro chip actualmente en el mercado, y es unas 4.000 veces más rápido que TrueNorth, según IBM Research.
Según Modha, NorthPole es un gran avance en la arquitectura de chips que ofrece enormes mejoras en eficiencia energética, espacial y temporal. Utilizando el modelo ResNet-50, el chip es considerablemente más eficiente que las unidades de procesamiento gráfico (GPU, por sus siglas en inglés) de 12 nm y las unidades centrales de procesamiento (CPU). En ambos casos, el prototipo es 25 veces más eficiente desde el punto de vista energético, en lo que se refiere al número de fotogramas interpretados por julio de energía requerida.
El chip se ha fabricado con un proceso de nodo de 12 nm y contiene 22.000 millones de transistores en 800 milímetros cuadrados. Tiene 256 núcleos y puede realizar 2.048 operaciones por núcleo y ciclo con precisión de 8 bits, con potencial para duplicar y cuadruplicar el número de operaciones con precisión de 4 y 2 bits, respectivamente
NorthPole también superó en latencia, así como en espacio necesario para computar, en términos de fotogramas interpretados por segundo por cada mil millones de transistores requeridos. Según Modha, en ResNet-50, el chip supera a las principales arquitecturas predominantes, incluso a las que utilizan procesos tecnológicos más avanzados, como una GPU implementada mediante un proceso de 4 nm.
Modha, en el centro, con la mayor parte del equipo que trabaja en NorthPole.
Una de las mayores ventajas de NorthPole, explican los autores, es que toda la memoria del dispositivo está en el propio chip, en lugar de conectarse por separado. Sin ese cuello de botella de von Neumann, puede realizar inferencias de IA considerablemente más rápido que otros chips ya existentes en el mercado.
“La arquitectura de NorthPole difumina la frontera entre cálculo y memoria", afirma Modha. “A nivel de núcleos individuales, aparece como ‘memoria cerca del cómputo’ y desde fuera del chip, a nivel de entrada salida, aparece como una memoria activa". Esto hace que sea fácil de integrar en los sistemas y reduce significativamente la carga en la máquina anfitriona.
Pero la mayor ventaja del chip es también una limitación: solo puede tirar fácilmente de la memoria que lleva incorporada. Todo el aumento de velocidad posible en el chip se vería mermado si tuviera que acceder a la información desde otro lugar.
Gracias a un enfoque denominado ‘scale-out’, NorthPole puede soportar redes neuronales más grandes dividiéndolas en subredes más pequeñas que quepan en la memoria modelo del chip, y conectando estas subredes entre sí en varios chips NorthPole.
Así pues, aunque en uno de estos chips (o en un conjunto de ellos) hay memoria suficiente para muchos de los modelos útiles para aplicaciones específicas, este chip no está pensado para ser un multitalento. “No podemos ejecutar GPT-4 con él, pero sí muchos de los modelos que necesitan las empresas”, afirma Modha.
Esta eficacia significa que el dispositivo tampoco necesita voluminosos sistemas de refrigeración líquida para funcionar —con ventiladores y disipadores de calor es más que suficiente—, lo que significa que podría desplegarse en algunos espacios más bien pequeños.
Aunque la investigación sobre el chip NorthPole sigue su curso, su estructura se presta a casos de uso de IA emergentes, así como a otros más consolidados.
En las pruebas, el equipo de NorthPole se centró principalmente en usos relacionados con la visión por ordenador, en parte, porque la financiación del proyecto procedía del Departamento de Defensa de EE UU.
Algunas de las principales aplicaciones fueron la detección, la segmentación de imágenes y la clasificación de vídeos. Pero también se probó en otros ámbitos, como el procesamiento del lenguaje natural (con el modelo BERT de codificador único) y el reconocimiento del habla (con DeepSpeech2). En la actualidad, el equipo está explorando la asignación de grandes modelos de lenguaje solo con decodificador a sistemas escalables NorthPole.
Los desarrolladores creen que este chip podría utilizarse también en muchos tipos de aplicaciones periféricas que requieren cantidades masivas de procesamiento de datos en tiempo real. “Por ejemplo —comentan—, podría ser el tipo de dispositivo necesario para que los vehículos autónomos pasen de ser máquinas que necesitan mapas y rutas fijas para funcionar a pequeña escala a otras capaces de pensar y reaccionar ante las situaciones límite que hacen que la navegación en el mundo real sea un reto incluso para los conductores humanos expertos.
También se podría emplear en satélites que vigilen la agricultura y gestionen las poblaciones de animales salvajes, controlen los vehículos y el transporte de mercancías, manejen robots de forma segura y detecten ciberamenazas, destacan los autores.
Referencia:
Dharmendra Modha et al. “Neural inference at the frontier of energy, space, and time”. Science (octubre 2023)