Processore AI ottico per ridurre il consumo energetico del data center...
CasaCasa > Notizia > Processore AI ottico per ridurre il consumo energetico del data center...

Processore AI ottico per ridurre il consumo energetico del data center...

Nov 16, 2023

I ricercatori del MIT negli Stati Uniti e della Technische Universitat di Berlino hanno costruito un processore di rete neurale ottica con laser incorporati che riduce drasticamente il consumo energetico di un grande modello di linguaggio AI come GPT4.0.

L'architettura 3D si basa su array all'avanguardia di laser a emissione di superficie verticale (VCSEL) sviluppati dal gruppo Reitzenstein presso la Technische Universitat di Berlino. Ciò garantisce un miglioramento di 100 volte dell'efficienza energetica e un miglioramento di 20 volte della densità di elaborazione,

"Si è trattato di un progetto collaborativo che non sarebbe stato possibile senza di loro", afferma il ricercatore Ryan Hamerly del Laboratorio di ricerca di elettronica (RLE) del MIT, che ha brevettato il progetto con i colleghi.

Il sistema può raggiungere un'efficienza energetica di 7 femtojoule per operazione (OP) con una densità di calcolo di 6 TOP/mm2/s1, che rappresentano rispettivamente miglioramenti di 100 e 20 volte rispetto ai processori digitali all'avanguardia. Lo sviluppo a breve termine potrebbe migliorare questi parametri di altri due ordini di grandezza, aprendo le attività di apprendimento automatico dai data center ai dispositivi decentralizzati.

“Ci aspettiamo che possa essere adattato per uso commerciale nel giro di pochi anni. Ad esempio, gli array laser coinvolti sono ampiamente utilizzati nell’identificazione del volto dei telefoni cellulari e nella comunicazione dei dati”, afferma Zaijun Chen, primo autore, che ha condotto il lavoro mentre era postdoc al MIT presso RLE ed è ora assistente professore presso la University of Southern California.

“ChatGPT è limitato nelle sue dimensioni dalla potenza dei supercomputer di oggi. Semplicemente non è economicamente fattibile addestrare modelli molto più grandi. La nostra nuova tecnologia potrebbe rendere possibile il salto verso modelli di apprendimento automatico che altrimenti non sarebbero raggiungibili nel prossimo futuro”, ha affermato Dirk Englund, professore associato presso il Dipartimento di ingegneria elettrica e informatica del MIT e leader del lavoro.

"Non sappiamo quali capacità avrà il ChatGPT di prossima generazione se sarà 100 volte più potente, ma questo è il regime di scoperta che questo tipo di tecnologia può consentire." Englund è anche a capo del Laboratorio di fotonica quantistica del MIT ed è affiliato al RLE e al Laboratorio di ricerca sui materiali.

Altri coautori dell'attuale articolo di Nature Photonics sono Alexander Sludds, Ronald Davis, Ian Christen, Liane Bernstein e Lamia Ateshian, tutti di RLE; e Tobias Heuser, Niels Heermeier, James A. Lott e Stephan Reitzensttein della Technische Universitat Berlin.

Chen, Hamerly ed Englund hanno depositato un brevetto sul lavoro, che è stato sponsorizzato dall'Ufficio di ricerca dell'esercito americano e dalla NTT Research in Giappone, nonché dalla Fondazione Volkswagen in Germania.

www.mit.edu; www.nature.com/articles/s41566-023-01233-w