Reti neurali fotoniche programmabili che combinano WDM con ottica lineare coerente

Blog

CasaCasa / Blog / Reti neurali fotoniche programmabili che combinano WDM con ottica lineare coerente

Aug 13, 2023

Reti neurali fotoniche programmabili che combinano WDM con ottica lineare coerente

Scientific Reports volume 12, numero articolo: 5605 (2022) Cita questo articolo 4884 Accessi 19 Citazioni 1 Dettagli metriche alternative La fotonica neuromorfica si è finora basata esclusivamente su metodi coerenti o

Rapporti scientifici volume 12, numero articolo: 5605 (2022) Citare questo articolo

4884 accessi

19 citazioni

1 Altmetrico

Dettagli sulle metriche

Finora la fotonica neuromorfica si è basata esclusivamente su progetti coerenti o WDM (Wavelength-Division-Multiplexing) per consentire la moltiplicazione del prodotto punto o del vettore per matrice, il che ha portato a un'impressionante varietà di architetture. Qui facciamo un ulteriore passo avanti e utilizziamo WDM per arricchire il layout con funzionalità di parallelizzazione attraverso fasi di fan-in e/o di ponderazione invece di servire allo scopo computazionale e presentiamo, per la prima volta, un'architettura neuronale che combina l'ottica coerente con WDM verso una piattaforma di rete neurale programmabile multifunzionale. La nostra piattaforma riconfigurabile supporta quattro diverse modalità operative sullo stesso hardware fotonico, supportando livelli multistrato, convoluzionali, completamente connessi e a risparmio energetico. Convalidiamo matematicamente le prestazioni di successo lungo tutte e quattro le modalità operative, tenendo conto della diafonia, della spaziatura dei canali e della dipendenza spettrale degli elementi ottici critici, concludendo con un funzionamento affidabile con errore relativo MAC \(< 2\%\).

La crescita esplosiva dell’Intelligenza Artificiale (AI) e del Deep Learning (DL), insieme alla maturazione dell’integrazione fotonica, hanno creato una nuova finestra di opportunità per l’uso dell’ottica in compiti computazionali1,2,3,4,5. Si prevede che l’uso di fotoni e delle relative tecnologie ottiche nell’hardware della rete neurale (NN) offra un aumento significativo nelle operazioni di moltiplicazione-accumulo (MAC) al secondo rispetto alle rispettive piattaforme elettroniche NN, con un’energia computazionale e un’efficienza dell’area che si stima raggiungano < fJ/MAC e > TMAC/s/mm\(^{2}\), rispettivamente6,7. Il percorso verso la realizzazione di questo cambiamento di paradigma dell'hardware NN mira a sfruttare le velocità di linea elevate supportate dalle tecnologie fotoniche integrate insieme alla funzione di ponderazione di piccole dimensioni e a basso consumo che può essere offerta su scala di chip4,8. Finora, la stragrande maggioranza dei dispositivi fotonici utilizzati per scopi di ponderazione si è concentrata su elementi riconfigurabili lentamente, come gli sfasatori termo-ottici (T/O)9,10 e le strutture di memoria non volatile basate su materiali a cambiamento di fase (PCM)4,8 , il che implica che le applicazioni di inferenza sono attualmente considerate come l'obiettivo principale nell'area della fotonica neuromorfica3.

I motori di inferenza richiedono infatti un’architettura neuronale piuttosto statica e un grafico di connettività a livelli che di solito viene definito per eseguire in modo ottimale un determinato compito di intelligenza artificiale. Il tracciamento degli oggetti e la classificazione delle immagini, ad esempio, vengono generalmente eseguiti tramite una serie di livelli convoluzionali seguiti da uno o più livelli completamente connessi (FC), mentre i codificatori automatici richiedono fasi a cascata di livelli FC11,12. Sebbene i livelli convoluzionali e FC comprendano elementi architettonici critici in quasi tutte le piattaforme di inferenza, un ampio insieme di parametri, come il numero di livelli e/o neuroni per livello e il grafico di connettività, può variare in modo significativo a seconda dell'architettura e dell'applicazione DL target. Le implementazioni elettroniche possono portare a circuiti integrati specifici per l'applicazione (ASIC) personalizzati per un compito di inferenza specifico, ma l'uso di GPU, TPU o persino FPGA diventa inevitabile quando sono necessarie riprogrammabilità e riconfigurabilità per utilizzare lo stesso hardware per più applicazioni13.

Il trasferimento della capacità di riconfigurazione alle implementazioni Photonic (P)-NN richiede una piattaforma in grado di supportare in modo flessibile diversi layout funzionali sullo stesso hardware neurale. La programmabilità nella fotonica ha compiuto progressi significativi negli ultimi anni14,15,16 e i circuiti fotonici integrati (PIC) programmabili hanno dimostrato di offrire importanti vantaggi verso il rilascio di piattaforme fotoniche economicamente efficienti, flessibili e multifunzionali che possono seguire da vicino il concetto di FPGA elettronici17. In questo sforzo, è stato anche evidenziato che solo l'uso di interruttori interferometrici Mach-Zehnder (MZI) lentamente riconfigurabili \(2 \times 2\) all'interno di uno schema architettonico appropriato può produrre un ampio insieme di opzioni di connettività e funzionalità del circuito14,15 . Tuttavia, la peculiarità delle architetture NN deve procedere lungo funzionalità alternative che attualmente non sono ancora offerte dalle implementazioni fotoniche programmabili. Sebbene la riconfigurazione del valore del peso possa effettivamente essere offerta dalla tecnologia di pesatura fotonica all'avanguardia4,8,9,10 e abbia iniziato a emergere anche uno spostamento di prospettiva verso funzioni di attivazione programmabili16,18,19, le architetture fotoniche neuromorfiche finora dimostrate non supportano alcun meccanismo di riconfigurazione per i loro stadi neuronali lineari. Le PNN hanno finora progredito lungo due principali categorie architettoniche per la realizzazione di strati neurali lineari, dove Wavelength-Division-Multiplexed (WDM) e piattaforme coerenti sembrano seguire roadmap discrete e parallele: (i) layout incoerenti o basati su WDM, dove una lunghezza d'onda discreta viene utilizzato per ciascun assone all'interno dello stesso neurone3,4,20 e (ii) schemi interferometrici coerenti, in cui viene utilizzata una singola lunghezza d'onda attraverso l'intero neurone, sfruttando l'interferenza tra campi elettrici coerenti per operazioni di somma ponderata9,10.

4\) and \(N>2\) is imposed, respectively). Index n in the implementation (a) is set to \(n \le 4\) to denote that the lit nth branch carries a non-zero input. Similarly, if the number of available wavelengths M exceeds the number of required ones, the excess LDs are powered off./p> 90\%\) of analyzed random sets./p>