光学计算在21世纪初重新引起了学术界和工业界的兴趣,其中很多研究性趣都集中在用于神经网络处理的专用光学计算机上。自20世纪60年代以来,光学计算一直是周期性研究的话题,例如20世纪80年代和90年代初的神经网络,已经提出了各种各样的光学计算方案和架构。
鉴于此,近日来自美国康奈尔大学的Peter L. McMahon教授在Nature Reviews Physics上以The physics of optical computing为题发表综述文章,系统地解释了为什么和如何光学可能比电子学在计算方面具有速度或能源效率优势,列举了在设计光学计算机时可以利用的11个光学特性。同时,文章指出,光速快不是光学用于计算的关键区别性物理特性。要理解光计算优势来自哪里,需要更细致的考虑。文章讨论了如何通过仔细设计利用光计算的11个特性中来获得优于最先进电子处理器的优势,同时避免传统观念中的一些陷阱。
图1. 光计算的三大优势:低延迟、高通量和低能耗。
图源:Nat Rev Phys 5, 717–734 (2023).
由于电子计算机在某些任务上的性能限制,自21世纪初以来,光学计算在学术界和工业界重新引起了人们的兴趣。
这篇文章列举并讨论了光学和光学计算可以带来优势的11个特点。任何想要在实践中获得优势的光学计算机,都需要利用这11个特点中的一个或多个。明确列出这些特点有助于明确光学计算机的设计者需要利用的元素。它还允许研究人员系统地识别不同提议的光学计算机背后的基本物理原理,帮助他们分析可以期望获得的优势以及如何通过利用更多的特点来改进设计。成功设计光学计算机必须仔细规划以避免可能超过光学的瓶颈或开销。本文还讨论了一些可能出现的陷阱以及如何避免这些陷阱的方法。
不过,现在试图用光学构建高性能通用处理器仍然遥不可及。目前,专用光学计算机的应用领域包括神经网络,科学计算,组合优化和密码学。这四个应用领域的算法基本过程都是矩阵向量乘法,这也是目前光学计算研究的主要目标。傅里叶变换和卷积在神经网络、科学计算和密码学中都有应用,因此在当前的研究中占据了重要地位。
光学相关器在过去几十年的几个时期都作为商业产品发布,因此即使在商业上也不是一个新方向,但已经得到了振兴。在神经网络的计算中,也有大量的工作致力于设计并非专门针对矩阵向量乘法或卷积的神经网络。
这四个应用领域的共同点是,光学计算机执行子程序即使存在一些误差(噪声)仍然是有用的。这个因素非常重要,因为任何模拟计算机(包括模拟光学计算机)都难以实现超过10位的精度,所以模拟光学计算机的应用应该对这种级别的噪声具有鲁棒性。神经网络特别适合,因为至少在推断(而不是训练)期间,神经网络的精度不会下降太多,即使它们仅限于使用少于8位精度的整数算术。任何模拟神经网络处理器(包括模拟光学处理器)的一个问题是执行深度神经网络时可能会积累误差。最近对此进行了理论分析,结论是即使存在相关性噪声,也可以减轻有害影响的积累。不相关的噪声只会导致有效精度降低的噪声。
图2. 光系统中的信号传输。
图源:Nat Rev Phys 5, 717–734 (2023).
文章主要分析了光学计算机在设计时的三个主要性能指标:延迟、吞吐量和能量效率。作者指出,设计光学计算机的目标应取决于用户的特定需求,但光学技术可能在这三个指标上都能提供优势。
作者提到,除了这三个指标外,还有诸如尺寸、鲁棒性、成本、安全性(对黑客攻击的易感性)和准确性等其他重要的计算机性能指标。作者指出,没有理由相信光学计算机可以提供比所有可能的电子计算机更高的准确性,因此准确性不是光学计算机具有优势的指标。相反,光计算通常的目标是在特定精度下实现延迟、吞吐量或能量效率的优势。其他指标为光学计算机在一些特定使用案例中具有竞争力提供了其他约束条件。
作者使用一个特定的计算示例——机器学习推理(更具体的是图像中的面部识别)来简要描述这些指标。延迟(也称为延迟)是指计算机从接收到输入图像的那一刻起,预测图像中人物姓名所需的时间。吞吐量是指每秒可以执行多少次推理,对于图像中的面部识别,吞吐量指标是每秒处理的图像数量。需要注意的是,在一般情况下,(1/延迟)≠吞吐量;通过流水线作业,吞吐量可以远高于延迟的倒数。可以类比一个制造汽车的工厂使用流水线(管道)进行生产:从开始到结束,工厂可能需要1天来制造一辆汽车(延迟),但每天可以生产出数百辆汽车(吞吐量)。能量效率是指计算机完成一次推理计算所使用的能量。
作者认为,构建在吞吐量或能量效率(或两者)方面在短期内比电子处理器具有很大优势的光学处理器的最可能路线是,即利用大型空间并行性和近乎无耗动的动力学构建一个自由空间光学矩阵-向量乘法器。如果光学矩阵-向量乘法器的输入是光学信号,例如作为视觉场景的预处理器使用时,它将更容易实现相对于电子解决方案的优势。此外,作者还提到还有其他吸引人的光学处理器架构,包括基于光子集成电路的系统和涉及频率复用而非空间复用或额外复用的系统,这些都非常值得追求。
图3. 光系统与电系统的不同之处。
图源:Nat Rev Phys 5, 717–734 (2023).
利用光学方法来实现运算处理和数据传输的技术和设备的光计算,具有二维并行处理、高速度、大容量、空间传输和抗电磁干扰等优点,一般可归纳为数字光计算和模拟-数字光计算。在数字光计算中,光存储、光互联和光处理器等技术被考虑使用。然而,全光计算的器件在技术上尚不成熟,还没有公认的全光数字处理器体系结构。光学神经网络是光计算的一种应用,主要特点是群并行性、高互连密度、联想和容错,主要的研究内容是通过光学方法来实现神经网络模型。
然而,光计算技术的发展也面临一些挑战。例如,光计算的成本较高,稳定性较差,光信号干扰等问题需要克服。此外,还需要进一步研究和开发高效的光学器件和光处理器,以提高光计算的性能和可靠性。
文章最后指出,构建在任何指标上优于电子计算机的光学计算机都是具有挑战性的,因为现在电子处理器已经非常先进。然而,光学计算物理学有望通过仔细设计光学计算机,为某些类别的任务提供数个数量级的优势,特别是对于那些已经以光学格式存在的数据或具有非常高的计算与数据比的任务。
参考文献:McMahon, P.L. The physics of optical computing. Nat Rev Phys 5, 717–734 (2023).
https://doi.org/10.1038/s42254-023-00645-5
原创文章,作者:计算搬砖工程师,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2024/01/18/35258ab451/