近年来,我们看到越来越多的边缘设备被消费者采用,在他们的家里(如智能相机和门铃),在他们的汽车(如驾驶员辅助系统),甚至在他们的身上(如智能手表和戒指)。航空航天、农业、医疗保健、运输和制造业等行业也出现了类似的增长。与此同时,设备越来越小,为大多数人工智能提供动力的深度神经网络(DNN)也越来越大,需要更多的计算能力、内存和带宽。这使得人工智能的进步与开发尖端智能设备的能力之间越来越脱节。在这篇论文中,我们提出了一种在边缘运行最先进的AI算法的新方法。我们提出了标准卷积神经网络的两种有效近似:二值权值网络(BWN)和xnor网络。在BWN中,过滤器近似于二进制值,从而节省了32倍的内存。在xnor网络中,滤波器和卷积层的输入都是二进制的。xnor网络使用主要的二进制操作近似卷积。这使得卷积运算的速度提高了58x(就高精度运算的数量而言),节省了32x的内存。 XNOR-Nets offer the possibility of running state-of-the-art networks on CPUs (rather than GPUs) in real-time. Our binary networks are simple, accurate, efficient, and work on challenging visual tasks. We evaluate our approach on the ImageNet classification task. The classification accuracy with a BWN version of AlexNet is the same as the full-precision AlexNet. Our code is available at:urlhttp: / / allenai.org/plato/xnornet.
近年来,利用深度神经网络(DNN)创建人工智能的方法在教会计算机识别方面取得了巨大成功8,11,17,18和检测4,5,16对象,阅读文本,理解语音。7这种能力可能会对医疗保健、农业、航空航天、运输和制造业等行业产生重大影响,但迄今为止,DNN和卷积深度神经网络(CDNN)在现实世界的应用有限。虽然虚拟现实技术(Oculus的VR)取得了一些进展,13增强现实(HoloLens的AR),6而智能可穿戴设备的大多数应用都依赖于带宽有限或没有带宽的边缘设备,功耗低,出于隐私和安全原因,需要将数据存储在本地。这些限制与目前最先进的cnn和dcnn不一致,它们需要大量的计算能力,因此目前仅限于云计算。
基于cnn的识别系统需要大量的内存和计算能力。虽然它们在昂贵的基于gpu的机器上表现良好,但它们通常不适合用于手机和嵌入式电子设备等较小的设备。例如,AlexNet,11最著名的图像分类DNN架构之一,有61M参数(249MB内存),并执行1.5B的高精度操作来分类一张图像。对于更深层次的cnn,例如VGG,这些数字甚至更高17(见3.1节)。这些型号很快就会使手机等小型设备有限的存储、电池功率和计算能力超负荷。
没有找到条目