首页 > 硬件 > 详细

亚马逊杀入AI芯片大战,Alexa的野心是当家庭大脑

发布时间:2018-02-14 22:40:05
阅读:43     评论:0     收藏:0      [点我收藏+]

  文/新智元

  新智元导读:2 月 12 日,The Information 的报告证实,亚马逊已经开始设计制造 AI 芯片,以提升 Alexa 语音助理的质量,为 Echo 设备提供支持。此举紧随苹果和谷歌的步伐,被视为亚马逊顺势而为的厚积薄发,至此,繁盛的 AI 芯片市场,百家争鸣,鹿死谁手?

  2 月 12 日,根据 The Information 的一份报告,亚马逊已经开始设计制造 AI 芯片,专用 AI 芯片也可以帮助 Alexa 减少对整体远程服务器的依赖,为 Echo 设备提供支持。 

  亚马逊希望 Alexa 能够成为家中的大脑,控制门锁,安全摄像头和烤箱等家用电器。 如果不需要互联网,那么与这些设备的连接将更安全可靠。

  该报告称,亚马逊希望在智能家居硬件市场和面向消费者的人工智能产品领域保持竞争力,并已经拥有近 450 名芯片专业员工,这要归功于亚马逊发力招聘和收购。

  在过去几年中,2015 年,亚马逊以 3.5 亿美元收购以色列芯片制造商 Annapurna Labs,以及 17 年年底收购安全摄像头制造商 Blink。Blink 的芯片可以降低生产成本并延长其他产品的电池寿命,从亚马逊的云端摄像头开始,并扩展到 Echo 扬声器系列。

  此举紧随苹果和谷歌的步伐,后两家公司已经开发并部署了各种规模的定制 AI 硬件。人工智能任务由于其计算密集程度高,通常需要为设备本身定制设计芯片,甚至需要为数据中心定制设计服务器,这些服务器通常从云端进行人工智能算法的训练。

  这一消息确实对 Nvidia 和英特尔等公司的业务构成风险,这两家公司都将其大部分芯片制造专业技术转移到了 AI 以及新兴领域,并通过为苹果、亚马逊等公司设计和制造芯片来赚钱。

  亚马逊收购以色列芯片公司及摄像头 Blink, 发力 AI 芯片后劲十足

  亚马逊计划开发自己的 AI 芯片,以便在其不断扩展的 Echo 产品线中使用 Alexa 驱动的产品可以进行更多的计算处理,而不必与云进行通信,这一过程可以提高运算速度。

  苹果和谷歌都开始了类似的转变。苹果已经开始开发自己的 iPhone 芯片,比如该设备的图形处理器和电源管理单元,并因此切断了长期供应商。关于人工智能,苹果公司设计了一种新的“神经引擎”,作为其 A11 仿生芯片的一部分,它在处理机器学习算法的设备上运行,为 Face ID 和 ARKit 应用程序提供帮助。

  另一方面,谷歌已经开发了自己的 AI 硬件多年,首先是定制 ASIC 处理器,为其 TensorFlow AI 培训平台定制设计的 TPU(去年升级为第二版),展现机器学习任务方面的优势。PU 是 Google 子公司 DeepMind AlphaGo 系统的基础,它帮助 Google 保持与同样设计自己 AI 培训服务器硬件的 Facebook 的竞争力。

  在过去的两年左右时间里,谷歌已将其知识转移到了消费者领域,开始开发自定义的 AI 芯片以支持相机设备,还在 Pixel 2 中设计了图像处理器。

  繁盛的 AI 芯片市场,百家争鸣,鹿死谁手?

  通用芯片并不能很好地适应深度学习算法的要求,效率低,功耗大,成本高。各种神经网络算法需要专用芯片来保证其运行效率。人工智能的浪潮,催生了 AI 专用芯片的大爆发。

  无论是云端的运算还是移动端的运算,都需要专门针对 AI 算法设计的芯片,但这二者对 AI 专用芯片的要求不同。云端要求 AI 芯片适应多种神经网络架构,同时能进行高精度浮点运算,峰值性能至少要达到 Tflops(每秒执行 10^12 次浮点数运算)级别,对功耗没有严苛要求;支持阵列式结构以进一步提高性能。

  移动端 AI 芯片对设计的要求截然不同。一个根本的要求是控制功耗,这就需要使用一些办法(如网络压缩)来提升计算能效,同时尽可能少地降低计算性能和计算精度的损失。

  各个厂商纷纷在这两个方向上发力 AI 芯片的研发,当然云端和移动端也无法截然分开。比如寒武纪,此前研发的寒武纪深度学习处理器是面向大规模神经网络和多种机器学习算法的,而 2016 年推出的寒武纪 1A 处理器(Cambricon-1A)则是面向智能手机、安防监控、可穿戴设备、无人机和智能驾驶等各类终端设备的。

  在云端,除了上文的英伟达,英特尔在收购 Altera 之后推出了基于 FPGA 的专用深度学习加速卡,更收购了 Nervana,瞄准为深度学习专门定做和优化的 ASIC 芯片;收购了 Movidius,其高性能视觉处理芯片将补足英特尔在移动端 AI 芯片的缺失。另外还有 IBM 的类脑芯片 TrueNorth。当然还有本文开头讲到的谷歌 TPU。日前,百度又正式推出了 XPU,它是基于百度 FPGA 的新一代 AI 处理架构,拥有 GPU 的通用性和 FPGA 的高效率和低能耗,对百度的深度学习平台 PaddlePaddle 做了高度的优化和加速。

  在移动端,谷歌、苹果和三星等都在用专门的 AI 芯片构建手机。微软正在为增强现实耳机专门设计这样的芯片。同时从科技巨头谷歌到传统车厂丰田,所有人都在进行自动驾驶汽车的研发,正需要能够在移动端良好运行的 AI 芯片。

  比如擅长底层架构改进的苹果,其最新发布的 Apple X 采用了定制的芯片来处理人工智能工作负载。这是一个双核的“A11 生物神经网络引擎”(A11 bionic neural engine)芯片,每秒运算次数最高可达 6000 亿次。该芯片赋能的最重要的事情就是使 Face ID 身份认证功能能够快速识别人脸,从而解锁 iPhone X 或进行购物。

  芯片走向定制化,以满足 AI 软件的需求,在行业中已经变成一股新的大趋势。谷歌已经设计了两代芯片来处理数据中心的 AI 计算工作负载。 微软也为未来版本的 HoloLens 混合现实头盔开发了一款 AI 芯片。在 iPhone 上安装新的专用芯片意味着主芯片的工作量将会减少,从而提高电池寿命。 否则,例如,通过手机摄像头进行物体识别同时进行视频录制时,可能会迅速地将电池消耗完。此外,在不久的将来, iPhone 以外的更多移动设备都可能包含针对 AI 的处理器。

  又如华为。在德国 IFA 2017 举办期间,华为正式发布全球首款人工智能移动计算平台麒麟 970。华为方面表示,这一带有强大 AI 计算力的手机端移动计算平台,是业界首颗带有独立 NPU(Neural Network Processing Unit)专用硬件处理单元的手机芯片。 创新性集成 NPU 专用硬件处理单元,创新设计了 HiAI 移动计算架构,其 AI 性能密度大幅优于 CPU 和 GPU。相较于四个 Cortex-A73 核心,处理相同 AI 任务,新的异构计算架构拥有约 50 倍能效和 25 倍性能优势,图像识别速度可达到约 2000 张/分钟。麒麟 970 高性能 8 核 CPU,对比上一代能效提高 20%。率先商用 Mali G72 12-Core GPU,与上一代相比,图形处理性能提升 20%,能效提升 50%,可以更长时间支持 3D 大型游戏的流畅运行。

  此外,中国也有几家公司在进行 AI 芯片的研发。此前腾讯发布的 AI 产业报告指出,AI 芯片作为产业核心,也是技术要求和附加值最高的环节,产业价值和战略地位远远大于应用层创新。而在这一点上,中国和美国的差距还很大。报告显示,从基础层的芯片企业数量来看,中国拥有 14 家,美国 33 家,中国仅为美国的 42%。

  国内在 AI 芯片研发表现突出的企业,除上文介绍的寒武纪外,还有推出具备深度学习人工智能的嵌入式视频采集压缩编码系统级芯片“星光智能一号”的中星微电子,致力于软硬件一体化解决方案的地平线机器人,以及打造了“深度学习处理单元”(Deep Processing Unit,DPU)的深鉴科技。深鉴科技的目标是以 ASIC 级别的功耗,达到优于 GPU 的性能,目前第一批产品基于 FPGA 平台。

  美国国防部研究部门 Darpa 的项目经理吉尔·普拉特(Gill Pratt)表示,这种向专业芯片和新的计算机架构转型的趋势可能导致人工智能芯片的“寒武纪爆炸”。正如他所看到的那样,将计算量扩展到大量微小的低功耗芯片,以使机器可以像人类的大脑一样运行,这样就有效地利用了能量。

(0)
(0)
 
举报
评论 一句话评论(0
0条  
登录后才能评论!
© 2014 bubuko.com 版权所有 鲁ICP备09046678号-4
打开技术之扣,分享程序人生!
             

鲁公网安备 37021202000002号