发布时间:2017/4/10 12:31:10 访问次数:5475
美国时间4月5日,谷歌发表官方博客,详细介绍了TPU的方方面面。相关论文更是配以彩色的TPU模块框图、TPU芯片布局图、TPU印制电路......等等,可谓图文并茂,称其为“设计教程”也不为过。不出意料,这之后将会涌现一大批仿效者。
论文中还给出TPU与其它芯片的性能对比图,称“TPU处理速度比当前GPU和CPU要快15到30倍”,有人赞叹TPU的惊人性能,但也有人对此种“比较”表示质疑,因其拿来的比较对象并非市场里性能最好的。
论文有亮点?争议点在哪里?谷歌公布TPU细节会对业界产生什么影响?http://www.xinyichendz.com
谷歌为什么要造TPU?
《数据中心的TPU性能分析》(In-Datacenter Performance Analysis of a Tensor Processing Unit),共同作者多达70人,领衔的第一作者是硬件大牛Norman Jouppi。
Jouppi在接受外媒Wired采访时说,谷歌一开始曾经考虑要用FPGA,但是后来经过实验发现,这种芯片无法提供理想中的速度。
将目光放到ASIC(专用集成电路,一旦设计制造完成后电路就固定了,无法再改变)上,TPU就是一种ASIC。在接受外媒The Next Platform采访时,Jouppi表示TPU可以适用于现存的各种神经网络模型,从图像识别的CNN到语音识别的LSTM,都适用。
“TPU跟CPU或GPU一样是可编程的。TPU 不是专为某一个神经网络模型设计的;TPU 能在多种网络(卷积网络、LSTM模型和大规模全连接的神经网络模型)上执行CISC 指令。”
谷歌已经使用TPU已经两年时间,将其应用在各种领域的任务里,包括:谷歌图像搜索(Google Image Search)、谷歌照片(Google Photo)、谷歌云视觉API(Google Cloud Vision API)、谷歌翻译以及AlphaGo的围棋系统中。
TPU 是一款推理芯片,并不是用作训练。根据英伟达首席科学家 William J. Dally 的说法,在深度学习领域,主要有三种运算方式:http://icfxr88.51dzw.com/
数据中心的训练(用于训练模型,计算机往往需要以较高的精确度运算,一般使用32位浮点运算)
数据中心的推理(在云端进行实时连续运算,精确度可以适当牺牲,换取更快的速度和更低的能耗)
嵌入式设备的推理(这类应用的核心是低能耗的 ASICs)
所以TPU针对的,就是第二种运算方式:数据中心的推理。而对于推理运算而言,重要的指标就是快速和低能耗。在谷歌博客里,Jouppi突出强调了TPU以下性能:
我们产品的人工智能负载,主要利用神经网络的推理功能,其 TPU 处理速度比当前 GPU 和 CPU 要快15到30倍。
较之传统芯片,TPU 也更加节能,功耗效率(TOPS/Watt)上提升了30到80倍。http://www.ruixinshengkj.com
驱动这些应用的神经网络只要求少量的代码,少的惊人:仅100到 1500 行。代码以 TensorFlow 为基础。
70 多个作者对这篇文章有贡献。很多人参与了设计、证实、实施以及布局类似这样的系统软硬件。
Google通过TPU项目对深度学习硬件加速作出了有益的尝试,未来Google未来一定会持续更新TPU的架构。
谷歌的TPU细节一览无余,然而TPU是为了TensorFlow定制的,对于一些AI芯片厂商来说,或许能从这篇论文里获得一些灵感,但一味仿效可能得不偿失。
TPU并不是全能的,只是用于数据中心的推理阶段。深度学习模型的前期训练,也还是要依靠高精度的GPU。而且TPU通用性差,谷歌也曾在多种场合表示自己并不会售卖TPU。所以对于英伟达一类的通用芯片厂商来说,并没有直接的竞争威胁。然而,谷歌带头追求特定领域应用的极致效率,对于很多走定制化路线的AI芯片厂商来说,这是一种强大的鼓舞。
陈天石和姚颂两位CEO各自带领的AI芯片公司,在进行不同种类的AI芯片研发和商用工作,寒武纪科技偏通用,深鉴科技偏行业定制。两位CEO也都彼此惺惺相惜,就像陈天石曾经对姚颂说的那样,这个市场需要多种芯片的,有偏通用,也有更专用更注重特定领域的,共同进步的同时未来也一定有机会合作。
如今的AI芯片产业处在一个“大航海时代”,真正的宝藏,需要更多的人去开拓。我们对于谷歌的TPU并不陌生,正是它支撑了AlphaGo强大快速的运算力,但谷歌一直未曾披露其细节,使得TPU一直保有神秘感。
本文来源:雷锋网http://www.lxylmw.com
服务热线:+86-0755-83030533 13751165337 传真:0755-83035052 投诉电话: 0755-83030533
深圳市碧威特网络技术有限公司 公网安备44030402001427