Google揭露自家TPU技术细节效能远胜CPU/GPU_上海微系统与信息技术研究所

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

上海微系统与信息技术研究所免费考研网/2018-05-05

Google为了进一步强化机器学习能力，已私下研发专用的张量处理器(TensorProcessingUnit,TPU)数年，并在2016年首度亮相，但当时并未透露太多细节。近期Google终于再提供更深入的信息，公布一份长达17页的测试报告，指出自家研发的TPU效能已达到绘图处理器(GPU)及中央处理器(CPU)的15及30倍，在机器学习测试中更优于英特尔(Interl)的Xeon处理器以及NVIDIA的GPU。
Google表示，此款TPU采用28奈米制程，工作频率为700MHz。原先设计目的在于加速自家的TensorFlow算法，主要的逻辑单元内含65,536组八位的乘积累加(Multiply-accumulate)单元以及一组24MByte的快取，每秒可进行92兆次运算(Tera-operations/second)。
GoogleTPU的负载以高级TensorFlow框架编写，可支持多层感知(MultilayerPerceptron,MLP)、卷积神经网络(ConvolutionalNeuralNetwork,CNN)和长短期记忆(Long-ShortTermMemory,LSTM)等人工智能技术，这些技术占数据中心95%的神经网络推理计算需求。

平均而言，相较于使用IntelHaswellCPU与NVIDIAK80GPU的系统，Google的TPU大约快上15～30倍，每瓦效能比(Performance/watt)更可达到30～80倍以上。此外，如果在TPU中使用GPU的GDDR5内存，处理速度还能再翻三倍，速度/功率比(TOPS/Watt)能达到GPU的70倍以及CPU的200倍。
数据缓冲区(DataBuffer)占了此款TPU的37%，而媒体访问控制(MediaAccessControl,MAC)则占了其中的30%。相较于NVIDIA的GPU，GoogleTPU的尺寸较小，却多出25倍的MAC，芯片内建的内存也比K80多出3.5倍。
GoogleTPU使用PCIeGen3x16总线，以及256Bytes内部数据路径。主CPU将加速器作为浮点处理器(FloatingPointProcessor)，透过PCIe总线下达指令。此款TPU也运用和GPU加速器相同的Tensorflow软件。研发人员固定一组核心驱动程序，并依照需求调整用户空间(UserSpace)驱动程序，以容纳不断变化的应用程序。
GoogleTPU目标不在于更高吞吐量(Throughput)，因而舍弃传统多功能处理器的许多元素，聚焦于将延迟时间压低在7毫秒之下。不过，Google自行研发的TPU也不是毫无缺点，其运算效能虽然优于英特尔和NVIDIA的处理器，但在轻载时的省电性能却不太理想。举例来说，同样在10%的负载条件之下，NVIDIAK80GPU的功耗是其最大功耗的66%，英特尔的Haswell处理器则是56%，但GoogleTPU却仍高达88%。Google也响应，由于只有短短15个月的设计时程，因此并未能将低功耗纳入此芯片设计的重点。

此次公布的报告指出，此款TPU所带来的数量级效能突破相当罕见，可望成为特定领域架构的原型，为未来新研发的处理器树立更高标准。但目前该TPU只使用于Google的数据中心，尚未进一步公布未来运用细节或是改善方向。

附件下载：

相关话题/设计 技术 数据 逻辑 工作

领限时大额优惠券,享本站正版考研考试资料!
优惠券领取后72小时内有效，10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材，产品类型包含电子书、题库、全套资料以及视频，无论您是考研复习、考证刷题，还是考前冲刺等，不同类型的产品可满足您学习上的不同需求。 ...
考试优惠券本站小编 Free壹佰分学习网 2022-09-19
硅太阳能电池光电转换率首超26%_上海微系统与信息技术研究所
英国《自然·能源》杂志在线发表的一项重要研究成果，报告了首个光转换效率突破26%的硅太阳能电池。经认证，这种电池实现了26.3%的转换效率，表明硅太阳能电池的效率达到了历史新高，更多效率更高的硅太阳能电池板也将在未来问世。据《自然·能源》文章估计，到2050年，光伏电力将承担全球一次能源需求的20% ...
上海微系统与信息技术研究所上海微系统与信息技术研究所免费考研网 2018-05-05
MIT开发新技术：让芯片自己组装自己轻松实现7纳米_上海微系统与信息技术研究所
近期，美国麻省理工学院（MIT）和芝加哥大学的研究人员开发了一种新技术，可以让芯片按照预定的设计和结构自行组装。　　这项技术有望进一步推进有着50年历史的“摩尔定律”，从而继续压缩计算设备的成本。该研究项目的重点是在芯片上自行组装线路，而这恰恰是芯片制造行业最大的挑战之一。　　有了这种技术，就不必像 ...
上海微系统与信息技术研究所上海微系统与信息技术研究所免费考研网 2018-05-05
IBM研发原子硬盘：体积缩小1000倍，银行卡大小能存3500万首歌_上海微系统与信息技术研究所
近日，IBM研究团队在《自然》杂志发明文章，宣布他们发明了「原子硬盘」，只用一粒原子就能存储1bit数据，这意味着存储数据的硬盘可以因此而缩小1000倍。首先我们要明白，硬盘通过磁头磁化磁层上的介质来存储数据，目前的硬盘技术每存储1bit的数据需要10万粒原子，这已经是目前为止最先进的技术了。而IB ...
上海微系统与信息技术研究所上海微系统与信息技术研究所免费考研网 2018-05-05
连线：人工智能的未来在于神经形态芯片，将取代CPU_上海微系统与信息技术研究所
《连线》杂志近日撰文指出，神经形态芯片（neuromorphics）被设计专门用于模仿人类大脑，他们可能很快取代CPU。以下为文章内容摘要：类似于苹果Siri这样的人工智能服务，都需要把用户问题传输到遥远的数据中心，然后通过数据中心的运算再传回答复。此类人工智能服务需要依托云计算，是因为目前的电子设 ...
上海微系统与信息技术研究所上海微系统与信息技术研究所免费考研网 2018-05-05
美国科学家研发光伏窗户_上海微系统与信息技术研究所
据报道，美国明尼苏达大学的科学家团队发明了一种基于发光太阳能集中器(LSC)的光伏窗户，它充分利用硅纳米粒子的光学特性，只需在玻璃上植入硅纳米粒子，就能实现太阳能发电。　　能吸收太阳能的窗户，也叫光伏窗户，是可再生能源技术的前沿领域。光伏窗户能充分挖掘建筑的潜力，在不破坏建筑美感的同时，还能满足人们 ...
上海微系统与信息技术研究所上海微系统与信息技术研究所免费考研网 2018-05-05
半导体激光块为激光器系统增效_上海微系统与信息技术研究所
由俄罗斯、希腊和哈萨克斯坦科学家组成的国际研究团队开发出一种新方法，能大大提高医学应用等领域激光器系统的效率。有关研究刊登在近日出版的《自然·科学报告》杂志上。　　据俄罗斯国家研究型工艺技术大学（NUSTMISIS）消息，该校科研小组与希腊和哈萨克斯坦的同行们合作，制造出一种相连的半导体纳米激光块， ...
上海微系统与信息技术研究所上海微系统与信息技术研究所免费考研网 2018-05-05
高通、英特尔先后发布千兆基带打响5G芯战_上海微系统与信息技术研究所
一年一度的MWC世界移动通信大会，开始驶入5G商用前哨，英特尔高通双双推出最新制式的千兆LTE基带Modem，中兴将首度发布实际千兆下载速率达到1Gbps的智能手机，两颗千兆LTE基带和一部千兆手机，5G芯战打响。　　全球两大Modem芯片供应商高通（Qualcomm）以及英特尔（Intel），在2 ...
上海微系统与信息技术研究所上海微系统与信息技术研究所免费考研网 2018-05-05
国产5nm碳纳米管研究新突破，摩尔定律有救了_上海微系统与信息技术研究所
集成电路发展的基本方式在于晶体管的尺寸缩减，从而性能和集成度，得到更快功能更复杂的芯片。目前主流CMOS技术即将发展到10纳米技术节点，后续发展将受到来自物理规律和制造成本的限制，很难继续提升，“摩尔定律”可能面临终结。20多年来，科学界和产业界一直在探索各种新材料和新原理的晶体管技术，以望替代硅基 ...
上海微系统与信息技术研究所上海微系统与信息技术研究所免费考研网 2018-05-05
中国科大二维材料系列研究取得新进展_上海微系统与信息技术研究所
近日，中国科学技术大学合肥微尺度物质科学国家实验室国际功能材料量子设计中心在二维材料系列研究中取得新进展，理论上预言了在GaN（001）衬底上可外延生长单层蓝磷，并提出非常规的“半层－半层”生长机制。该研究成果以HalfLayerByHalfLayerGrowthofaBluePhosphorene ...
上海微系统与信息技术研究所上海微系统与信息技术研究所免费考研网 2018-05-05
美国科学家研制出3个原子宽的极细电线_上海微系统与信息技术研究所
据物理学网站报道，目前，美国斯坦福大学和能源部SLAC国家加速器实验室科学家发现一种使用钻石的新方法，将最小的钻石装配成极细电线，只有3个原子的宽度。通过选取不同类型原子，并将它们像乐高积木一样结合在一起，这一最新技术可潜在用于制造具有广泛应用的微型电线，其中包括：能够发电的织物材料、光电设备、以及 ...
上海微系统与信息技术研究所上海微系统与信息技术研究所免费考研网 2018-05-05