阆中| 武都| 卫辉| 芷江| 镇远| 惠州| 平顺| 广河| 襄阳| 交口| 临夏市| 册亨| 零陵| 陆丰| 梅河口| 会同| 武威| 乐亭| 沁水| 双桥| 金寨| 六安| 伊金霍洛旗| 金沙| 勉县| 灵武| 龙湾| 桦甸| 枣强| 桃园| 宜阳| 且末| 毕节| 营山| 卢氏| 太白| 邗江| 安福| 乌马河| 木里| 乌马河| 广汉| 溧水| 太康| 万山| 陈巴尔虎旗| 延庆| 儋州| 海城| 垫江| 瓦房店| 藤县| 景洪| 鄂尔多斯| 牡丹江| 内黄| 兰西| 达县| 息县| 溧阳| 保靖| 吴川| 弓长岭| 陆丰| 阳曲| 关岭| 柳城| 邛崃| 绥宁| 云霄| 昌江| 温泉| 囊谦| 霍邱| 阿勒泰| 龙南| 灌阳| 舞阳| 甘洛| 长顺| 聂拉木| 府谷| 洪江| 红原| 凌源| 瑞安| 绥棱| 三门峡| 全州| 罗甸| 密山| 交口| 福清| 突泉| 肥城| 太谷| 东明| 拉萨| 桃源| 阿拉善左旗| 彰化| 北宁| 宜宾市| 百色| 张家港| 哈巴河| 讷河| 红河| 镇宁| 涟水| 巴马| 罗田| 安龙| 徽州| 阿克苏| 曲阜| 珠海| 大关| 久治| 黑龙江| 屏山| 孟津| 沙河| 民勤| 临武| 嘉定| 玉门| 莫力达瓦| 望谟| 湟中| 永和| 海林| 松江| 芜湖市| 嘉义县| 威县| 雁山| 鞍山| 呈贡| 邹城| 通山| 四会| 丰宁| 新河| 靖安| 余江| 洛阳| 永平| 丰城| 延津| 巴南| 井研| 双柏| 商丘| 黎平| 花垣| 法库| 布拖| 朝天| 孝义| 上饶县| 连城| 大理| 玛沁| 崇仁| 尼玛| 什邡| 台山| 休宁| 苍南| 东港| 抚顺市| 太白| 双牌| 陵水| 东港| 天水| 阜南| 石景山| 汉南| 平泉| 英山| 阜宁| 农安| 宣汉| 北川| 珙县| 甘棠镇| 醴陵| 鲁甸| 荔浦| 鹤壁| 册亨| 顺德| 临桂| 鼎湖| 新蔡| 克山| 乌拉特前旗| 宿州| 昭平| 大同区| 马鞍山| 昭平| 大邑| 范县| 方城| 周宁| 永济| 南靖| 防城区| 太白| 奉节| 饶河| 堆龙德庆| 昌乐| 泰安| 广饶| 乐至| 清苑| 永年| 常州| 酒泉| 乳源| 许昌| 通江| 项城| 陵川| 浚县| 常德| 沅江| 南木林| 南阳| 城步| 蒲江| 武陵源| 皋兰| 左贡| 承德市| 马龙| 临武| 加查| 广汉| 竹山| 塔什库尔干| 边坝| 新泰| 日土| 桂阳| 吴中| 嘉禾| 顺义| 贡觉| 梁山| 沙洋| 松江| 图们| 天全| 田林| 托克托| 雁山| 沈阳| 恩平| 明光| 户籍网

9岁病童拒绝治疗省下钱救妈妈 身体离奇萎缩16厘米

2018-12-17 02:50 来源:磐安新闻网

  9岁病童拒绝治疗省下钱救妈妈 身体离奇萎缩16厘米

  牛宝宝电影网而个人房贷增速去年已经回落,央行数据显示,2017年12月末,个人住房贷款余额同比增速回落个百分点。《中国经济周刊》2018年第7、8期封面

共享财经创始人史青伟则表示,IFO是过去两个月币圈产生的一个新玩法,大多数IFO产生的项目没有投资价值。1月24日,辽宁大连金石滩海域,众多渔船被海冰围困冻在海面上。

  京东金融B2B2C加速落地核心能力全面开放作为一家定位于服务金融机构的科技公司,京东金融此次发布北斗七星,意味着其B2B2C商业模式的落地不仅能够为银行提供数字化服务,帮助银行实现人、货、场的贯通,而且能够为银行带来场景和客户,特别是银行想要接触到的大量移动互联网时代下成长起来的95后、00后。11时25分,出警人员到达网点,将嫌疑人带走调查。

  但是仅仅通过几人团队发布一个白皮书,甚至有些连白皮书都没有就可以启动融资活动,这样的运行方式为投资者埋下了极大的风险,外界也因此对于ICO的合法性一直有争议。党的十九大将增强绿水青山就是金山银山的意识实行最严格的生态环境保护制度写进了党章。

这不仅对学生是一种不尊重,对那些被迫教学的老师又何尝不是一种负累?法定的休息时间,被随意侵占,也是对法规的蔑视。

  薯类主要包括甘薯、马铃薯、山药、芋类等,低脂、高钾,富含纤维素和果胶,可促进肠道蠕动,预防便秘。

  若分叉成功,将产生新的分裂币SBTC,比特币原来持有者将一比一赠送,其总量是2121万,其中21万为分叉预挖,归分叉团队基金会管理,主要用于激励早期开发者投资生态建设以及基金会运营。这种可预测的威胁,只要通过升级或研发相应的技术和防御方式,基本上可以被解决。

  此外,还研发了4种45元的素食套餐,有宫保鸡丁黑椒牛柳鱼香肉丝番茄鱼排。

  在物美华天店超市礼品区,一款百草味年的味道礼盒正面和侧面分别有两个价签,一个元,一个248元。《中国经济周刊》2018年第7、8期封面

  从预订数据来看,今年乘火车的人显著增长。

  携程旅游专家表示,这种选择大的中转站进行中转,分段购票进行换乘,火车-汽车进行联运等多种交通工具叠加使用的曲线回家方式虽然看上去有些繁琐,但对于回乡心切又抢不到票的大多数人而言不失为一种靠谱的选择。

  学生通过制造舆论、引发关注路径维权,而非走学校办学、管理的正常机制与程序,本就值得寻思:事实上,若在涉事高中,家长委员会等组织能进行自我教育、自我管理、参与学校办学监督的学生会,学生话语能得以保障,那这些明显违规的规定在制约之下,恐怕也不会轻易脱缰出笼。现在的情况不是一些IPO公司争着上市,而是在寻找各种借口推迟上会进程。

  秒速赛车 户籍网 邮箱大全

  9岁病童拒绝治疗省下钱救妈妈 身体离奇萎缩16厘米

 
责编:
您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
雷锋网 读懂智能&未来
人工智能 正文
发私信给程弢
发送

0

9岁病童拒绝治疗省下钱救妈妈 身体离奇萎缩16厘米

本文作者:程弢 2018-12-17 14:03
导语:从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。
邮箱大全 事由:美国致命流感催生新网红近日,《华尔街日报》一篇关于念慈菴川贝枇杷膏的报道让其成为了最新网红。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

在谷歌发布TPU一年后,这款机器学习定制芯片的神秘面纱终于被揭开了。

昨日,谷歌资深硬件工程师Norman Jouppi刊文表示,谷歌的专用机器学习芯片TPU处理速度要比GPU和CPU快15-30倍(和TPU对比的是英特尔Haswell CPU以及Nvidia Tesla K80 GPU),而在能效上,TPU更是提升了30到80倍。

从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。

据雷锋网(公众号:雷锋网)了解,早在四年前,谷歌内部就开始使用消耗大量计算资源的深度学习模型,这对CPU、GPU组合而言是一个巨大的挑战,谷歌深知如果基于现有硬件,他们将不得不将数据中心数量翻一番来支持这些复杂的计算任务。

所以谷歌开始研发一种新的架构,Jouppi称之为“下一个平台”。Jouppi曾是MIPS处理器的首席架构师之一,他开创了内存系统中的新技术。三年前他加入谷歌的时候,公司上下正在用CPU、GPU混合架构上来进行深度学习的训练。

Jouppi表示,谷歌的硬件工程团队在转向定制ASIC之前,早期还曾用FPGA来解决廉价、高效和高性能推理的问题。但他指出,FPGA的性能和每瓦性能相比ASIC都有很大的差距。他解释说,“TPU可以像CPU或GPU一样可编程,它可以在不同的网络(卷积神经网络,LSTM模型和大规模完全连接的模型)上执行CISC指令,而不是为某个专用的神经网络模型设计的。一言以蔽之,TPU兼具了CPU和ASIC的有点,它不仅是可编程的,而且比CPU、GPU和FPGA拥有更高的效率和更低的能耗。

TPU的内部架构

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

该图显示了TPU上的内部结构,除了外挂的DDR3内存,左侧是主机界面。指令从主机发送到队列中(没有循环)。这些激活控制逻辑可以根据指令多次运行相同的指令。

TPU并非一款复杂的硬件,它看起来像是雷达应用的信号处理引擎,而不是标准的X86衍生架构。Jouppi说,尽管它有众多的矩阵乘法单元,但是它GPU更精于浮点单元的协处理。另外,需要注意的是,TPU没有任何存储的程序,它可以直接从主机发送指令。

TPU上的DRAM作为一个单元并行运行,因为需要获取更多的权重以馈送到矩阵乘法单元(算下来,吞吐量达到了64,000)。Jouppi并没有提到是他们是如何缩放(systolic)数据流的,但他表示,使用主机软件加速器都将成为瓶颈。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

256×256阵列缩放数据流引擎,经过矩阵乘法积累后实现非线性输出

从第二张图片可以看出,TPU有两个内存单元,以及一个用于模型中参数的外部DDR3 DRAM。参数进来后,可从顶部加载到矩阵乘法单元中。同时,可以从左边加载激活(或从“神经元”输出)。那些以收缩的方式进入矩阵单元以产生矩阵乘法,它可以在每个周期中进行64,000次累加。

毋庸置疑,谷歌可能使用了一些新的技巧和技术来加快TPU的性能和效率。例如,使用高带宽内存或混合3D内存。然而,谷歌的问题在于保持分布式硬件的一致性。

TPU对比Haswell处理器

在和英特尔“Haswell”Xeon E5 v3处理器来的对比中,我们可以看到,TPU各方面的表现都要强于前者。

在Google的测试中,使用64位浮点数学运算器的18核心运行在2.3 GHz的Haswell Xeon E5-2699 v3处理器能够处理每秒1.3 TOPS的运算,并提供51GB/秒的内存带宽;Haswell芯片功耗为145瓦,其系统(拥有256 GB内存)满载时消耗455瓦特。

相比之下,TPU使用8位整数数学运算器,拥有256GB的主机内存以及32GB的内存,能够实现34GB/秒的内存带宽,处理速度高达92 TOPS ,这比Haswell提升了71倍,此外,TPU服务器的热功率只有384瓦。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

除此之外,谷歌还测试了CPU、GPU和TPU处理不同批量大小的每秒推断的吞吐量。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

如上图所示,在小批量任务中(16),Haswell CPU的响应时间接近7毫秒,其每秒提供5482次推断(IPS),其可以实现的最大批量任务(64)每秒则可以完成13194次推断,但其响应时间为21.3毫秒。相比之下,TPU可以做到批量大小为200,而响应时间低于7毫秒,并提供225000个IPS运行推理基准,是其峰值性能的80%,当批量大小为250,响应时间为10毫秒。

不过需要注意的是,谷歌所测试的Haswell Xeon处理器似乎也不能完全说明问题,英特尔Broadwell Xeon E5 v4处理器和最新的“Skylake”Xeon E5,每核心时钟(IPC)的指令比这款处理器提升了约5%。在Skylake是28核,而Haswell为18核,所以Xeon的总体吞吐量可能会上升80%。当然,这样的提升与TPU相比仍有差距。

最后雷锋网需要强调的是,TPU是一个推理芯片,它并非是要取代GPU,可以确定的是,TPU与CPU一起使用对训练分析更加有益。但对于CPU制造商而言,如何研发出像ASIC一样兼顾性能和能效的芯片是现在以及未来要做的。

可以确定的是,谷歌已经逐渐在自己的数据中心部署TPU,但是上述测试数据只是理论结果,实际应用表现如何?我们还不得而知。

Via nextplatform,雷锋网编译

雷锋网版权文章,未经授权禁止转载。详情见转载须知

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?
分享:
相关文章

文章点评:

表情

略懂技术的小编

关注一切有未来感的产品及技术!
当月热门文章
最新文章
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
秒速赛车 秒速赛车 秒速赛车 秒速赛车 邮箱大全 牛宝宝电影网 户籍网