谷歌不是对手,英特尔要用AI一统芯片江湖!

日期:2018-11-20 20:11:54 来源:互联网 编辑:小狐 阅读人数:482

英伟达在AI领域的生态很强大,但英特尔CPU在基础设施里有更雄厚的基础。芯片创业公司要活下去很难。AI时代,仍将由英特尔来主导。”

尽管外界对英特尔10 纳米芯片难产” 和英特尔 Nervana 神经网络处理器 NNP 发布时间再延迟充满了焦灼的期待”,但AI 已是英特尔绝不能输的”。英特尔全球副兼人工智能产品事业部总经理 Naveen Rao 接受新智元采访时如是说。

收购Nervana Systems—— 这个 Naveen Rao 在 2014 年与人联合成立的深度学习芯片初创公司,成为英特尔全面拥抱人工智能的个重要节点。

如今,英特尔上下全面意识到了 AI 的重要性,Naveen率领的包括 Nervana 团队在内的人工智能产品事业部,推进 Nervana 神经网络处理器之外,还为英特尔其他所有部门技术支持。最近两年英特尔至强处理器的改进也基本来自于我们组的工作。” Naveen 说。

但把钥匙开不了所有的锁。Naveen 表示,不同的计算需要不同的架构,但任何计算都离不开CPU。市面上已经安装并投入使用的 CPU 是英特尔的巨大优势。在这些基础设施中,英特尔的 CPU 占了近九成,眼下最火热的人工智能推理,也有近 90% 是在英特尔的芯片上完成。

英伟达占据了很大的 AI 训练市场,也在为 GPU 添加更多的AI元素,这是很正确的做法,”Naveen说:但我们也将对 AI 来说最好的 CPU。”

CPU 加 GPU 再加各种 AI 加速器很好,如果客户需要,把它们全部封装进个芯片里也很好,” Naveen 说:两者在我看来是样的。”

换言之,AI时代,仍将由英特尔来主导。

谷歌TPU不是英特尔的对手

2018 年 5 月,谷歌在 I/O 大会上发布了第三代 TPU,由 TPU 3.0 组成的 TPUPod 运算阵列,性能相比上代提升了 8 倍,每秒运算性能 远超” 100PFLOPS,也即 10 亿亿次——中国引以为傲的超级计算机神威·太湖之光的 Linpack 浮点性能是 9.3 亿亿次——为了给它降温,谷歌第次在其数据中心引入了液冷。

谷歌不是对手,英特尔要用AI一统芯片江湖!

为了给 TPU 3.0 Pod 运算阵列降温,谷歌第次在其数据中心引入了液冷

除了谷歌,微软、亚马逊等巨头都在研发自己的 AI 芯片。国内,大公司自己造芯的声势更加明显:百度的昆仑”,阿里的平头哥”,华为的昇腾”,个比个浩大。

不管怎么看,形势对英特尔来说都很不利。

但 Naveen 却说,除了TPU(还仅供谷歌内部使用)和GPU,你还能再说出款已经量产的 AI 训练芯片吗?”

英特尔不与我们的客户相竞争,” Naveen 说:谷歌、微软等大公司自己做芯片,归根结底是由于我们芯片厂商没有给他们适合的产品,因此,短期看他们自己做芯片更省钱,更有效率。我不认为他们会芯片,也不认为他们想要进入芯片行业。等到英特尔研发出工艺更好、价钱更便宜的芯片时——芯片制造工艺是英特尔的核心价值所在——大公司自然就会重新使用英特尔的产品,不再自己做芯片。”

而且,英特尔的产品线可是从云到端全面覆盖的。

佩服英伟达十年建生态,但英特尔要统江湖

至于英伟达,Naveen认为,英伟达在个正确的时机做出了正确的选择,大力投入深度学习,现在也在不断为GPU 增加更多的AI元素”,这是很正确的做法”。

Naveen 表示,英特尔近年来对 AI 的认识也有了很大转变。见证了人工智能几起几落的英特尔,在2014年之前并不认为这次深度学习真的能掀起些什么。

收购 Naverna 代表着英特尔对人工智能态度的转变,从不重要”变为非要不可”,Nervana 团队现在为英特尔的所有部门,从CPU到FPGA再到物联网……技术支持。实际上,至强处理器近两年来的性能提升基本上都来自我们组的贡献。”Naveen说。

抢占先机的英伟达,市值已经翻了几十番,GPU在 AI 训练市场拥有毋庸置疑的领先地位。但真正成就英伟达的,是其配套软件生态 CUDA。

谷歌不是对手,英特尔要用AI一统芯片江湖!

英伟达最初在2005年推出CUDA,这也就是说他们花了十年时间才让 CUDA 能够使用,”Naveen说,没有人能夜之间颠覆这种优势,要让款硬件取得成功,相关的软件生态至关重要,而要打造这样套生态,非常、非常地难”。

面对英伟达在人工智能领域凭借 GPU+CUDA 构建起的强大生态,Naveen 表示,英特尔的应对之道是他们两年前便开始布局的 nGRAPH——如今,有各种各样的机器学习框架,而这些框架上的模型又需要在不同的硬件上面运行。以前做深度学习和人工智能运算,大家主要用 GPU 来加速,训练直接在框架里调用英伟达的 CUDA 库,推理则是用英伟达的 TensorRT。现在硬件的选择变多了,大家也想做更多的优化,框架编译器”(compiler)的概念也随之兴起。

最初是谷歌的XLA(Accelerated Linear Algebra/加速线性代数),但XLA是用于 TensorFlow 的编译器,针对的也自然是谷歌的 TPU。类似的是 Facebook 的 Glow,实际上现在每家公司都在不同的层级上构建属于自己的中间表示,好让编程语言能够适应更多的硬件组合。

英特尔要做的事情是,不与谷歌、Facebook、百度等公司直接竞争,因为他们都是我们的客户”,nGRAPH 能支持所有的框架,无论你使用哪种框架,新建个框架也行,我们都乐意支持”。

谷歌不是对手,英特尔要用AI一统芯片江湖!

英特尔的框架编译器nGRAPH,能将不同框架上运行的模型针对各种硬件进行优化,包括英伟达的GPU和其他硬件。

但Naveen也承认,业界现在确实有在所有这些中间表示中确定个标准”的意向,因为标准就是标准,有了大家都方便,而英特尔也不讳言想让nGRAPH成为这个标准。

我们比所有人都领先,目前最接近的就是谷歌的XLA。”

英特尔10nm:台积电的7nm 芯片

但是 2019 年底英特尔预计推出的是10纳米”芯片,对手台积电、三星早就量产了10nm,高通骁龙835已经在市场上整整卖了年,台积电今年7纳米”芯片量产成功,明年更是已经确定要上EUV 5纳米的研发。

但这里有个陷阱”:般人可能都认为10nm肯定比14nm先进,7nm也当然比10nm要好。实际上,7nm也好,10nm也罢,这些线宽”仅仅代表工艺节点,但要衡量这个工艺的好坏,栅极间距(gate pitch)、逻辑单元高度(Logic Cell Height)、鳍片间距(fin pitch)、最小金属间距(Min Metal Pith)等关键技术参数更为重要。

谷歌不是对手,英特尔要用AI一统芯片江湖!

英特尔22nm和14nm工艺比较:鳍片间距提升

2017年9月,英特尔主动公布出台积电、三星和自家10nm工艺相关技术参数指标,由下图可见,英特尔的10nm光刻技术制造出来的鳍片、栅极间隔更小。因此,在晶体管密度上几乎是台积电、三星的两倍。

谷歌不是对手,英特尔要用AI一统芯片江湖!

英特尔的10nm光刻技术制造出来的鳍片、栅极间隔更小,在晶体管密度上几乎是台积电、三星的两倍

摩尔定律是怎么说的?

积体电路上可容纳的晶体管数目,每隔18个月便会增加倍。”

因此,要看的是电路上晶体管的密度,而不仅仅是线宽”。

谷歌不是对手,英特尔要用AI一统芯片江湖!

Anandtech总结的全球半导体企业制程路线图

关于英特尔10纳米工艺芯片的难产”,业界有各种各样的推论和假说,Naveen 自然没有给出正面回答,只说 我们的10纳米工艺研发进度正顺利按计划完成”。

但是,台积电的7nm从晶体管密度上说远不及英特尔的10nm。” Naveen说:这是绝对的。”

AI芯片初创公司,活下去没靠山不行

巨头、英伟达、台积电等等都搞定了,对于颇有井喷式爆发的大批 AI 芯片初创公司又如何呢?

作为曾经芯片初创公司的CEO,Naveen 直言:要做出能够大规模商用的芯片,靠初创芯片公司100%不行。”

现在确实是计算机体系结构的黄金时代”,也有不少炒作,但计算机架构不是那么简单的事情。芯片的技术周期很长,也极少能用代就取得成功,需要不断的迭代,这期间芯片的架构可能过时,或者有竞争对手出现。

做芯片是非常难的件事情——你或许真的能设计出款能解决切问题的超级芯片,但要将这款芯片制造出来,需要付出大量的努力,而就算芯片真的做出来了,成功也不仅仅是靠处理器,还有生态和商业模式要考虑,要在百亿台处理器规模的数据中心无差错的使用,价格要能让客户用得起。

这也是Nervana Systems 选择被英特尔收购的原因。我们想要的是把自己的技术推向市场,而英特尔精湛的制造工艺和成熟的渠道以及其他资源,让我们能够把 Nervana 的技术留下来并推向市场,这是我们唯关心的。”

我并不是说所有芯片初创公司都会死,”Naveen 说:上世纪90年代,图形处理器市场,当初也有成千上万家 GPU 创业公司,有些被收购了,其技术也成为那些公司的部分,大部分都倒闭了,最终活下来的有多少?而活下来的这两家,在此期间也几度濒临破产。”

作为芯片初创公司要生存下去实在太难了,”Naveen说。Nervana Systems 曾经有过那么个窗口,抓住这个机遇或许能成为下个英特尔”,但 Naveen和他的团队,做了99%的人都会做的、更保守、更安全、更稳妥、从各种意义上说,也是最明智的选择——投入英特尔的怀抱。(Moblieye 的创始人是不是也是这样想的呢?)

CPU的AI化:英特尔的未来

刚刚加入英特尔时,Naveen和他的团队就未来AI和计算的发展着很强的Vision,但并没有获得大多数人的同意。

实际上,当时人工智能对英特尔来说并非值得优先考虑的事情(priority),而现在,英特尔的每个部门都在想着 AI。”Naveen说,AI是英特尔‘绝不能输的’。”

CPU曾经是英特尔的切,也是令英特尔如此的原因。但过去两年来,CPU就是切”(注:非Naveen原话)的意识形态在公司内部已经有所转变,大家意识到各种各样的加速器,尤其是AI加速器,开始扮演起越来越重要的角色。

尽管 CPU 不再是唯”,但仍然是计算结构里不可或缺的重要组成部分。Naveen说,只要是冯·诺依曼架构,你必须要有个 CPU”。

在 CPU 的周围,你可以放上GPU、DSP、ISP,以及NNP,或者各种新的架构,其中些会被淘汰,而另则会被被大家广泛使用,我们很乐意把大家都用的这种架构放进 CPU 里”,Naveen说。

英特尔另大优势在于,市面上已经安装并且投入使用的 CPU。客户的基础设施是逐步做起的,” Naveen 说:没有人会下子把旧的全扔掉换新的。” 如今,全球有3500万公司使用英特尔的CPU,眼下最火热的人工智能推理,也有近 90% 是在英特尔的芯片上完成。

与此同时,英特尔还在不断打造更好的 CPU,不仅为人工智能。

你看好英特尔在人工智能时代的作为吗?欢迎留言讨论。


网友评论
O畏内啈
O畏内啈
无论从技术实现难度还是对世界的贡献,个人认为从高到低都是
2019-09-17 01:27 25
爱吃肉肉的
爱吃肉肉的
微软的操作系统,谷歌的搜索引擎,英特尔的芯片,哪一个技术含量最高?
2019-09-08 21:11 39
相关文章
AI芯片遍地开花,谁会是新的王者?

AI芯片遍地开花,谁会是新的王者?

AI芯片遍地开花,谁会是新的王者?[详情]

老甲:团墨是种联想力

老甲:团墨是种联想力

老甲:团墨是种联想力[详情]

芯片性能提升5倍,能耗降低30倍!英特尔要用自旋电子技术“复活”摩尔定律!

芯片性能提升5倍,能耗降低30倍!英特尔要用自旋电子技术“复活”摩尔定律!

芯片性能提升5倍,能耗降低30倍!英特尔要用自旋电子技术“复活”摩尔定律![详情]

网站地图    Copyright     2016-2018  资讯网   All rights reserved.