人工智能硬件引领下一代计算机架构革命清华教授馀志平——IEEE联合专访系列

-回复 -浏览
楼主 2018-12-05 14:02:27
举报 只看此人 收藏本贴 楼主

DeepTech深科技  麻省理工科技评论独家合作




余志平,清华大学微电子学研究所教授、博士生导师,IEEE(国际电机电子工程师协会)终身院士(Life Fellow)。


余志平近年来的研究项目主要集中在纳电子器件(包括石墨烯器件与变阻存储器-RRAM)、CMOS射频电路建模与设计、半导体器件物理(包括量子输运与能带计算)。已发表学术论文400余篇,合著英、中文专著各一本。七五计划期间(1986-1990)参与组织的熊猫集成电路设计系统获1993年国家科技进步一等奖。


此外,他在美国硅谷与中国自1996年起先后成功参与创办数家高科技CAD软件与集成电路设计公司,并担任过国际著名集成电路公司(如Intel, HP, TSMC等)的技术顾问。



半导体工业的兴起将人类从机械文明带入了计算机时代。从上世纪70年代开始沿着摩尔定律的轨迹,晶体管的尺寸越来越小,在集成芯片中的密度则呈几何级地增长,因此大幅提升了芯片的性能。因此,性能越来越强大的计算机让人们对它的“智能”水平有了更高的期待。

 

到了2016年,整个计算机世界有两个方面引起了最多关注。一方面,AlphaGo再次点燃了公众对于人工智能的热情,而本月初IBM宣布,用可相变材料创造出首个人造神经元,预示着人类在人脑模拟的硬件上有迈出了坚实的一步。

 

另一方面,摩尔定律是否能坚持到2020年也是热门话题之一,最的技术例如晶体管三维堆砌和漩涡型旋转激光光刻(swirling vortexlaser)等也被视为了摩尔定律的“救星”。

 

在这样的背景下,我们有幸采访到了清华大学微电子学研究所的余志平教授,请他为我们详细地分析目前计算机硬件几大热点的现状,并同我们一起展望各类新技术的应用前景。

 

本采访由DeepTechIEEE中国联合完成。



IBM的人造神经元


对于IBM发明的人造神经元,余志平教授首先介绍了相关的背景。

 

人造神经元中用的相变材料最早是用来制作新型存储器的。而相变非挥发存储器(PCM– phase change memory)的专注研究已经进行了20多年了,但一直没有找到很好的应用。

 

一方面,这是因为NAND Flash存储器的存储密度与成本进步太快;另一方面,PCM自身也存在的热稳定性的问题

 

最近两年,IBM苏黎世实验室在PCM的内在工作机理的定量描述上取得了重要的进展。此外,科学家们还通过新的读算法来将单比特(bit)存储单元变为3-bit多比特单元。

 

余志平教授


余志平表示,因为神经网络依赖于神经元与神经触突来工作,而神经触突的强度是要求可变与有记忆功能,这种多值的非挥发PCM存储器是十分适合这方面的应用的。

 

如果IBM能结合下面提及的TrueNorth脑芯片设计,而用与CMOS工艺兼容的PCM技术实现,可望在人工智能硬件上取得朝向商业化的里程碑式的进展



量子计算机


2016年8月份,美国马里兰大学在《自然》杂志上发表了相关论文,报道了一台可编程的5量子位量子计算机。余志平表示,这是一台真正意义上的量子计算机,可以进行傅里叶变换的量子运算。

 

关于量子计算的发展速度,余志平认为,相较于2年前,即2014年加州大学圣巴巴分校发表的“量子纠错算法的改进”,再与当时宣布的Google与UCSB合作在SantaBarbara建立专注量子计算机的实验室这件事结合起来看,量子计算机的进展可能要比原来预料的要来得快。

 

其实,一直以来流传着一个“两个50”的相对悲观的说法,即(量子计算机)50年后有50%的机会。

 

至于量子计算机何时能实现,余志平个人的估计是在10-15年后。到那时,量子计算机将有望应用于某些类似图像快速识别的特定场合。

 

不过,有一点余志平非常肯定,那就是量子计算机并不会取代现在高度发展的以硅CMOS(互补式金属氧化物半导体)为基础的通用数字计算机。

 

“在某种程度上,量子计算机类似于模拟计算机与并行计算的自然组合,有其优势,但不宜无限夸大。”余志平补充道。

 


人工智能硬件的发展现状


余志平表示,人工智能的硬件,如果局限于机器学习(包括深度学习)的硬件加速,目前通常有三类实现方式——不同于通用数字计算机的新型计算机架构、GPU(图形处理器)和FPGA(现场可编程逻辑门阵列)这三类硬件实现的共同点是采用并行计算,但AI的突出特点是与巨量的数据打交道,所以要求化数据传输上的时间要尽可能小

 

相比之下,计算时间倒不是一个主要的关注,因为用纳米尺度的CMOS技术节点实现的CPU性能已经是很好了。并行计算要求计算机架构上的每一个高性能的CPU,本身就带有高速,非挥发可改写的存储器(现在有一个词专门描述这一类存储器:persistent memory)。

 

据余志平介绍,目前国外(主要是美国)的人工智能硬件带有前瞻性的研究就集中在这三个方面。新型计算机架构里有比如IBM 2014年在《科学》杂志发表的TrueNorth脑芯片,还有最近Intel收购的Nervana公司的专用芯片(据报道数据传输率可达2.4TB/s)。

 

GPU以NVIDIA的Tesla为代表

 

至于FPGA的性能与多样性,近来进展也很快,比如Intel在刚结束的ISDF (Intel SoC Developer Forum)上宣布,要用10nm CMOS节点制造FPGA芯片,依然采用ARM作植入 CPU。

 

国内人工智能硬件的发展,基本上还停留在用可以买到的FPGA实现的阶段。研究工作有中科院计算机所的寒武纪项目,清华大学也有用阻变非挥发存储器(RRAM)作分布式片上存储器的神经网络计算架构的原型研究。

 


摩尔定律


关于摩尔定律,余志平首先排除了耶鲁大学的漩涡型旋转激光拯救摩尔定律的可能性。

 

他认为,所有的光刻技术必须首先在小规模生产的基础上实现,然后才能具备能大规模应用的能力。

 

因此,从这个意义上说,漩涡型旋转激光技术是没有可能在接近摩尔定律终结期用于CMOS集成电路生产的

 

就目前的光刻技术而言,10nm节点依然是用193nm的浸没式光刻技术,7nm节点可能在部分层采用EUV (extreme ultraviolet,即极端紫外)技术。

 

余志平个人的观点是摩尔定律可能会在CMOS 3nm节点终结,那时晶体管的最小尺寸大约为24nm,而晶体管的沟道长度则不太确定,可能在2nm左右。

 

此外,受制于制造成本的影响,摩尔定律也有提前终结的可能性。

 


电子器件纳米化的理论基础


对于这个话题,余志平表现出了极大的兴趣。他认为,电子器件纳米化与纳米电子器件严格上来讲,不是一个概念。如果仅仅是要把电子器件做小,目前已经达到了10nm节点的水平。

 

在余志平看来,纳电子器件与微电子器件的差别不是仅仅器件的尺度进入了纳米级。如果器件的工作原理还是与原来的微电子器件一样,即使器件关键尺寸到了几个纳米(如10nm或7nm的CMOS晶体管),其依然是微电子器件

 

对于纳电子器件(相比于微电子器件),关键是在于当器件的尺度缩小到一定程度时,新的物理机制(如量子力学效应/相对论效应)成了器件工作的主要原理,并可以利用来实现有用的应用时,才是纳电子器件研究的初衷。

 

而就目前的现状而言,余志平举了1998年荷兰Delft大学C. Dekker教授组在《自然》杂志上发表的碳纳米管场效应晶体管的例子。18年后的今天,这项技术依旧没有在在集成电路上产生任何实质性的影响与应用

 

这里面主要是两个原因,一个是纳电子器件(比如石墨烯场效应晶体管)并没有显示出纳米尺度的硅CMOS器件(比如Intel的14nm的FinFET)更好的性能,而其工艺技术却存在极大的难度;另一个则是纳电子器件想要采用的bottom-up(由底层往上制作/生产)加工技术迟迟没有获得突破。


 



深科技招聘自由撰稿人,要求

文笔好,懂科技,稿酬优

联系:deeptech@mittrchina.com



IEEE中国是DeepTech深科技的战略合作伙伴,想要获得最新的科技资讯和会议信息,敬请关注IEEE中国。



MIT Technology Review 中国唯一版权合作方,任何机构及个人未经许可,不得擅自转载及翻译。

分享至朋友圈才是义举


DeepTech深科技

     ID:mit-tr

长按关注
我要推荐
转发到

友情链接