如今RISC-V,AI处理器在数字化转型、普适AI等大环境崛起中具有重要作用,但这些复杂的场景也带来一个问题,就是无意义的数据量过多,这些都是系统运行的干扰。“作为架构师、我们在寻求的东西是说:在这么多、这么复杂的应用场景之下,是否可以找到一个方案来解决这些所有的问题。”Tenstorrent首席CPU构架师练维汉说道。
Tenstorrent公司是如今快速崛起的AI初创公司,由传奇芯片设计师 Jim Keller 创立,在最近一轮融资中,获得了由三星、现代等公司共同领投的一轮可转换债券融资中筹集了 1 亿美元。Tenstorrent 在此轮融资之前已筹集 2.345 亿美元,估值达 10 亿美元,它是挑战英伟达的几家新贵之一。
练维汉目前担任Tenstorrent首席CPU架构师,在加入Tenstorrent之前,其在Apple、P.A.Semi、Raza、Nexgen、AMD等公司工作,经历了包括X86、Arm、PowerPC、RISC-V等各类处理器架构研究工作,通过不同的架构研发,练维汉有了自己的方法论。其中,爱因斯坦的宇宙统一理论,给了练维汉一个重要启示。
从数字化转型说开
练维汉认为,数字化转型的点不光是一个风口,更是可以堪比“工业革命”的壮举。
而AI则是数字化转型中的“最佳化”答案,利用算力实现量身定制从而提升效率的模式,是以前从未有过的。对算力的巨大需求,一方面使英伟达赚得盆满钵满,另外也使包括Tenstorrent在内的AI创业公司得以迅速崛起。
练维汉强调,尽管芯片和算力在迅速成长,但是在海量的数据面前,无论是性能还是功耗都无法跟上。“我看一个数据,就是说:谷歌如果要把他们所有的数据转换成ChatGPT的这种结果,要花一千亿美金,功耗要增加20倍。”练维汉说道。
练维汉认为,Heterogeneity(异构计算)和分布式计算是解决AI算力的唯一方法。“计算必须要在每一个地方发生。比如人类是一个非常复杂的生物机器,如果所有碰触到你皮肤的数据都要传递到大脑做决定是不可能的事。如果这样的话,你的神经可能要比现在宽多少倍都不知道。很多触觉上的东西在皮肤层就做了筛选,有用的讯息才会传递到大脑。所以把所有的计算都放到云端再传回来,这在生物学上都是不可能的。”练维汉说道,“计算必须在每个地方发生,这样才能达到所要的功耗和传输要求。”
除了异构计算之外,可伸缩性也是处理器架构设计时需要考虑的。“你发明的东西不能用在一个点上,而是要支持从最简单到最复杂的系统,就像爱因斯坦希望用一个理论来解释宇宙所有现象一样。
“处理器架构设计一定要遵循简单的原则,精简的好处有很多,但最重要的就是易于实现并且方便修改。”
练维汉表示,RISC-V由于开源,因此非常适合弹性设计。“我做了一个架构后,不需要再和Arm说可不可以进行修改。未来随着计算的复杂,一个指令集能够扩展出最多最复杂的应用,这是其他指令集架构所不具备的。”
基于AI的可扩展RISC-V
Tenstorrent是世界上唯一一家有AI、RISC-V、Chiplet的公司。“我们知道未来很多东西没有办法用AI来做,因此我们两年前开始着手研发RISC-V芯片,从而满足不同的计算需求。”练维汉介绍道。
练维汉强调,Tenssent的做法是从IP到Chiplet、从System Chiplet到系统的可扩展式产品,配套的软件堆栈也具有同样的可扩展性。
AI的变化非常迅速,比如现在随着ChatGPT,Transformer变得流行,但可能几年后可能就要改变。“你必须要有足够的弹性,一定要看得长远,不只是应用层面需要修改,可能系统也需要修改,这就需要有弹性且兼容的设计。”练维汉说道。
练维汉表示,未来的AI计算中,CPU还是会占据很重要的地位,这是两种不同的算力。为什么还要关注CPU?
Chiplets则是优化系统架构弹性的计价方式,无论是CPU还是AI处理,通过Chiplet都可以更灵活的满足不同行业,不同细分系统要求。
未来计算随处可见,不能让架构太复杂,从而影响计算效果,这也是Tenstorrent公司的最主要特色。