从TI到Mentor,再到最近的Cornami,Wally Rhines博士在其长达50年的半导体职业生涯中,见证了IC的诞生、IDM厂商的生死起伏,以及EDA行业的“三国杀”。现在他又踏上了AI芯片和数据加密计算的创业旅程,希望通过完全同态加密(FHE)计算技术为大数据保护和处理市场带来一场颠覆。
半导体增长的驱动力
从历史上看,全球半导体行业的发展一直受到大规模新兴应用的驱动,这些增长以上图中黄色“ S曲线”表示。从大型机到小型机,再到个人计算机和笔记本电脑,然后再到移动通信,每个应用都推动着半导体行业进入新一轮增长。 那么,什么应用将推动下一波半导体发展浪潮?“数据”将是主要驱动力。
围绕数据这一核心,有四个领域的应用值得关注:
人工智能
机器学习
IoT边缘计算
5G通信
所有这些新兴应用可以归为一种——“大数据管理和分析”。 无论是在AI中构建ML模型,还是在IoT中使数据分析更接近数据收集点,还是工厂自动化中实时通信的处理,这一切都与管理和分析大数据有关。
数据就是信息时代的“石油”
如今,“数据就是新石油”的说法变得越来越明确。从数据中捕获信息,通过学习、构思和创新就可以创造价值和财富。现今,每隔2-3年,可用于计算分析的数据量都会翻倍,而我们只能分析约2%的可用数据。
以喷气式发动机为例,Pratt & Whitney、通用电气和劳斯莱斯等发动机制造商都会持续监控所制造的发动机引擎的性能,每个引擎每小时产生的数据量超过70 TB。只有这些引擎的制造商才能使用这些数据来深入了解引擎的运行状况和潜在的维护需求。这些信息对于航空公司至关重要,他们愿意付费购买。发动机制造商甚至可以改变一下商业模式,发动机免费送,而只是向航空公司收取维护服务的费用。由此可以看出,拥有高价值的信息可以成为一门大生意。
数据的收集及收益
视频和图像会产生大量数据,每天超过1PB(百万GB)。此外,物联网设备中的传感器不断收集各种类型的数据,包括视觉信息、气味、声音和振动等。传感器正变得越来越复杂,为设计人员集成多种技术(包括模拟、数字、RF、MEMS和其他电子器件)带来了巨大挑战。
像智能手环等可穿戴设备,在很小的空间内集成了MCU、MESM传感器、加速度计、电池充电和管理芯片、ADC转换器、模拟信号处理,以及蓝牙等RF无线通信功能。设计极其复杂,但又要求低功耗和低成本,这给半导体厂商和IC设计工程师提出了极高的要求。
实际上,半导体厂商并不是信息和数据收集热潮的真正受益者。真正的受益者是那些拥有数据,并对其进行分析然后再出售信息的公司,诸如Google、Facebook、阿里巴巴等互联网公司,他们正在极力收集数据,通过分析和销售信息而获得十亿甚至百亿美元的收入。
十年前,Fabless公司购买了晶圆制造厂商80%的晶圆,三星、英特尔和德州仪器等IDM购买了剩下的20%。如今,Google、苹果和华为等系统和信息技术公司购买了接近20%的晶圆,这一细分市场每年都以35%的速度增长。
数据的分析和VC投资
过去20年来,芯片公司获得的VC投资在2000年达到顶峰,约为25亿美元,在随后的15年里持续下降。然而,在2017年,特定域处理器AI芯片初创公司获得的VC投资迅速增加,在2018年达到35亿美元的峰值,比2000年的最高记录还增加了10亿美元。VC投资的无晶圆厂半导体公司中有一半以上都是专注于AI领域。
如果仅分析2012年至2019年这7年间半导体公司的前三轮风险投资,我们会看到AI和机器学习占据了大部分投资。这些AI和ML芯片的目标应用是什么?
该图显示了这一时期内针对每个应用的初创公司数量。其中最大的类别是模式识别。大部分投资去到视觉和面部模式识别领域,但也有大量资金投到其他模式的识别,例如语音识别、气味识别、疾病诊断和自动驾驶车辆控制等。
风险投资的第二大类别是高性能计算(HPC),特别是数据中心,这由VC支持的初创公司所针对的应用领域。Graphcore、Groq、Habana Labs和Cornami是后冯·诺伊曼(Von Neuman)时代开发新的芯片架构的范例。
第三大类别是通用边缘计算。许多分析人士认为,物联网将推动边缘计算的快速增长,但速度却慢于预期。不可避免的是,它将是一个巨大的增长领域。为什么? 因为那是计算机行业发展的必然方式,即从集中的高性能计算到普及的边缘甚至终端计算。
数据保护和FHE
有三种主要方法可以保护敏感数据。 一种是将数据导入算法并在数据中心进行处理。采用这种办法,你必须信任数据中心及其计算机、操作系统和其他通信设备。但是,数据中心可能遭到黑客攻击,因此不能完全信任。
第二种方案是在构建机器学习模型时保持数据安全,其中之一称为“联合学习”。利用联合学习,机器学习模型的子集被下载到敏感数据的位置,例如手机、PC或本地数据中心。机器学习模型从数据中学习,然后发送回模型的创建者。这种方法也不是很安全,因为你必须信任模型所有者以及用于从数据中学习的所有算法。
第三种方法是同态加密(Homomorphic encryption),就是让数据始终处于加密状态,任何人都不能信任。完全同态加密(FHE)可以保护数据,而不是数据中心。客户端仅使用FHE加密数据,然后将其发送到云端。无需解密即可对加密数据执行所有形式的算术和逻辑计算。 计算的加密结果被发送回客户端,客户端可以解密信息。只有数据的所有者才能看到原始数据文本,所有其他人只能访问加密的数据。
在不久的将来,可以使用加密数据构建机器学习模型。这对于个人财务和医疗数据尤为重要。 据IDC预测,到2024年软件和服务的机器学习市场将达到200亿美元规模。
一旦FHE被广泛采用,拥有数据的任何人都可以通过建立专有模型来利用它。无需出售模型中的数据,只出售对模型的访问权限。数据可以成为所有应用类型的业务,数据中的信息和独到发现可以一次又一次地转售给许多客户。只有数据的所有者才能看到实际的数据。
既然FHE拥有如此不可思议的优势,为什么还不尽早采用?FHE有其自身的问题,它在计算上非常密集。如果以与未加密数据相同的速度处理FHE加密数据,就要求计算机的运行速度是当今典型的Xeon或nVidia服务器的一百万倍。
AWS曾经尝试在传统的英特尔至强服务器上实施FHE,处理具有1亿条数据的典型财务数据库,需要24,000个内核处理器进行4.4天的计算。 而Cornami正在开发的芯片设计的仿真表明,通过使用特殊的编译器和处理器的动态可重配置性,可以将4.4天压缩为10秒。
为了有效地执行FHE计算,我们需要能够随处理器内核数量扩展性能的计算机体系结构,这需要特殊的软件编译器和特殊的芯片架构。应对FHE处理的挑战需要多种功能的结合:
●大规模并行计算
●消除大多数内存读写
●可以生成集成、独立的可执行数据流和控制流的软件
●能够随芯片、板卡和服务器上的处理器内核数量线性扩展的芯片硬件
●动态可重配置的硬件以适应不同的算法,从而改变字宽或流水线深度
这些功能已在FPGA仿真器上进行了演示,可用于测量芯片设计的性能。芯片的实际生产将于明年启动。当第一批芯片于明年某个时候推出时,预计将很快采用实时FHE。美国国防部坚决支持安全的“零信任”方法,已将FHE确定为实施解决方案,并正在倡导FHE软件在国际上的可用性,以确保全球所有计算机数据的安全。
据Gartner估计,到2025年,全球所有公司中将有25%具有同态加密程序。基于HE和FHE的软件和服务公司正在增加。所有这一切都“恰逢其时”,因为当今的互联网安全机制可能会被1000量子位的量子计算机轻易打破。FHE是当今唯一已知的“经得住量子攻击”的安全方法。
最后,Wally Rhines博士总结到,电子设备和系统的半导体含量将继续增长。经过20多年的发展,半导体含量相对稳定地保持在电子设备价值的16%,我们最近看到了这一含量比例的加速增长,现在大约占到电子设备价值的20%。
数据将成为新的石油。它承载了我们的专业知识、信息和创新。过去十年中,数据的收集、分析和保护取得了巨大的进步。数据是未来10年半导体行业增长的驱动力。
原文发布于ESMC姊妹媒体EETC
责编:Elaine Lin
相关文章