毫无疑问,智能手机和智能家居仍将是边缘的两个最大市场。与此同时,自动驾驶汽车的潜力为边缘人工智能公司带来了极高的期望和市场估值。然而,自动驾驶汽车的缓慢推出,以及智能手机市场的标准化,导致许多厂商在他刚才提到的市场之外寻求新的增长机会。许多供应商已经转向工业应用和其他以移动为中心的应用,例如,英特尔、英伟达、高通和 Hailo 已与许多边缘计算供应商合作,为希望使传统基础设施更智能的公司提供 in the box 解决方案。供应商还为机器人和无人机应用推出了专用解决方案。此外,该行业本身见证了硬件和软件供应商之间的许多合作伙伴关系。这些关系在本质上通常是共生的,因为它们鼓励领域专业知识的交流并为垂直特定供应商开辟新的市场机会。
ZigZag 工具
关于用于以超低功耗运行神经网络的尖端微处理器架构的有价值的信息,开发了一个叫做 ZigZag 的工具。帮助设计师比较硬件与不同的架构、不同的内存层次、不同的数据路径、不同的组合如何以节能的方式运行不同的神经网络。因为较低精度、越来越多的并行芯片可以提高能源效率,但以灵活性为代价。
它的核心是一种非常快速的分析成本模型。因此,它采用神经网络工作负载,采用具有内存层次结构、数据路径甚至技术特征的硬件架构,并基于这种技术组合,尝试估计在此特定设备上运行工作负载所需的能量架构,需要多少延迟或时钟周期,以及该架构的区域是什么。当然,正如他之前所展示的,你不能只说,他把工作负载映射到架构上,不,有很多不同的方法来映射它,甚至是一个特定的工作负载,神经网络的一层,硬件架构,这与他在空间上展开什么循环有关,他暂时展开哪些循环,他将哪些数据放入 SRAM 寄存器文件、1 级内存、2 级内存等等。他们的工具做什么,它需要神经网络工作负载并尝试找到所有可能的良好映射和调度,它正在尝试数百万个这样的调度,在硬件架构上并为每个调度估计能量/延迟/面积,然后附带一组帕累托最优解决方案,为您提供此神经网络工作负载、此技术、在这些硬件限制下,他可以实现的每次推理的最佳时间、每次推理的能量等。
IBM 的目标:在 2025 年将 AI 计算性能每年提高 2.5 倍
BM Research 计划在短期内使用数字电子技术结合超低精度计算中的算法工作来实现这一目标。有助于开发模拟 AI 计算能力的工艺创新,包括 PCM、相变存储器和 EC RAM、电化学 RAM 技术。在推理方面,他们使用了 PCM 技术,并通过使用他们所谓的投影 PCM 技术对其进行了改进。
这本质上是一个精心设计的层,用于解决您在直接使用 PCM 元素进行模拟计算进行推理时看到的一些非理想性或抗漂移。他们绝对不希望这种漂移发生 - 每次您在模拟域中使用并使用此模型进行推理时。在右侧,他们正在开发材料,以便在深度神经网络正在编程时,这些材料可用于存储数千个权重或数千个不同状态。他们正在使用他们从高 k 金属栅极技术中学到的对氧空位产生和消除的一些基本理解。
他们还在开发一种称为 ECRAM 的技术,即电化学 RAM 技术,它一直在利用电池技术的一些原理,但他们已经找到了一种将其集成到 CMOS 兼容晶圆中的方法。
Cerebras新型计算机
Cerebras构建了一种针对 AI 工作进行优化的新型计算机,他们的目标不是变得更好,不是快两倍或三倍,而是在 工作上快 100 或 1000 倍。为此,他们解决了计算机行业 70 年来一直未解决的问题:他们解决了构建非常大的芯片的挑战。在他们出现之前,最大的芯片大约有 800 平方毫米,大约是一张邮票的大小。他们制造了一个芯片,并在 2019 年 8 月宣布了它,即 46,000 平方毫米。所以它是一个餐盘的大小。
在这项工作中,更大的芯片处理信息的速度更快,在更短的时间内产生答案。因此,他们所做的是,他们制造这些大型芯片,将它们放入他们设计的系统中,创造性地称为 CS-2,用于 Cerebras Systems 2,然后交付给客户。它大约有 16…15 个机架单元高,大约 26 英寸。Sally,他不确定如何为您转换为公制。那是什么……11,000厘米或类似的东西。
相关文章