随着人工智能技术的飞速发展,算力已成为推动产业变革的关键力量,但大模型的快速发展,参数的爆发,对于算力需求也提出了更高的要求,带来了全新的挑战。那大算力芯片应对这些挑战,如何才能够助力人工智能技术的发展,实现算力的落地和最后一公里的打通?
2024年7月8日,亿铸科技创始人、董事长兼CEO熊大鹏博士在“2024算力技术创新发展生态大会”上发表了题为《超越极限:大算力芯片面临的技术挑战和解决策略》的主题演讲,从亿铸自己的角度带来了大算力时代下新的解决方案。
打通最后一公里,算力落地带来无限可能
人工智能正与传统行业深度融合,创造出智算中心、AI PC、AI手机和具身智能等新型产品与服务,使得这些传统产业在AI的影响下变得更加智能化和个性化,从而提供更加精准和高效的服务,这也是算力落地的最后一步。
以智算中心为例,据《中国算力发展指数白皮书》显示,2022年中国智能算力规模达到178.5 EFlops,年增长率为71.63%。预计到2026年,中国的AI算力规模将达到1271.4 EFLOPS。在端侧也是如此,以具身智能为例,具身智能是将人工智能与机器人的感知等能力相结合,使机器人能够以更智能和自然的方式,完成工业和服务应用场景中不同的任务,未来将有极大的发展空间。
但是熊大鹏博士也指出,要打通最后一公里,实现算力的落地,对芯片也提出了完全不同的要求。目前传统架构下的大算力芯片主要面临着存储墙,能耗墙等诸多问题,不同的公司都在寻找解决路径。
大算力芯片面临哪些挑战
对于具体的挑战及问题,熊大鹏博士从有效算力的第一性原理的角度对相关问题做了阐释:
对于传统的冯诺依曼架构而言,数据搬运和访存占据了大量时间,形成了存储墙及其有效性能的天花板。其中,存储墙问题对AI的发展构成了重大挑战,过去20年峰值算力提高了90000倍,但内存带宽仅提高了100倍,互联带宽仅提高了30倍。可以说带宽的发展速度严重滞后于算力的发展速度,已成为严重制约AI发展的关键所在。除了芯片内部的数据传输,芯片与芯片间的传输也遇到了瓶颈。随着AIGC浪潮兴起,AI服务器需求增长,服务器内部之间或与其他设备的数据传输、控制和管理等接口功能的要求也随之增加。
同时, 随着人工智能模型的规模和复杂性不断增加,在训练和运行时所需的能源消耗也在显著增长。为了应对能源挑战,人工智能行业需要开发更高效的算法和硬件,以减少能源消耗。
由于存储墙和能耗墙的存在,未来想要实现更高的算力,就需要消耗更多的芯片,更多的互联技术和更多的能耗,随之而来的就是在传统架构的基础上无论是电力的成本还是设施建设的成本,都呈现爆发式的增长。
那么该如何解决上述的问题呢?目前业界已经有很多公司在尝试新的路径,而亿铸科技则坚定的从存算一体的角度寻找"终极解决方案"。
算力落地的终极解决方案
众所周知,摩尔定律曾是半导体行业发展的黄金法则,它预言了集成电路上晶体管的数量将每两年翻一番,从而实现性能的指数级增长。然而,随着工艺节点的不断微缩,晶体管尺寸已接近物理极限,导致摩尔定律面临局限,业界一直在寻找新的解决方案。
存算一体技术有望成为后摩尔时代的重要技术路线之一,它不仅能够解决当前工艺制程面临的挑战,还能够为计算领域带来新的增长点。存算一体将存储和计算有机结合,理论上计算可以直接在存储器中进行,这样既打破了系统对于存储器的绝对依赖,还能够极大地消除数据搬移带来的开销,彻底消除“存储墙”以及“能耗墙”的问题。
最后,熊大鹏博士指出,从有效算力的第一性原理来看,对于存算一体,数据搬运量大幅下降,有效算力呈现线性增长。可以说存算一体将打破摩尔定律,开启算力第二增长曲线。同时,相信存算一体技术在未来计算领域的变革性潜力,特别是在AI时代,这种技术可能会成为推动算力增长的关键因素。
亿铸科技的创新不仅为大算力芯片的发展提供了新思路,更为人工智能技术的进一步发展奠定了基础。随着存算一体架构的不断成熟和应用,我们有理由相信,亿铸科技将在人工智能的新纪元中扮演重要角色。
未来,亿铸科技将以创新驱动未来,与全球伙伴共同开启人工智能的新篇章。我们期待与各界同仁携手合作,共创智能科技的美好未来。
来源:亿铸科技