刚结束的2021年架构日,处理器龙头英特尔公布全新独立显卡架构Xe-HPG。新架构首批GPU将采用台积电N6制程,2022年第一季上市。这也是英特尔1998年发表i740以来,20多年后再次踏入独立GPU市场。由于英特尔加入,独立GPU市场再次形成三国鼎立局面,图形、图像到AI和高性能计算,技术竞争和市场争夺将全面升级。
近期GPU市场行情看涨,研究公司Jon Peddie Research报告显示,2021年第一季度全球GPU出货量达1.19亿颗,较2020年同期成长38.78%。英特尔整体GPU出货达68%市占率,但独立GPU方面,英伟达仍以81%市占率遥遥领先,AMD以19%市占率排名第二。Jon Peddie Research预期,独立GPU出货量还将继续攀升,到2025年将占整体GPU市场26%。
因独立GPU用途广泛,成为大芯片市场应用佼佼者,架构和制程技术都达产业顶峰。英伟达2020年消费市场旗舰级GeForce RTX30系列GPU,采用三星8纳米制程,RTX3080和RTX3090包含的晶体管数目达280亿个。竞争对手AMD RX6000系列采用台积电7纳米制程,晶体管数目也达268亿个。
因顶尖制程和庞大晶体管数目是因应越来越复杂的芯片架构。以英伟达安培(Ampere)架构为例,运算部分包括串流处理器(Stream Processor,SP)、纹理映射单元(Texture mapping unit,TMU)、深度学习单元(Tensor Core)、光线追踪单元(RT Cores)、光栅化处理单元(ROPs)等。GPU带入AI领域的是深度学习单元,用于实时深度学习、大型矩阵运算和深度学习超级采样等作业,将GPU性能和作用完全提升,从图形处理器升级成计算处理器。
为了追求性能,独立GPU的竞争演化成架构比拼。英伟达2020年推出安培架构,AMD回应RDNA 2架构,RX6000性能可与RTX30一较高下。这次英特尔加入战局也是有备而来,Xe架构经过多年发展,不但具备最流行的各种元素,还使用台积电6纳米制程,完全有实力与英伟达和AMD一较高下。仍有市场人士指出,英特尔还是基因为CPU的企业,GPU运作仍需配合CPU。整体来说,处理好CPU和GPU的发展冲突,将是英特尔未来的挑战。
时间回到2012年,多伦多大学创建能从100万样本自动学习识别图像的Alex Net深度神经网络,仅用两个NVIDIA GTX580 GPU训练数天,就赢得当年Image Net竞赛,击败磨练几十年的人类专家算法。业界认识深度学习的强大后,斯坦福大学就与英伟达研究室合作开发使用大规模GPU计算系统训练网络的方法,从此揭开深度神经网络技术的发展,一举奠定GPU在AI领域的地位。
GPU能用于人工智能与深度学习,因提供多个平行运算基础结构,且核心数较多,可平行运算大量数据,还拥有快速储存速度和高浮点运算能力,使GPU完美契合AI计算需求,GPU仍是AI训练阶段较适合的芯片。据统计,GPU在AI时代的云端训练芯片仍占高达64%。虽然随着FPGA及ASIC技术突破,GPU市占率有些下降,仍是云端训练市场占比最大的芯片种类,2019~2021年年复合成长率达40%。
凭着GPU在数据中心的优异表现,英伟达业绩也一路走高。今年第一季数据中心业务营收达20.5亿美元,创历史纪录,与2020年同期相比成长达79%,与上一季相比也成长8%,占总营收比重36%。发展较晚的AMD也奋起直追,执行长苏姿丰说今年第二季数据中心GPU营收较2020年同期成长一倍多。有出色营收表现要归功于Instinct加速器部署增加,还有CDNA2架构最新数据中心显卡首次出货。
英特尔最新数据中心GPU Ponte Vecchio日前发表,拥有1000亿颗晶体管的SoC也创下英特尔纪录。Ponte Vecchio采用Xe-HPC微架构,由多个复杂设计组成,以单元形式呈现,然后嵌入式多芯片互连桥接单元单元组装,达成单元低功耗、高速连接效能。设计均集成于Foveros封装,为提高功率和互连密度形成有源芯片的3D堆栈。
市场人士表示,ASIC和FPGA都在与GPU竞争时,英特尔选择发展GPU,说明GPU可能还是通用AI的最好选择。这颗巨大芯片也可看作反击英伟达数据中心CPU,双方都建立CPU+GPU布局,准备面对面对决。英特尔还在发展oneAPI计划,成为英伟达CUDA的强大竞争对手,因范围不仅限GPU,涵盖CPU和所有处理器。
就英伟达、AMD、英特尔布局看来,尽管独立GPU不能完全取代CPU,但成为数据中心非常关键的一环。全球三大芯片厂商都力攻此领域,GPU三国志未来可能连番上演。
封面图片来源:拍信网
相关文章