Aspencore《电子工程专辑》分析师团队对中国本土的AI芯片设计公司进行了第一手调查和网络汇编整理,从众多AI芯片设计厂商中挑选30家,从核心技术、代表产品、典型应用场景等多个维度进行了分析。这是China Fabless系列调研分析报告的一部分。
国产AI芯片厂商基本信息统计
无论云端训练和推理、边缘计算还是终端AI,AI都需要高能效的算力支持,而AI芯片无疑是输送算力的硬件保障。传统的通用型CPU、GPU甚至FPGA难以满足特定应用场景的AI需求,因此基于特定域架构(DSA)的AI芯片和深度学习加速器(DLA)便应运而生,这为专门开发AI芯片的初创公司带来了发展机会,并在全球范围催生了多家AI芯片独角兽公司。
中国本土AI应用和AI芯片初创公司也随着AI的热潮和风投的关注而遍地开花。然而,经过几年的喧闹后,AI应用场景的落地成为最大难题。AI芯片的设计也不是简单的高性能微处理器硬件设计,而是涉及应用场景特定需求和算法的软硬件一体化设计。那么,中国本土AI芯片厂商的发展现状?未来发展前景又如何呢?哪些AI芯片公司会脱颖而出?
《电子工程专辑》分析师团队带着这些问题,对30家国产AI芯片厂商进行了深入调查和分析。这是这些厂商的基本信息一览表:
在这30家中国本土AI芯片厂商中,有6家上市公司,4家是子公司。有2家是做比特币矿机出身而扩展到AI芯片的。有一家是从光子芯片切入AI领域的,有2家采用的是数据流架构,而非传统的冯诺依曼架构。
从公司总部所在地来看,北京有11家AI芯片公司,其中包括互联网巨头百度、老牌微处理器芯片设计公司北京君正,以及科创板上市的寒武纪。上海有9家,包括无线通信处理器厂商紫光展锐,以及融资超过20亿的初创公司壁仞科技。深圳有4家,包括华为海思,以及“AI四小龙”之一的云天励飞。此外,珠海和杭州各有2家,福州有1家。
从AI应用场景来看,智能安防、物联网和智能语音是最为热门的应用。云端AI训练和推理对算力性能和设计团队的要求比较高,相应的AI处理器设计公司也不多。除了百度和阿里等互联网巨头外,遂原科技和天数智芯是针对这一高性能计算领域的初创公司。
30家AI厂商详细信息
下面我们将从核心技术、代表产品、典型应用场景和竞争优势等方面对这30家公司逐一分析。
华为海思
核心技术:自研华为达芬奇架构NPU、3D Cube技术;
代表产品:昇腾(Ascend)310是一款高能效、灵活可编程的人工智能处理器,在典型配置下可以输出16TOPS@INT8、TOPS@FP16,功耗仅为8W。全AI业务流程加速,大幅提高AI全系统的性能,有效降低部署成本。自研华为达芬奇架构NPU,在8W数据精度下算力可达16TOPS,高性能3D Cube计算引擎。
昇腾(Ascend)910是海思系列中算力最强的AI处理器,基于自研华为达芬奇架构3D Cube技术,实现最佳AI性能与能效平衡,架构灵活伸缩,支持云边端全栈全场景应用。在算力方面,昇腾910半精度(FP16)算力达到320 TFLOPS,整数精度(INT8)算力达到640 TOPS,功耗310W。
应用场景:海思以全场景AI芯片昇腾系列助力AI从中心侧向边缘侧延伸,面向数字中心、边缘、消费终端和IoT场景,可为平安城市、自动驾驶、云业务和IT智能、智能制造、机器人等应用场景提供完整的AI解决方案。
紫光展锐
核心技术:异构双核NPU架构、自研API
代表产品:虎贲T710采用异构双核NPU架构,支持业界主流AI训练框架,自研API可提高算法效率。性能:4 x A75 @ 2.0GHz + 4 x A55 @ 1.8GHz;影像:4800万(4in1)摄像头、4K@30fps编解码、超级夜景、防抖等功能。
应用场景:适用工业、商业、医疗、家居、教育等场景。
竞争优势:拥有在人工智能AI、安全性、连接、性能、功耗五大领域的突出优势。在2019年8月苏黎世联邦理工学院AI Benchmark公布的全球AI芯片性能榜单中,虎贲T710排名榜首。
地平线
核心技术:人工智能专用计算架构 BPU(Brain Processing Unit)
代表产品:车规级AI芯片征程2/3;AIoT边缘AI芯片平台旭日2/3。
应用场景:汽车ADAS/自动驾驶、AIoT边缘计算。地平线自主研发兼具极致效能与高效灵活的边缘人工智能芯片及解决方案,可面向智能驾驶以及更广泛的智能物联网领域,提供包括边缘 AI 芯片、丰富算法 IP、开放工具链等在内的全方位赋能服务。
竞争优势:在智能驾驶领域,地平线选择从车载AI芯片(智能汽车的数字发动机)这一最具挑战性的边缘芯片切入,具有领先的人工智能算法和芯片设计能力,是目前唯一能在基于视觉感知的车规级AI芯片竞争赛道上与Mobileye抗衡的公司。地平线征程 2 已经实现大规模前装量产,与英特尔 Mobileye EyeQ4、英伟达 Xavier 并列成为业界仅有的三款量产级车规智能驾驶芯片。
寒武纪
核心技术:智能处理器微架构、智能处理器指令集、SoC芯片设计、处理器芯片功能验证、先进工艺物理设计、芯片封装设计与量产测试、硬件系统设计等;编程框架适配与优化、智能芯片编程语言、智能芯片编译器、智能芯片高性能数学库、智能芯片虚拟化软件、智能芯片核心驱动、云边端一体化开发环境等。公司已获授权的专利为110项,其中境内专利95项,境外专利15项。
代表产品:思元290/270/100/220系列AI芯片;终端智能处理器IP、云端智能芯片及加速卡、边缘智能芯片及加速卡以及基础系统软件平台。
应用场景:通用型云端训练和边缘/终端推理AI方案。
竞争优势:AI核心技术和人才团队优势;同时为云端、边缘端、终端提供全品类系列化智能芯片和处理器产品的能力。
比特大陆
核心技术:自主研发云端AI芯片,拥有完整的自主知识产权和专利
代表产品:云端芯片算丰BM1680、算丰BM1682、算丰BM1684,终端芯片BM1880。最新一代算丰BM1684芯片聚焦于云端及边缘应用的人工智能推理,采用台积电12nm工艺,在典型功耗仅16瓦的前提下INT8算力可达17.6Tops,在Winograd卷积加速下,INT8算力更提升至35.2Tops,是一颗低功耗、高性能的SoC芯片。
应用场景:视频分析、云+边的“新基建”算力基础设施建设
竞争优势:拥有完整的自主知识产权和专利,同一套SDK和简单易用的工具链支持多形态应用。
遂原科技
核心技术:可编程芯片设计理念、“驭算”计算及编程平台支持主流深度学习框架,并针对邃思芯片进行了特定优化。
代表产品:邃思是针对云端人工智能训练场景的高性能通用可编程芯片,支持CNN、RNN、LSTM、BERT等网络模型和丰富的数据类型(FP32/FP16/BF16/Int8/Int16/Int32等)。其计算核心包含32个通用可扩展神经元处理器(SIP),每8个SIP组合成1个可扩展智能计算群(SIC)。SIC之间通过HBM实现高速互联,通过片上调度算法,数据在搬迁中完成计算,实现SIP利用率最大化。
公司已完成首款人工智能高性能通用芯片“邃思”的研发和量产,并面向数据中心推出数款人工智能算力加速产品,分别是:针对云端训练场景的“云燧T10”和“云燧T11”,针对云端推理场景的“云燧i10”,以及与产品配套的“驭算”软件平台。
应用场景:面向数据中心的高性能云端训练和云端推理,可广泛应用于互联网、金融、教育、医疗、工业及政务等人工智能训练场景。
竞争优势:同时拥有高性能云端训练和云端推理产品。
云天励飞
核心技术:算法芯片化的底层技术能力以及基于“端云协同”技术路线所成功落地的大型解决方案经验和系统落地工程能力。算法芯片化不等于“算法+芯片”,而是指一种算法与芯片融合发展的设计理念和流程。云天励飞自2014年成立以来就践行这套“场景定义算法、算法定义芯片”的思路方法。
代表产品:2017年,云天励飞第一代具有自主知识产权的神经网络处理器采用FPGA实现。2018 年,第二代具有自主知识产权的神经网络处理器芯片DeepEye1000采用 22nm 工艺投片。
应用场景:DeepEye1000可在智能安防、新商业、智慧交通、智能制造、智慧仓储、智能家居、机器人、智能超算等多个行业及领域应用。
全志科技
核心技术:高清音视频编解码技术、高清数字电视信号解调技术
代表产品:主要产品是基于ARM架构的大型SoC,包括R329,R818等28nm的智能语音芯片,以及A系列的平板处理器。R329是全志科技首款搭载Arm中国“周易”AIPU的多核异构处理器,具有高算力、低功耗、低成本等性能。R329拥有0.256 TOPS算力,800MHz频率,能够使用深度学习进行端到端的算法,进一步提升AI语音的识别率和交互体验。R329还集成了主频为1.5GHz的双核Arm Cortex-A53,使R329的整数算力比上一代R328芯片高出1.58倍,浮点算力高1.94倍;其DSP为400MHz的双核HIFI4,拥有HIFi级算法,能够进行音频前、后处理,提升音质效果。
应用场景:全志科技的SoC主要布局物联网,智能家居等领域。作为智能家居的入口,京东的智能音箱搭载的是全志的SoC芯片,还有小米的智能扫地机器人等智能硬件产品。
瑞芯微
核心技术:应用处理器技术
代表产品:RK3399Pro AI芯片采用big.LITTLE大小核CPU架构,双核Cortex-A72+四核Cortex-A53。其它产品还包括智能应用处理器芯片、智能物联应用处理器芯片、电源管理芯片等。
应用场景:智能物联硬件
鲲云科技
核心技术:自主研发推出定制数据流CAISA架构和编译工具链RainBuilder
代表产品:数据流AI芯片CAISA搭载了四个CAISA 3.0引擎,峰值性能可达 10.9TOPs,具有超过1.6万个MAC(乘累加)单元以及所有辅助逻辑。为支持较高的硬件资源利用率,同时设计了分布式数据流缓存,为每个CAISA引擎提供超过340Gbps的带宽,可实现最高95.4%的芯片利用率;CAISA引擎本身基于对常用神经网络模型的计算量统计进行优化,其不仅为常见的神经网络计算(如Pooling,ReLU等)实现了专用的硬件计算模块,且与卷积计算的比例经过平衡,可在常用AI算法中实现最佳性能,满足不断增长的边缘侧和IDC算力需求,为客户提供更高的算力性价比。
应用场景:基于CAISA芯片,鲲云科技推出面向边缘端、数据中心进行深度学习推断的AI专用计算加速的星空加速卡X3,定位于高性能AI推断加速,星空加速卡兼容TensorFlow、PyTorch、Caffe、ONNX(MXNet) 等主流框架,可简单快速实现AI算法模型到硬件上的无缝迁移,充分体现其高算力性价比、高通用性和高软件易用性。目前星空加速卡X3已应用于航空航天、智慧城市、安防、安全生产、电力、工业等领域。
竞争优势: 鲲云基于自身数据流AI芯片技术,提供从底层硬件到顶层算法在内的软硬件一体化人工智能解决方案,推动人工智能在电力、安防、安监生产、工业视觉等不同行业及领域的垂直落地。 在电力领域,鲲云网面向输配变场景提供人工智能巡检解决方案;在石油石化领域,鲲云提供算力算法一体化的智慧安监解决方案;在智能制造领域,鲲云提供AI加速卡为AOI检测赋能算力,其星空加速卡基于数据流技术,对batchsize不敏感且处理延时低,在技术特性上适配产线实时检测应用需求且为工业用户提供具有更高算力性价比。 目前鲲云的AI加速芯片及产品已在智慧城市、智能制造、智能遥感、安监生产等领域落地,与浪潮、飞腾、DELL和中国联通等达成合作,加速数据流AI计算产业化落地。
作为首批参与AIIA DNN Benchmark 项目的AI芯片企业,鲲云参与制定AI芯片行业基准测试标准,芯片产品经第三方认证已成为首批披露benchmark的AI加速产品,且AI加速产品目前已经同飞腾、麒麟、浪潮等完成了适配和国产化产品认证。
依图科技
核心技术:计算机视觉技术、语音识别技术、自然语言理解技术
代表产品:求索AI芯片,以及基于求索芯片的原石系列服务器、前沿系列边缘计算设备。
应用场景:人脸识别、语音识别、医疗等。
竞争优势:以人工智能芯片技术和算法技术为核心,研发及销售包含人工智能算力硬件和软件在内的人工智能解决方案。解决方案的形态主要包括软件、硬件、软硬件组合以及 SaaS 服务等。
2020 年,在ACM 国际多媒体会议(ACM MM)主办的 “大规模复杂场景人体视频解析”挑战赛中,公司获得“行为识别”的单项第一名,其算法指标将以往学术界中的基准算法提升了近 3 倍;2018 年底,公司在全球最大开源中文数据库的词错率测试上刷新纪录;2019 年,声纹识别技术也在全球说话人识别挑战赛(VoxSRC)中刷新纪录;2019 年 2 月,在世界顶级医 学期刊 Nature Medicine 发表基于中文文本病历做临床智能诊断的研究成果(影响因子 32.621),这是目前自然语言理解技术分析中文文本病历发表的最高分文章。
启英泰伦
核心技术:脑神经网络处理器核(BNPU)、语音识别、声纹识别、自然语言处理、麦克风降噪增强技术
代表产品:CI100X系列、CI110X系列、CI112X系列。二代语音芯片CI110X系列(CI1102/CI1103)性能较一代芯片有了很大提升,增加了声纹识别、波束形成、语音定向、离在线识别、本地命令词学习等更丰富的功能,成本也下降了很多,功耗甚至降到1/3。成本更低的升级版语音芯片CI1122,在算法方面,5dB信噪比噪声环境下识别率可以达到85%以上,意味着像油烟机这种高噪声设备都可以轻松进行语音控制。
应用场景:智能语音、智能家居。
知存科技
核心技术:基于Flash的模拟存算一体技术
代表产品:MemCore系列芯片采用国际领先的模拟存算一体芯片架构,使用Flash单元完成8bit权重存储和8bit * 8bit的模拟矩阵乘加运算。单一Flash阵列可并行完成200万次矩阵乘加法运算,计算吞吐量相比DRAM和SRAM等存储器带宽高出100-1000倍。MemCore001/MemCore001P两款智能语音芯片可支持智能语音识别、语音降噪、声纹识别等多种智能语音应用。
针对可穿戴和移动设备的MemCore101芯片,针对电池驱动设备所使用的智能视觉芯片MemCore201芯片。这两款芯片可在低功耗的情况下提高算力50倍,为电池驱动设备赋能强力AI运算,延长待机时间的同时增加智能化功能。
应用场景:智能语音、智能视觉、可穿戴设备、移动设备等。
竞争优势:由于存算一体芯片还处于市场空白阶段,并无头部巨头垄断趋势,较其他类型芯片生产周期更长,行业竞品普遍产品化能力较弱,而知存科技已经历六次流片,产品即将上市,具有明显的先发优势。在存算一体芯片研发中,“如何设计存储器,使其具备处理器的运算能力”是最重要也是最难的部分。
亿智电子
核心技术:NPU、多场景AI算法、数模混合类IP设计、操作系统及软件技术
产品及应用:安防、车载、AIOT。SV系列芯片主要应用于视像安防领域,如:出入口闸机、考勤机、门禁机等;SA系列芯片主要应用于汽车电子,如:DMS+BSD,智能DVR等;SH系列芯片主要应用于智能硬件,如:智能家电,教育类智能硬件等。
应用及客户:人脸面板机、AI IPC、智慧屏及OTT盒子、车载DMS、教育电子等。客户有中科创达、汉王、多度、长视、锐颖、安威士等。
竞争优势:以SoC级的芯片整合设计和AI算法为核心的整体交付服务。
黑芝麻智能
核心技术:视觉感知技术、嵌入式图像和计算机视觉
代表产品:两大自研核心算法IP:NeuralIQ ISP图像信号处理器及高性能深度神经网络算法平台DynamAI NN引擎。2020年6月发布华山二号A1000芯片,具备40-70TOPS的强大算力,小于8W的功耗及优越的算力利用率,能支持L2+及以上级别自动驾驶。2020年9月,推出FAD(Full Autonomous Driving)全自动驾驶计算平台,基于华山二号A1000芯片的双芯级联方案打造,算力最高可达140TOPS,支持L2+/L3级别自动驾驶场景。
应用场景:ADAS及自动驾驶。人工智能系统级计算芯片(SoC),核心技术包括图像/视频处理、光学处理、感知理解算法、深度神经网络和融合感知系统,相当于提供一个从传感器端到应用端的全栈式感知解决方案。针对车辆、行人、车道线、交通标识、信号灯等信息,通过传感器感知信号,利用控光技术把光场进行处理,使得摄像头能在各种特殊工况条件下成像,再通过毫米波雷达、超声波雷达、GPS、IMU与摄像头融合,把这些信号传入到黑芝麻感知系统,再通过优化的SoC计算平台,把感知结果传给自动驾驶企业去做决策和控制。
目前已和博世、一汽、通用、比亚迪等展开深入合作,提供视觉感知算法和芯片商业应用。
竞争优势:专注于视觉感知与AI芯片,开发基于图像处理和人工智能的嵌入式芯片计算平台,为ADAS及自动驾驶打造整体落地方案。
壁仞科技
创立于2019年9月,致力于开发原创性的通用计算体系,建立高效的软硬件平台,同时在智能计算领域提供一体化的解决方案。团队由国内外芯片和云计算领域核心专业人员、研发人员组成,在GPU、DSA(专用加速器)和计算机体系结构等领域具有深厚的技术积累和独到的行业洞见。在成立不到一年的时间内,壁仞科技已经累计融资近20亿元人民币。
从发展路径上,壁仞科技将首先聚焦云端通用智能计算,逐步在人工智能训练和推理、图形渲染、高性能通用计算等多个领域赶超现有解决方案,实现国产高端通用智能计算芯片的突破。
深聪智能
核心技术:全链路语音交互关键技术
代表产品:太行一代芯片TH1520 TH1520语音识别芯片。TH1520是公司第一代芯片产品,低功耗的优势让其场景适应能力更强,并已在众多智能终端产品中得以应用。
应用场景:智能家居,智能车载,智能可穿戴。主要客户包括美的集团,海信集团,盯盯拍,松下,美菱,海尔等。
竞争优势:软硬一体化,即“算法+芯片”结合整体解决方案。
肇观电子
核心技术:人工智能计算机视觉处理技术
代表产品:N系列、D系列、V系列芯片。N系列芯片是针对超高清AI智能摄像头产品开发的低功耗高性能SoC芯片,分别提供8M/4M/2M像素级别图像采集处理能力,最高算力可达到2.4TOPS。支持高质量的ISP处理,内置3D降噪和动态对比度提升模块,并集成了HDR专利技术。D163A芯片是针对机器人和3D视觉智能摄像头产品开发的一款低功耗高性能SoC芯片。在N163芯片的基础上,增加了高性能的双目深度视觉处理的独立硬件IP,能够实时输出深度图像。同时,提供了更加丰富的外围接口,以适用机器人等智能终端的开发需求。V163A 芯片在D163的基础上,性能更进一步, 已通过AEC-Q100 Grade 2 标准。
可用于ADAS辅助驾驶等专业车载应用。
应用场景:专业安防、辅助驾驶、机器人、家用摄像、人脸识别等领域。
天数智芯
核心技术:GPGPU高端大芯片及超级算力
代表产品:7纳米GPGPU高端自研云端训练芯片Big Island(简称BI),聚焦于云端训练及推理,通过自研指令集释放强大的可编程性与应用通用性,提供业界领先的AI算力密度与能效比。
应用场景:应用于AI训练、高性能计算(HPC)等场景,服务于教育、互联网、金融、自动驾驶、医疗、安防等各相关行业。
探境科技
核心技术:存储优先的芯片架构SFA (Storage First Architecture ),以存储驱动计算打破存储墙针对AI计算“高差异、高并发、高耦合”特性。
代表产品:语音识别芯片音旋风611;具备AI双麦降噪功能的语音识别方案--Voitist音旋风612;离在线一体的语音识别解决方案--Voitist音旋风621;Voitist 631--实时AI降噪;Voitist 711/712 – 本地自然语言处理(NLP);Imagist851 (12.8TOPS/ 3.2TOPS/ 1.6TOPS),支持视频结构化、人脸分析、人数统计、车牌分析等业务处理。
主要客户:合作伙伴包括美的、海尔、TCL、欧普照明等知名厂商,并已同客户合作开发20余个智能产品种类,包括空气净化器、智能开关、茶吧机、智能灯具、智能空调等。
应用场景: 边缘计算、安防。
嘉楠科技
核心技术:基于RISC-V架构的边缘智能计算、神经网络加速器
代表产品:第一代AI芯片勘智K210,基于RISC-V架构自主知识产权商用边缘AI芯片;第二代芯片勘智K510比一代芯片提升了3倍的算力,主要针对端侧进行多路高清视频的处理。应用场景:智能驾驶、智慧零售、智能防盗及其他的智能家居领域。
云知声
核心技术:语音感知、认知和表达、超算平台与图像、机器翻译等多模态人工智能硬核技术。
代表产品:蜂鸟芯片是专为智能家居设计的异构SoC,是最新一代专门为离在线远场语音交互场景设计的高性能、高集成度、低成本的语音智能IoT芯片,主要面对智能家电、小家电、灯具、智能插座等产品领域。其特性如下:VAD+DSP+NPU+CPU 异步低功耗架构;前端信号处理DSP,性能是 HiFi4 的两倍;提供更好的降噪,增强,BF等功能;高效神经网络处理器提供更快速和准确语音识别;内置1.5MB SRAM;支持安全启动;支持100条本地离线指令识别;RTOS轻量系统;丰富的外围接口;芯片正常工作功耗 100mW。
应用场景:提供跨硬件平台、跨应用场景,端云一体的人工智能整体解决方案,广泛应用于家居、医疗、金融、教育、交通、汽车、地产等领域。合作伙伴数量超 2 万家,主要客户涵盖平安、世茂、吉利、格力、美的、海尔、华为、京东、360 等头部企业。
竞争优势:通过“云端芯”一体化产品体系面向行业推出全栈式 AI 技术能力,打造从 AI 技术创新到产业应用的生态闭环。
清微智能
核心技术:动态可重构阵列技术(DCRA)--软件编程和硬件编程兼备的可重构阵列,极大提高能效比;CGRA核心调度技术;动态宽电压技术 DWVT逼近CMOS电压阈值的技术。
主要产品:TX101智能传感器;TX210智能语音处理芯片;TX510智能视觉处理芯片。
应用场景:新零售、智能可穿戴设备、智能家居、安防监控、智能家电、智能车载设备。
清微智能源于清华大学微电子所魏少军教授领导的可重构计算团队,自2006年开始进行可重构计算理论和架构研究。2018年第三季度完成近亿元级天使轮融资,投资方包括百度战投、分众传媒、禧筠资本、国隆资本、西子联合控股等。首席科学家尹首一博士为清华大学微电子所副所长、Thinker芯片团队带头人;CTO欧阳鹏为清华大学博士,Thinker芯片主架构师。
酷芯微
核心技术:视觉AI处理器平台、高性能无线数据链路。
代表产品:AR9000系列高性能、低功耗Edge AI 边缘智能处理SoC,集成了自主研发的远距离无线基带和射频、高性能ISP、神经网络专用加速器、视频编解码等核心技术,并且集成有USB3.0、千兆以太网、PCIE、CAN总线等丰富的外围接口;AR9200系列芯片可应用于无人机、机器人、工业控制、辅助驾驶、智慧楼宇等多个领域。
应用场景:无人机、无人新零售、智能安防、家庭服务机器人、工业视觉、IOT应用和通信等市场。
杭州国芯
核心技术:神经网络处理器gxNPU技术、数字电视、IoT AI
代表产品:GX8002 超低功耗AI语音芯片;GX8010 物联网人工智能芯片;GX8009 AI语音SoC芯片;GX8008 AI语音处理芯片;GX8001 YOC芯片。AI产品采用多核异构,有NPU、ARM、C-Sky、DSP等架构,低功耗语音唤醒算法,双麦阵列降噪算法,VAD检测算法,离线ASR算法,神经网络压缩算法。
应用场景:智能车载、智能音箱、智能家居、智能穿戴等多个应用领域。已和阿里巴巴、京东、百度、360、Rokid、出门问问、科大讯飞、声智、思必驰、创维、TCL、海尔等公司达成深入合作。
耐能
核心技术:可实时重构边缘AI技术
代表产品:KL720 AI芯片支持4K图像,全高清(1080p)视频和自然语言音频处理,从而使设备可捕获更多细节进行面部以及音频识别;KL520 AI芯片加速了来自耐能以及第三方大众设备上的神经网络模型,从而方便了日常设备中实现2D / 3D视觉识别以及音频识别。
主要客户:大唐、义隆、格力、搜狗。
应用场景:专注边缘AI计算,广泛应用于智能家居、IP摄像头、智慧安防以及移动应用等。
耐能获得的融资额累计超过7300万美元。将与鸿海共同合作开发汽车行业中的AI应用领域。此外,耐能和鸿海的合作也将共同推进工业4.0。耐能和华邦电子将致力于开发基于AI的微控制器(MCU)和内存计算(Memory Computing )。
平头哥
平头哥半导体是阿里巴巴全资的半导体芯片业务主体,主要针对下一代云端一体芯片新型架构开发数据中心和嵌入式IoT芯片产品。含光800 AI芯片的算力相当于10颗GPU。例如,实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms。而使用含光800仅需4颗,延时降至150ms。
百度
百度自主研发的云端AI通用芯片百度昆仑1已实现量产和应用部署,性能相比T4 GPU提升1.5-3倍;百度昆仑2预计2021年上半年实现量产,与百度昆仑1相比性能将提升3倍。
北京君正
专业级视觉AI应用协处理器T02拥有高达8T的计算能力,全速运行情况下功耗仅需1.5W,可以搭配各大平台实现视频结构化——车牌、车型、人脸、人形,一颗芯片完成人形、车辆、非机动车检测及人脸识别、车牌识别、人车属性分析。搭载T02协处理器的产品已经广泛应用于平安城市、电力、学校等多种安防项目中。
最新一代智能视频SoC芯片T31系列采用22纳米工艺,拥有高达1.8G的主频,最高支持500万25帧,并有BGA和QFN两种封装方式。T31系列芯片包括T31L和T31A,可在设备端集成北京君正的系列深度学习算法,包括深度学习的人形、人脸、车牌的检测和识别。相较于传统的CV算法,北京君正深度学习算法更高效,在复杂环境如遮挡、大角度等场景下更准确,解决了CV算法的痛点,从容赋能端级AI。
使用北京君正视频芯片的产品包括华来大方小方、360智能门铃、HIVE智能卡片机、热成像与人脸识别一体机等。
光子算数
核心技术:光电融合计算技术。
主要产品:基于自主研发的光子AI芯片,提供用于服务器的光电融合AI计算板卡。板卡采用光电异构的智能计算架构,用硅基集成光学的方法对AI计算的主要部分(矩阵运算)进行加速,相较于传统纯电的AI芯片方案可节省4/5的功耗。
可编程光子阵列芯片FPPGA(Field Programmable Photonic Gate Arrays),其中的光学单元可以通过电控,控制重新的连接组合方式,实现不同的复杂函数。也就是说,FPPGA具有可重构的特性。
光子算数与高校一起打造了面向服务器的光电混合AI加速计算卡,目前已完成一些定制化加速任务,包括机器学习推理、时间序列分析等特定任务。
结语
AI芯片是针对人工智能领域的专用芯片,主要支撑AI算法的运行,它是一种软硬件全栈集成的专用处理器。除CPU和其他通用计算覆盖的市场外,AI芯片是新兴领域中需求量最大的计算处理芯片。随着数据积累和更复杂算法的出现,对计算能力的需求也在快速提高。同时,实时计算进一步增加了对计算芯片响应能力的需求。
AI芯片必须与特定应用场景的AI算法配合起来才能真正实现AI的商业化落地,中国AI芯片厂商正从原来强调算力和独特技术的倾向逐渐向针对特定应用场景而优化的方向转变。随着AI应用的普及和成效开始凸显,国产AI芯片将迎来全面爆发和增长,多家AI芯片独角兽也将慢慢浮出水面。
原文发布与ESMC姊妹网站EETC
相关文章