IDC于近日发布了《AI与大数据开源生态研究》报告,本报告重点研究了中国AI与大数据开源生态的市场格局、市场进展与未来发展趋势等内容,能够帮助技术供应商把握制胜因素,也可使终端用户了解应用机会、市场空间等。
本文引用地址:开源技术是人工智能市场发展的重要驱动力,从最早的开源数据库、深度学习框架、算法模型,到今天端到端的人工智能应用解决方案,再到开发语言,以及底层的开发平台,人工智能应用开发已不再是简单的训练算法模型,而更重要的是打造端到端的AI技术栈。
AI与大数据开源以数据库、AI开发框架等为重点开发领域,未来还将逐步加入算法开源联盟,以支持AI走向普惠,IDC总结出的市场生态如下图所示:
1. 深度学习开源框架:
目前国外主流的深度学习框架有PyTorch、TensorFlow、Caffe等。近年来,PyTorch在产业界生产环境中继续呈现出后来者居上的竞争优势。其供技术供应商参考的成功之处主要有:
1)框架的模型训练效率、易用性吸引开发者快速上手;
2)科研界最新的模型在该框架上得以实现,吸引开发者复现;
3)学术界的科研人员将其成功带入产业界;
4)值得注意的是,2022年9月PyTorch加入了Linux 基金会后,PyTorch 及其社区将受益于 Linux 基金会的许多计划和社区活动支持,包括培训和认证计划、社区研究等。
国内主流的深度学习框架以百度飞桨PaddlePaddle、华为昇思MindSpore等为代表。百度飞桨PaddlePaddle最早加入国产化生态联盟,目前已经升级到2.4版本,中国区域的用户群体覆盖广泛度上逐年提高。2020上半年华为开源昇思MindSpore框架,目前已经升级到2.0版本,也在推出各项活动以招募更多开发者。
2. 开源数据库:
在数据库领域中,开源的发展趋势也十分明显。开发者目前使用较多的还是相对传统的基础关系型数据库MySQL,还有大数据领域Redis、Apache/Hive、MongoDB等,其中绝大部分都是开源的,开源中比较热门的新型数据库包括分布式数据库、时序数据库、图数据库、流式数据库等也在逐渐得到开发者的青睐。最近一两年,国内各大数据库厂商逐步推进开源策略,国内开源数据库产品技术供应商主要来自云厂商,如阿里云、华为云等,也包括PingCAP、TAOS、巨杉数据库、第四范式等明星初创企业。
分析师观点
IDC中国人工智能高级分析师程荫表示, 近两年,越来越多的传统企业开始进行数字化转型和智能化升级,或者加大内部大数据、AI研发力量的投入,为开源数据库、深度学习开源框架的应用带来机会。有计划或者新发布相关产品的企业,可以从选定高潜力的应用场景、推出能够落地到生产环境的算法模型、软硬一体技术栈高度优化、寻找用户群体着手,为开源生态建设贡献力量,从而加深、加快大数据/AI产业应用,以支持AI走向普惠。
相关文章