我们一直称英特尔为硬件公司,恐怕要换一种说法了。“每当下午临近下班,我都会收到很多邮件,几乎都来自欧洲,他们通过开源社区与我们深度交流和合作。”换做三年前,我一定不敢相信这句话是出自英特尔高级首席工程师、大数据技术全球CTO戴金权之口,不是不相信这位大咖的头衔和姓名,而是我似乎要重新审视英特尔软件方面的实力。
维基百科对英特尔的描写还是芯片、网卡、闪存、嵌入式处理器等产品,哪怕从历史来看,英特尔也是经历过从存储器到处理器为核心的纯硬件公司。软件这件事该从何说起?
不管是本月的“英特尔以数据为中心产品技术媒体分享会”,还是英特尔主办的开源技术峰会(OSTS2019)上,英特尔都提到自己有15000名软件工程师,从数量上来看似乎可以与互联网公司媲美。这庞大的团体,到底在搞什么?
英特尔高级首席工程师、大数据技术全球CTO戴金权
TechSugar记者从最近的英特尔发言人的演讲中发现了他们的目的——构建统一平台。
为什么要统一?
在5月25日南京举办的“2019全球人工智能技术大会”上,戴金权的主题是“Analytics ZOO统一的大数据分析+AI平台”。这主题给人的直观感受就是,Analytics ZOO玩的就是串联整合工作,而戴金权称之为流水线工作。
“通过开源Analytics Zoo可以实现的是:1,能够将不同的框架无缝的集成到流水线里面去,通过在软件层上面各种新的支持或者功能,能够将TensorFlow、Spark能够非常无缝的集成在一个程序里面。2,开发过程运行在Spark引擎,可以嵌入各种深度学习功能,目的是让其运行在一个单机环境。”戴金权如此解释。
在其PPT中可以看出(如下),Analytics Zoo解决的是深度学习和大数据分析之间的断层。正如戴金权所说:“Analytics Zoo目前要解决的就是两个问题,一个是要构建一个端到端的应用场景,另一个是用户在开发时,需要经历从笔记本到大规模分布式环境,两个生产环境的切换较为麻烦。”
显然这两段话上下呈现了果因关系,充分介绍了英特尔做Analytics ZOO的初衷。
如果理解起来有点模糊,不妨看点应用案例:
Analytics Zoo 平台可以协助韵达通过图像识别获得准确大小件测量数据,通过深度学习优化件量测量(防止爆仓),通过AI强化训练检测异常。从而达到提升效率,降低成本的作用。
韵达案例示意图
宝信软件利用该平台开发了设备故障自动预测的验证模型,该模型基于业界公开的设备全生命周期数据,利用循环神经网络(RNN)特别是长短期记忆模型(LSTM),实现了时间序列的异常检测(Time series anomaly detection),并可以在数据上进行无监督深度学习和预测。
美的工业视觉检测云平台把前端设备收集的图像数据通过4G 或Wi-Fi 传输到云端,通过深度学习框架,经由训练获得非标准化视觉检测特征,最终打造出通用化、智能化的瑕疵检测能力。而这一过程实现的关键,是英特尔Analytics Zoo 大数据分析+AI 平台。
要不是笔者担心过多举例导致篇幅累赘和困意袭击,其实还是有许多案例值得一说。据介绍,该平台的客户包括OEM厂商、软件提供商和一些公有云服务商。
为什么要“软”?
软件对于英特尔这样的硬件公司到底意味着什么?
戴金权在为英特尔平台举例时很少用到效果类数据,唯一一句还是“京东最后做过测试,当他把整个原来的方案迁移到Spark BigDL这样一个完整的流水线上 (基于CPU),他把整个端到端的运行效率也提高了3、4倍。”
可见,软件对于英特尔来说,就是给客户更高效的方案。
此前英特尔推出了“One API”项目,以简化跨CPU、GPU、FPGA、人工智能和其它加速器的各种计算引擎的编程。该项目包括一个全面、统一的开发工具组合,以将软件匹配到能最大程度加速软件代码的硬件上。
此举又是针对客户需求,一切为了简化、便捷和统一。
难道软件之于英特尔仅仅是满足客户需求,来赚取美元吗?
在此前的开源技术峰会上,英特尔公司副总裁兼系统软件产品部门总经理苏义德(Imad Sousou)在会上强调:“软件是英特尔的一项重要战略资产,将帮助我们挖掘商业价值,真正释放公司的整体增长潜力。”
这话不假,正如英特尔架构日上提出的“六大技术支柱”,其中有一环就是软件,重要性可见一斑。
其实笔者发现,不管英特尔怎么去宣传自己的软件和非软件实力,大部分时候逃不开一张图和一组数据。
“2018年,中国约产生7.6ZB的数据,而且还将保持每年30%的增长,到2025年的数据量将达到48.6ZB;从2015年到2025年,IDC估计全球数据量的增长平均在25%的年复合增长率。”
这也不难理解英特尔此前要说的从PC为中心转移到数据为中心,强大算力的进步显然是离不开软件的优化和激发潜能的。英特尔战略性地服“软”,这庞大的数据洪流正席卷而来。
相关文章