人类史无前例的如此牵动整个社会,而且又如此投入了巨大财富的第三次人工智能高潮即将落下帷幕,在此,如何评价本次高潮对社会乃至对科学进步所起的作用?这是一个令人关注的议题。
本文引用地址:本次人工智能的主流算法深度学习尽管从一开始被业界顶礼膜拜,后来又遭到很多的非议!但是,应该肯定原始的神经网络的算法几经被否定,发展到今天的深度学习确立了不可替代的应用效果,应该载入人工智能的史册。
深度学习算法是建立在欧几里德空间中的数据训练的,为实现统计学的效果,一定要依赖于大数据的训练,这是深度学习算法的短板,但是这也有它的优点。欧几里德空间的数据是一个一个独立的,通过卷积神经网路可以任意的映射到不同的输出位置,通过反复的误差修正的训练,可以把例如属于狗的数据放在一个类,把属于猫的数据放在令一类,因此可以实现最佳的分类结果。
在识别狗的图像时,按照统计学的“随大流儿”的原理,狗的数据仍然会被映射到狗的数据类中,而不会映射到猫的数据类中,这样机器就很容易识别出这个图像是狗。这就告诉我们深度学习模型可以让不同类别的数据任意扩大他们之间的间隔,以防止误识别。这就是为什么深度学习会比传统的机器学习算法应用效果好的根本原因,并不是什么其他理论所起到的作用。
但是,在日常的家电,工业控制等领域中,更需要导入人工智能技术,这就是深度学习的大数据大模型的短板,产品的价格限制了这种模型的导入。
一种小数据小硬件的自律学习(Self-Discipline Learning,SDL)模型应运而生,SDL模型既然是小数据小模型会让人担心性能是否能满足应用的需要?通过我们在自动驾驶的光学感知上的开发深有体会,应用效果的好与坏不一定依赖于数据的大小,硬件模型的规模。
那么如何保证小数据小模型的应用效果的突出体现?从SDL模型的三大优势就可以找到答案。
SDL模型具有三个优势:
第一个优势是:可实现训练数据聚集在概率空间,小数据的训练可以产生大数据的效果。
我们发明的概率尺度自组织的算法可以让高斯分布的观察值的最优解,成为接近统计学所称的“母体”的最大概率的解。由此产生的最大概率值,最大概率尺度,以及最大概率空间,这是全新的最佳化理论,最适合于解决人工智能中的随机性的问题。
我们日常所遇到的数据是从确定性的欧几里德空间,发展到了不确定的概率空间,解决这两个空间的距离问题势在必行。在数学界还在为不能统一欧几里得空间与概率空间的距离问题而烦恼时,我们已做到可以在工程应用上,可以通过公式直接计算这个不同空间之间的距离,被用到SDL模型中计算欧几里得空间的数据与训练后的最大概率空间中的数据之间的尺度,成为可跨越不同空间之间的数据自律聚类算法。通过SDL模型所进行的小数据的训练,所形成的最大概率空间却可以包容大数据的效果。因此,SDL模型也是一个高效率的机器学习模型。
第二个优势是:通过Kernel函数实现最大概率空间的高维平面聚类。高维空间的数据是极其复杂的,往往在低维空间是完全重合在一起的,SDL模型结合Kernel函数可以获得高维平面的分类效果。这是小数据小硬件的SDL模型,通过算法可以获得仅仅是低维空间分类的大模型的应用效果的重要成果。
第三个优势是:SDL模型融合深度学习的精华可以获得超越深度学习的应用效果。
通过我们团队日以继夜的奋战,打开了深度学习的黑箱,找到了真正让深度学习产生应用效果的根源,我们结合深度学习在特征抽出,卷积神经网络的训练是深度学习对应用效果起到重要作用的部分,同我们的SDL模型嫁接,既可以体现SDL模型的小数据训练以及高斯分布模型的效果,同时也可体现深度学习的函数映射模型的特点。
经过多年的努力,我们从底层到应用完成了一个适合于嵌入式系统的机器学习模型的全新的提案,对于在家电,工业控制等领域必将会得到广泛的应用。
在我们搞自动驾驶的过程中,针对自动驾驶在复杂的道路上行驶,要想获得L4级别以上的自动驾驶效果,至少是40个要素以上的组合,这就是自动驾驶领域中的图灵机不可解的NP问题。由于我们在很早的时候为解决大规模集成电路的最小面积的模块组合,最短接线长的组合问题上就提出过一个可以绕开集成电路领域的NP问题,可获得了集成电路的最佳化组合的算法。在这个成果的基础上经过努力研究,我们提出了一个可以让L4级别的自动驾驶真正落地的算法,今后的自动驾驶在也不需要GPS,不需要高清地图,不需要对路况事先训练,可以如同人那样自如的在各种不特定的道路上行驶,这就是特斯拉的创始人马斯克所希望的智能AI的自动驾驶。
目前,我们也在同美国的人工智能的著名的Cole实验室共同研究,导入智能AI模型,做出可以超越ChatGPT所使用的强化学习模型的效果,搞出离线的特定场景的智能AI的ChatBot系统。
我们在人工智能算法的大道上疾驶,已经窥见到人工智能未来的憧憬,倍感任重而道远。
相关文章