浪潮信息发布源2.0基础大模型,千亿参数全面开源

发布时间:2023-11-28  

1127日,浪潮信息发布"2.0"基础大模型,并宣布全面开源。源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。

当前,大模型技术正在推动生成式人工智能产业迅猛发展,而基础大模型的关键能力则是大模型在行业和应用落地能力表现的核心支撑,但基础大模型的发展也面临着在算法、数据和算力等方面的诸多挑战。源2.0基础大模型则针对性地提出了新的改进方法并获得了能力的提升。

算法方面,源2.0提出并采用了一种新型的注意力算法结构:局部注意力过滤增强机制(LFA:Localized Filtering-based Attention)。LFA通过先学习相邻词之间的关联性,然后再计算全局关联性的方法,能够更好地学习到自然语言的局部和全局的语言特征,对于自然语言的关联语义理解更准确、更人性,提升了模型的自然语言表达能力,进而提升了模型精度。

1.jpg

数据方面,源2.0通过使用中英文书籍、百科、论文等高质量中英文资料,降低了互联网语料内容占比,结合高效的数据清洗流程,为大模型训练提供了高质量的专业数据集和逻辑推理数据集。为了获取中文数学数据,我们清洗了从2018年至今约12PB的互联网数据,但仅获取到了约10GB的数学数据,投入巨大,收益较小。为了更高效地获得相对匮乏的高质量中文数学及代码数据集,源2.0采用了基于大模型的数据生产及过滤方法,在保证数据的多样性的同时也在每一个类别上提升数据质量,获取了一批高质量的数学与代码预训练数据。

2.jpg

算力方面,源2.0采用了非均匀流水并行的方法,综合运用流水线并行+优化器参数并行+数据并行的策略,让模型在流水并行各阶段的显存占用量分布更均衡,避免出现显存瓶颈导致的训练效率降低的问题,该方法显著降低了大模型对芯片间P2P带宽的需求,为硬件差异较大训练环境提供了一种高性能的训练方法。

3.jpg

源2.0作为千亿级基础大模型,在业界公开的评测上进行了代码生成、数学问题求解、事实问答方面的能力测试,测试结果显示,源2.0在多项模型评测中,展示出了较为先进的能力表现。

4.jpg

2.0采用全面开源策略,全系列模型参数和代码均可免费下载使用

代码开源链接

https://github.com/IEIT-Yuan/Yuan-2.0

论文链接

https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/docs/Yuan2.0_paper.pdf

稿源:美通社

文章来源于:电子创新网    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    Pasternack推出温度补偿型射频放大器; 【导读】InfiniteElectronics 旗下品牌,业界领先的射频、微波和毫米波产品供应商 Pasternack 最新推出温度补偿型放大......
    AD8058数据手册和产品信息;AD8057和AD8058均为电压反馈型放大器,拥有一般电流反馈型放大器的带宽和压摆率。两款低功耗放大器均具有低静态电流和宽电源电压范围(3 V至12 V)特性,噪声......
    PM155S数据手册和产品信息;PM155提供低输入电流、高压摆率特性,可以直接与LF155型放大器互换使用。这款运算放大器采用新型工艺,匹配的JFET晶体......
    大时保持稳定。AD9631/AD9632采用电压反馈结构,具有出色的建立时间、带宽和低失真性能,符合许多以前需依赖电流反馈型放大器应用的要求;其经......
    TI新型高压放大器可实现误差敏感型工业应用的准确性;     德州仪器(TI)近日推出了三款兼具高速和高精度的新型放大器,使设计人员能够为误差敏感型应用创建更精确的电路。新器......
    器产品线,适用于VHF、 UHF、L、S、C、X和Ku频段的广泛市场应用。 新型放大......
    外形小巧但功能强大:超小型放大器在复杂系统设计中展现优异性能; 外形小巧但功能强大:超小型放大器在复杂系统设计中展现优异性能 德TI)(NASDAQ: TXN......
    ADA4897-1数据手册和产品信息;ADA4896-2/ADA4897-1 是单位增益稳定、低噪声、轨到轨输出、高速电压反馈型放大器,静态电流为3 mA。1/f噪声为2.4 nV/√Hz (10......
    器通常在外部需要的采样及保持电容器的片内集成。而且,与其他带或不带内部采样 / 保持电容器的斩波器稳定型放大器相比,LTC1051 / LT1053 还可提供更好的整体 DC 和 AC 性能......
    时间为24 ns。该放大器非常稳定,易于使用,过载恢复迅速。它具有极低电压和电流噪声以及低失真特性,非常适合宽带信号处理应用。 作为一款电流反馈型放大器,AD8014具有......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>