亚马逊云科技成功助力TII训练400亿参数规模的大语言模型Falcon 40B

发布时间:2023-06-08  

Hugging Face 开源大语言模型排行榜上排名第一的Falcon 40B现已在Amazon SageMaker JumpStart上可用,让客户更便利地利用这一模型快速构建生成式AI应用程序。

6月7日 -- 亚马逊云科技今日宣布,位于阿联酋首都阿布扎比的全球领先科研中心TII(Technology Innovation Institute)在亚马逊云科技上训练了其性能卓越的开源模型Falcon 40B。Falcon 40B是拥有400 亿参数的大语言模型(LLM),在Apache 2.0许可下提供,并在Hugging Face的开源大语言模型排行榜上位列榜首。该排行榜在多个基准测试中跟踪、排名和评估大语言模型,最终评选出最佳模型。客户现在可以将Falcon 40B部署在Amazon SageMaker JumpStart上,这是一个机器学习中心,提供预训练模型,使客户无需从头构建自己的模型即可获得Falcon 40B最先进的准确性和行业领先的性能。要开始使用Amazon SageMaker JumpStart,请访问aws.amazon.com/sagemaker/jumpstart。

大语言模型是机器学习(ML)模型的一个分支,专注于语言领域,可以支持各类生成式AI应用,包括文本处理、总结摘要和会话问答。虽然这些大语言模型具有改变行业的潜力,但构建、训练和部署大语言模型可能需要数周甚至数月的时间,并耗资数千万美元,这将许多公司拒之门外。为了在整个开发过程中实现更好的性能和成本效益,包括Stability AI、AI21 Labs、Hugging Face和LG AI在内的众多客户使用亚马逊云科技端到端的机器学习服务Amazon SageMaker来构建、训练和部署他们的大语言模型。

这也正是TII使用Amazon SageMaker构建其Falcon 40B模型的原因。得益于SageMaker是一项完全托管的服务,TII可以专注于开发自定义的训练机制和优化功能,而无需管理其机器学习基础设施。为了最大限度地降低训练成本并缩短上市时间,TII采取了多项优化措施,包括编写自定义矩阵乘法以加快训练速度。在整个训练过程中,亚马逊云科技还与TII密切合作以利用SageMaker增强可用性,确保训练顺利进行,减少对开发人员的干扰。

TII于2023年5月在Apache 2.0许可下发布了其Falcon 40B模型。自发布以来,Falcon 40B 在各种基准测试中的表现都优于当下的同类模型,展示了无需专门微调的卓越性能。为了让客户更轻松地访问该模型,亚马逊云科技让Falcon 40B可以通过Amazon SageMaker Jumpstart部署。现在,各个行业、各种规模的客户都可以快速轻松地部署自己的Falcon 40B模型,并对其进行定制以满足他们的特定需求,如翻译、问答、信息总结、图像识别等应用程序。

"Falcon 40B的开源版本使机构能够利用其卓越性能来推动AI赋能的解决方案的发展。这是我们致力于促进 AI 创新的重要里程碑,也体现阿联酋深远的科学贡献。"TII跨AI研究中心执行总监兼LLM项目负责人表示,"通过将Falcon大语言模型开源,我们希望将这一先进的技术能力普惠化,为全球研究人员和组织赋能。下一步,我们即将推出新模型,为人工智能和先进技术领域的进一步发展做出贡献。"

关于亚马逊云科技

自2006年以来,亚马逊云科技(Amazon Web Services)一直以技术创新、服务丰富、应用广泛而享誉业界。亚马逊云科技一直不断扩展其服务组合以支持几乎云上任意工作负载,目前提供超过200项全功能的服务,涵盖计算、存储、数据库、网络、数据分析、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体,以及应用开发、部署与管理等方面;基础设施遍及31个地理区域的99个可用区,并已公布计划在加拿大、以色列、马来西亚、新西兰和泰国新建5个区域、15个可用区。全球数百万客户,包括发展迅速的初创公司、大型企业和领先的政府机构,都信赖亚马逊云科技,通过亚马逊云科技的服务支撑其基础设施,提高敏捷性,降低成本。要了解更多关于亚马逊云科技的信息,请访问: www.amazonaws.cn。

稿源:美通社

文章来源于:电子创新网    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    参数——汽车软件开发中最大的挑战之一;一个参数很少单独出现。 我们的许多客户已经在他们的应用程序中实现了成百上千个参数,以便在车辆中参数化(即应用)软件。这不仅体现在动力系统和发动机的开发上,还体......
    调速变频器怎样调快慢参数 变频器调速怎么设定 变频器过载故障处理;  调速变频器怎样调快慢参数   调速变频器的调整参数包括基本参数和高级参数两部分,其中基本参数主要包括输出频率、最大频率、最小......
    pid调节器的使用操作与参数设置;  pid调节器的使用操作与调整   PID调节器的使用操作一般包括以下几个步骤:   设置目标值:确定需要控制的目标值,例如温度、压力、流量等。   连接......
    三菱FX系列PLC通过指令与A700变频器通讯;一、A700/F700变频器相关参数 l 操作模式: 参数Pr79=0 l 通讯站号: 参数Pr331=0 l 通讯速率: 参数Pr332=96 l......
    C语言中的可变参数函数的浅析(以Arm 程序中的printf()函数实现为例);我们在C语言编程中会遇到一些参数个数可变的函数,一般人对它的实现不理解。例如Printf():   Printf......
    什么是矢量网络分析仪的S参数?;矢量网络分析仪测量时,经常会用到的一个参数就是S参数,S参数是射频通信领域应用的一种测量参数,全称是散射参数,是网络分析的语言。矢量网络分析仪对S参数进行测量时,会有......
    伺服控制器的参数设置_伺服控制器报警代码;  伺服控制器的参数设置   伺服控制器的参数设置涉及到多个方面,包括电气参数、控制参数、运动参数等。下面列举一些常见的伺服控制器参数设置:   电气参数......
    西门子博途:SET:置位字节数组指令参数及工作原理;说明 可以使用“置位位数组”指令,将指定区域中位的信号状态置位为“1”。在参数 S_BIT 中使用指针定义范围起点。如果指针指向外部 I/O 的存......
    西门子g120变频器快速调试步骤;一、操作面板的认知与操作 1、 基本操作面板BOP-2 图1-1 基本操作面板 BOP-2基本操作面板安装于控制单元上方,可以用于对变频器的调试,运行监控以及输入某个参数......
    G120变频器参数设置实用技巧;关于启程 启程自动化培训成立于2012年,创始人工控老鬼。培训项目主打三菱、西门子PLC编程系统集成、工业机器人编程、EPLAN电气设计、视觉......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>