首页
英特尔、Habana Labs与Hugging Face推动Transforme

英特尔、Habana Labs与Hugging Face推动Transforme

发布时间:2022-12-12

在过去的一年中，、和基于开源项目、集成开发者体验与科学研究，不断提升人工智能应用的效率并降低使用门槛，在创建和训练高质量Transformer模型上取得了重大进展。

本文引用地址：

模型为包括自然语言处理（NLP）、计算机视觉（CV）、语音等在内广泛的机器学习和深度学习任务提供先进的性能。大规模训练这些深度学习模型需要庞大的算力，这个过程非常复杂，不仅需要大量时间，而且成本高昂。

通过颠覆者计划（Intel Disruptor Program）与密切合作，能够帮助用户更广泛地采用基于最新^®至强^®可扩展处理器、Habana Gaudi^®以及Gaudi^®2处理器优化的解决方案。此次合作将英特尔AI工具包中先进的深度学习创新技术引入的开源生态系统中，并以此推动未来英特尔^®架构的创新发展，在英特尔至强平台上的分布式调优、内置优化、配合Habana Gaudi加速训练，以及小样本学习方面均取得了重大进展。

当使用单节点CPU进行训练速度不佳时，数据科学家们就需要分布式训练。在分布式训练中，集群中的每台服务器都保留一个模型副本，利用训练数据集的一部分进行训练，并通过^®oneAPI集体通信库（Collective Communications Library）在各节点之间交换结果，从而更快地收敛到最终模型。目前，Transformer可原生支持该功能，并使数据科学家们更容易地进行分布式调优。

例如，在英特尔至强可扩展处理器的分布式集群上加速Transformer模型的PyTorch训练时，为在PyTorch中能够有效利用英特尔^®高级矩阵扩展（英特尔^®）、AVX-512以及英特尔矢量神经网络指令（）等最新英特尔至强可扩展处理器所支持的硬件性能，英特尔为PyTorch设计了英特尔扩展，该软件库可为提供开箱即用的加速功能。

此外，Hugging Face Transformer提供Trainer API，使用户可以无需手动编写训练循环，更轻松地开始训练。该Trainer为超参数搜索提供API，目前可支持多个搜索后端，其中包括可托管的超参数优化服务英特尔SigOpt。得益于此，数据科学家们可以更有效地训练并获取最佳模型。

非凡的开发者体验

Optimum是Hugging Face创建的一个开源库，用于在日益增长的训练及推理设备中简化Transformer的加速。Optimum，而专家则可以通过不断调整以获得最佳性能。

“Optimum Intel”是Transformer库与英特尔所提供的不同工具和库之间的接口，用于加速英特尔架构上的端到端管线。该接口基于英特尔^®神经压缩器所开发，为包括量化、剪枝、知识提取等多项网络压缩技术提供跨多个深度学习框架的统一体验。此外，开发人员亦可使用Optimum Intel来进行针对评估数据集的模型指标对比，从而更加轻松地在Transformer模型上运行训练后量化（PTQ）。

与此同时，Optimum Intel还提供了一个简单的接口来优化Transformer模型，并将模型转换为OpenVINO的中间层表示（IR），从而使用OpenVINO进行推理。

利用Habana Gaudi加速训练

现阶段，正携手Hugging Face更简易、快速地训练大规模、高质量的Transformer模型。得益于Habana的SynapseAI® 软件套件与Hugging Face Optimum-Habana开源库，数据科学家和机器学习工程师能够通过在Habana Gaudi和Habana Gaudi2处理器上运行几行代码，加速Transformer深度学习的训练。

Optimum-Habana库支持各种计算机视觉、自然语言和。其支持且经过测试的模型架构包括BERT、AlBERT、DistilBERT、RoBERTa、Vision Transformer、swin、T5、GPT2、wav2vec2和Stable Diffusion。Hugging Facehub上目前已有4万多个基于这些架构的模型，而开发人员可以使用Optimum-Habana在Gaudi和Gaudi2上轻松地使用这些模型¹。

Habana Gaudi解决方案已经用于亚马逊EC2 DL1实例，采用该解决方案进行训练的一个主要优势是性价比。Habana Gaudi的性价比与同类训练解决方案相比高40%，使客户能用更少的成本进行更多训练²，Gaudi2采用与第一代Gaudi相同的高效架构，同样提供了卓越的性价比。

Habana DeepSpeed也集成在Optimum-Habana库中，让人们在使用DeepSpeed优化的Gaudi设备时，能更易于大规模部署和训练大型语言模型。您可以通过Optimum Habana DeepSpeed使用指南了解更多信息。

最新版的Optimum-Habana在Hugging Facediffusers库中内置支持Stable Diffusion，使Hugging Face开发者能够在Habana Gaudi上进行极具性价比的图像生成测试。

生产中的小样本学习

英特尔研究院、Hugging Face和UKP Lab最近推出了SetFit，这是一种用于对Sentence Transformer进行小样本调优的有效框架。使用预先训练的语言模型进行小样本学习，将有望解决数据科学家在现实中面临的一大挑战：处理那些几乎没有标签的数据。

当前的小样本调优需要手工提示或描述器，将示例转换为适合底层语言模型的格式。通过直接从少量有标签的文本示例中直接生成丰富的嵌入，SetFit可省去提示。

研究人员设计了SetFit，可用于Hugging Face Hub上的任何Sentence Transformer，即通过调优多语言检查点，可以将文本分类为多种语言。

SetFit不需要像T5或GPT-3这样的大模型来实现高精度。与标准调优相比，它显著提高了采样效率并能够更好地耐受噪声。例如，对于在一个示例情感数据集上每类只有八个有标签的例子，SetFit可以与在包含3000个例子的完整训练集上的RoBERTa Large调优相媲美。Hugging Face发现，在零提示且体积缩小27倍的情况下，SetFit也取得了与T-Few 3B相当的效果，从而实现了兼具低成本和高效的训练³。

一直以来，英特尔致力于积极构建生态系统并助力降低AI成本，包括开源项目、集成的开发者体验和科学研究等举措。而工具和软件恰恰能够让开发人员加快构建应用程序，并释放处理器性能。英特尔旨在让人们能够更轻松地在任何地方构建和部署AI，使数据科学家和机器学习从业者能够采用最新的优化技术。

注释：

¹ 基于Hugging Face搜索查询：。这个查询会过滤所有已经测试、验证并在Optimum-Habana中得到支持的Hugging Face模型。
² 基于AWS计算的价格和性能，对比了基于GPU的类似AWS实例。更多信息参见亚马逊相关新闻稿：
³有关性能的详情参见完整论文：和博客文章：

文章来源于:电子产品世界原文链接

本站所有转载文章系出于传递更多信息之目的，且明确注明来源，不希望被转载的媒体或个人可与我们联系，我们将立即进行删除处理。

机构：台积电先进芯片封装专利排名第一，超越三星英特尔(2023-08-02)

利。 LexisNexis PatentSight董事总经理Marco Richter表示：“台积电、三星和因特尔似乎推动了该领域的发展，并制定了技术标准。” 数据......

美媒：三星芯片销售额超越英特尔(2021-08-04)

个芯片生产工厂的造价可能达到200亿美元。美国康特波因特研究公司的研究总监盖欣山说，芯片制造的下一个前沿领域要求非常高，只有台积电、三星和英特尔拥有向前推进的技术能力和雄厚资金实力。报道指出，这三......

佰维存储推出DDR5 DRAM存储模组，助力智能“端”应用创新迭代(2021-10-22)

DDR5时代即将开启根据VCZ的最新消息，支持DDR5的因特尔12代酷睿处理器将于11月4日上市发售。后续，支持DDR5标准的PC主机必将迅速涌现。这意味着DDR5的时代将正式开启。相比......

裁员大军再加一员，雅虎今年将裁员 20%(2023-02-10)

独立用户提供多元化的网络服务。同时雅虎也是一家全球性的因特网通讯、商贸及媒体公司。雅虎是全球第一家提供因特网导航服务的网站，总部设在美国加州圣克拉克市，在欧洲、亚太区、拉丁美洲、加拿大及美国均设有办事处。雅虎......

SIMATIC S7-1500 PLC之间的OUC通信(2024-01-15)

PC或非西门子公司设备)在工业以太网上的通信非常容易。该协议支持较大数据量的数据传输(最大1472字节)，数据可以通过工业以太网或TCPIP网络(拨号网络或因特网)传输。通过UDP，SIMATICS7......

AI的最大受益者：跌下神坛的Intel和绝地逢生的nVidia(2017-03-01)

」，所有的核心都是并行工作。而CPU只有几个核心，顺序地处理计算任务。 Nvidia最新的处理器有3584个核心，而因特尔伺服器CPU最多有28个。在2008-2009年的全球金融危机期间，已经......

Fabless的好日子到头了吗？(2017-06-07)

此时的Fabless就特别愿意到台积电投片。虽然在台积电在刚开始时工艺上落后了IDM厂有两代之多，但是随着研发的不断加强，不断缩小与IDM的工艺差距，到现在台积电已经同因特尔、三星这样的IDM厂商......

采用C8051F060单片机和现场总线CAN实现网络测控系统的设计(2024-02-23)

的实现了网络资源共享。而CAN总线技术使得控制系统向着分散化、网络化、智能化的方向发展，使控制技术与计算机以及网络技术更为紧密的结合在一起。随着CAN总线控制网络的进一步发展，控制网络与因特信息网络的结合，方便......

特斯拉自动驾驶广告涉嫌欺诈，加州法官裁定开庭审理(2024-06-11)

功能提起虚假广告诉讼并胜诉。例如，一位英国车主因特斯拉未能交付已支付费用的软件功能而获得约 10,000 美元的赔偿；一位美国车主因特斯拉重复收取硬件费用而要求特斯拉免费升级其电脑系统，并胜诉。 ......

LTC3816数据手册和产品信息(2024-11-11 09:20:05)

期电流限制、输出过压保护、以及 PWRGD 和过热标记。嵌入式计算移动计算机、因特网设备导航显示器......

平台入驻

我们与500+贴片厂合作，完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页，多渠道推广，SEM/SEO精准营销以及与公众号的联合推广...详细>>

原厂代理商合作

利用葫芦芯平台的卓越技术服务和新产品推广能力，原厂代理能轻松打入消费物联网（IOT）、信息与通信（ICT）、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

闲置物料合作

充分利用其强大的电子元器件采购流量，创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术，不仅可以助你轻松识别与连接到需求方，更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

生态合作

我们的目标很明确：构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前，我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

加工与定制类服务商合作

我们深知加工与定制类服务商的价值和重要性，因此，我们倾力为您提供最顶尖的营销资源。在我们的平台上，您可以直接接触到100万的研发工程师和采购工程师，以及10万的活跃客户群体...详细>>

线上代理合作

凭借我们强大的专业流量和尖端的互联网数字营销技术，我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品，都可以通过我们的平台迅速传达给目标客户...详细>>

邮件营销及广告服务

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环，从引流、宣传到最终销售，全程跟进，确保每一个potential lead都得到妥善处理，从而大幅提高转化率。不仅如此...详细>>