资讯
专访燧原科技首席公共事务官蒋燕:不仅自研硬件架构,也自研软件框架平台丨WAIC(2023-08-07)
专访。本文引用地址:
本届大会评选出九大“镇馆之宝”,“云燧智算集群”就位列其中。据悉,“云燧智算集群”是面向大型智算中心的高性能人工智能加速集群,旨在满足时代对超大规模算力的需求。集群搭......
银行智算中心部署浪潮AIStation,模型训练效率提升7倍(2023-01-03 14:26)
网络方案,实现GPU资源灵活调度银行智算中心网络构建方案目前有很多,其中RoCE网络基于以太网协议实现RDMA,可以复用已有数据中心的网络设备,从而降低集群搭建成本。基于RoCE的网络方案,需要充分考虑GPU......
银行智算中心部署浪潮AIStation,模型训练效率提升7倍(2023-01-03)
了资源利用率。
领先网络方案,实现GPU资源灵活调度
银行智算中心网络构建方案目前有很多,其中RoCE网络基于以太网协议实现RDMA,可以复用已有数据中心的网络设备,从而降低集群搭建成本。基于RoCE......
“燧原科技面向AIGC模型训练的液冷集群”荣获2023世界人工智能大会“SAIL之星”(2023-07-10 10:40)
节点、网络节点和管理节点,配套燧原科技自主研发的一系列集群软件,可助力超大规模训练和推理任务运算。云燧智算集群搭载了燧原自研的集群管理软件CloudBlazer Station,通过软硬件的协同优化,实现......
"燧原科技面向AIGC模型训练的液冷集群"荣获2023世界人工智能大会"SAIL之星"(2023-07-10)
节点和管理节点,配套燧原科技自主研发的一系列集群软件,可助力超大规模训练和推理任务运算。
云燧智算集群搭载了燧原自研的集群管理软件CloudBlazer Station,通过软硬件的协同优化,实现......
Supermicro推出直接液冷优化的NVIDIA Blackwell解决方案(2024-11-25 09:55)
解决方案奠定基础。Supermicro的计算集群搭配直接液冷技术,可帮助整个数据中心实现更高的性能和更低的功耗,并降低运营成本。"欲了解更多信息,请访问:www.supermicro.com/hpc。经验......
传小米搭建万卡GPU集群,加速AI大模型布局(2024-12-27)
传小米搭建万卡GPU集群,加速AI大模型布局;这一战略举措标志着小米在AI技术领域的进一步深化,旨在通过强大的计算资源,实现在手机端的端侧AI大模型应用,并逐步扩展至汽车、智能......
国产高性能DPU芯片“智算琢光”发布!(2024-11-21)
特有的报文容器喷洒以及基于DGSQ的拥塞控制机制。这款芯片的发布,不仅提升了GPU节点间通信效率,而且基于该芯片搭建的GSE网络性能比传统RoCE网络提升30%以上,为大规模GPU集群......
中国移动、华为等联合发布首颗GSE DPU芯片(2024-11-21)
特有的报文容器喷洒以及基于DGSQ的拥塞控制机制等能力,并完成与业界多家主流交换芯片对接验证。
基于该芯片搭建的GSE网络性能可比传统RoCE网络提升30%以上,大幅提升GPU节点间效率,填补......
浪潮信息AS13000G7荣获MLPerf AI存储基准测试五项性能全球第一(2024-09-28 09:10)
-Unet、ResNet50、CosmoFlow三类模型,在GPU利用率高达90%或70%的条件下,以带宽和支持的模拟 GPU (模拟加速器)数量为关键性能指标,评估单客户端或集群......
浪潮信息AS13000G7荣获MLPerf™ AI存储基准测试五项性能全球第一(2024-09-29)
主流的3D-Unet、ResNet50、CosmoFlow三类模型,在GPU利用率高达90%或70%的条件下,以带宽和支持的模拟 GPU (模拟加速器)数量为关键性能指标,评估单客户端或集群......
浪潮信息AS13000G7荣获MLPerf AI存储基准测试五项性能全球第一(2024-09-29 11:17)
-Unet、ResNet50、CosmoFlow三类模型,在GPU利用率高达90%或70%的条件下,以带宽和支持的模拟 GPU (模拟加速器)数量为关键性能指标,评估单客户端或集群......
开出千万年薪!雷军为何重金挖95后天才少女“AI小萝莉”?(2024-12-31 09:43:27)
的薪酬水平在千万元级别。
而后,又曝出小米集团AI大模型研发投入进一步增加,用于训练和优化其AI大模型的GPU万卡集群正在搭建中。
据界......
摩尔线程首个千卡智算中心落地,从算力到生态全面加速大模型发展(2023-12-20 14:30)
摩尔线程首个千卡智算中心落地,从算力到生态全面加速大模型发展;摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心揭幕仪式在北京成功举办,宣告国内首个以国产全功能GPU为底座的大规模算力集群......
摩尔线程首个千卡智算中心落地,从算力到生态全面加速大模型发展(2023-12-19)
平台,他表示:“摩尔线程KUAE智算中心的正式启用,是公司发展的重要里程碑。摩尔线程构建了从芯片到显卡到集群的智算产品线,依托全功能GPU的多元计算优势,旨在满足不断增长的大模型训练和推理需求,以绿......
浪潮网络助力打造 面向AIGC的"三超"网络(2023-08-18)
大模型训练是各新兴企业竞相争逐的主要场景。
"没有好网络,别玩大模型。" 要建设大规模训练模型集群,除了需要GPU服务器、网卡等基础组件,也需要解决网络搭建的问题。网络对于大模型集群的算力释放和可靠运行至关重要,如何构建符合大模型集群......
浪潮网络助力打造 面向AIGC的“三超”网络(2023-08-21 09:25)
大模型训练是各新兴企业竞相争逐的主要场景。"没有好网络,别玩大模型。" 要建设大规模训练模型集群,除了需要GPU服务器、网卡等基础组件,也需要解决网络搭建的问题。网络对于大模型集群的算力释放和可靠运行至关重要,如何构建符合大模型集群......
亚马逊云科技开启re:Invent 2024中国行 重塑企业生成式AI和云上创新(2024-12-18)
能力是单一实例的四倍。在大规模训练方面,Project
Rainier集群搭载数十万个Trainium2芯片,算力超越以往集群5倍以上。采用3纳米工艺的下一代Trainium3芯片预计将在2025年末......
浪潮元宇宙服务器率先支持新一代GPU芯片和Omniverse软件栈(2022-09-26)
浪潮元宇宙服务器率先支持新一代GPU芯片和Omniverse软件栈;浪潮信息宣布元宇宙服务器MetaEngine支持新一代GPU芯片及Omniverse软件栈,助力用户更高效地创建数字资产。浪潮......
20分钟上线200节点!元脑服务器操作系统KOS AI定制版为大模型部署提速(2024-10-29)
型开发首先要解决的,便是训练环境的搭建问题,在算力多元异构、依赖库众多、配置步骤繁琐的情况下,如何快速搭建满足要求的训练环境,为底层算力平台匹配最佳驱动,避免......
20分钟上线200节点!元脑服务器操作系统KOS AI定制版为大模型部署提速(2024-10-30 08:58)
型开发首先要解决的,便是训练环境的搭建问题,在算力多元异构、依赖库众多、配置步骤繁琐的情况下,如何快速搭建满足要求的训练环境,为底层算力平台匹配最佳驱动,避免......
深耕生成式AI 亚马逊云科技超强算力再次降低大模型成本(2023-03-08)
元。
Stability AI利用亚马逊云科技上的大规模GPU集群和Amazon Trainium机器学习训练芯片组成的高性能计算集群来训练其生成式AI基础模型,并通过云上模型训练的弹性来优化成本,最终......
TPU芯片:国内面对AI大模型的另一个解法(2024-07-23)
片以1024片芯片高速片间互联的能力构建了大规模智算集群“泰则”,系统集群性能远超传统GPU数十倍,可支撑超千亿参数AIGC大模型训练与推理。
公开资料显示,中昊......
干货分享|NVIDIA GPU应用解决方案加速AI应用落地(2023-02-02)
与千兆以太网管理,软件管理平台使用思腾合力SCM人工智能云平台软件。
部署效果:
通过思腾合力搭建的GPU集群环境,配套云平台软件,可实现端到端的AI算法训练,加速了人脸识别、人脸比对云服务、人形......
亚马逊云科技:生成式AI发展的瓶颈在算力(2023-03-08)
亚马逊云科技上的大规模GPU集群和Amazon Trainium机器学习训练芯片组成的高性能计算集群来训练其生成式AI基础模型,并通过云上模型训练的弹性来优化成本,最终将其使用的GPT-NeoX等开......
亚马逊云科技:生成式AI发展的瓶颈在算力(2023-03-08 15:02)
被全球超过20万开发者下载和授权。在算力需求方面,Stable Diffusion模型所需的算力硬件成本已超过5000万美元。Stability AI利用亚马逊云科技上的大规模GPU集群和Amazon......
NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级计算;基于先进的 NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术,可将集群......
尖端芯片给AI装上“超级引擎”(2024-06-17)
师正竞相开发包括图形处理单元(GPU)等在内的尖端芯片,以满足未来AI的计算需求。
GPU加快机器学习运算速度
GPU是英伟达公司标志性的计算机芯片。传统中央处理单元(CPU)按顺序处理指令,而GPU可并......
Gartner调查显示,生成式人工智能将推动中国企业数据中心设计转型(2024-04-15)
模型训练需要大规模的GPU集群。”
Gartner定义了五种GenAl部署方法(见图1)。根据企业选择的GenAI部署方法,中国的首席信息官(CIO)及基础设施和运营(I&O)领导......
NVIDIA 推出 Blackwell 架构 DGX SuperPOD,适用于万亿参数级的生成式 AI 超级计算;基于先进的 NVIDIA 网络、NVIDIA 全栈 AI 软件和存储技术,可将集群......
瞄准五大方向持续攻关,构建AI网络底座(2024-08-26)
所要解决的问题的复杂性增加,对 GPU 的需求也就越大,有些将要部署的解决方案可能会包含数千个 GPU 集群。这不难让人联想到数据中心里一排又一排密密麻麻的服务器机架,这种场景非常常见。
AI集群是一个小型网络
在构......
为了搭建好的AI基础设施,英伟达也是蛮拼的(2023-04-21)
Infrastructure(OCI)将首当其冲,通过其OCI超级集群,提供专门构建的RDMA网络、裸金属计算以及高性能本地块存储,可扩展到超过32,000个GPU所组成的超级集群。微软Azure预计......
瞄准五大方向持续攻关,构建AI网络底座(2024-08-26)
求也就越大,有些将要部署的解决方案可能会包含数千个 GPU 集群。这不难让人联想到数据中心里一排又一排密密麻麻的服务器机架,这种场景非常常见。
AI集群是一个小型网络
在构建AI集群......
摩尔线程与清程极智达成战略合作(2024-07-17 09:01)
合作旨在加速国产大规模GPU智算集群的产业化进程,推动人工智能算力生态的快速发展,为大模型行业提供更强大、灵活且高效的基础设施支持。根据协议,双方将聚焦于万卡级超大规模GPU智算集群的开发与优化,借助摩尔线程智算集群......
国产AI的希望!摩尔线程夸娥千卡集群化解AI算力国产化难题(2024-06-06)
,跟英伟达一样,除了图形渲染,也能用于AI人工智能加速、科学计算。
经过三年多潜心发展,摩尔线程在AI
GPU方面已经展现了强劲的实力,构建了一张从芯片、板卡、服务器,到集群、软件......
马斯克豪建2台超算,搭载万片Nvidia GPU且耗电数百兆瓦(2024-07-08)
马斯克豪建2台超算,搭载万片Nvidia GPU且耗电数百兆瓦;埃隆・马斯克 (Elon Musk) 位于德克萨斯州的特斯拉超级工厂正在扩建,以容纳一个人工智能超级计算机集群。
此次......
高算力时代,高性能封装承载IC产业创新(2023-06-09)
)技术成为新兴高算力需求场景中的重要选择——例如在AI、云计算领域,采用Chiplet相关技术能够搭建算力密度更高且成本更优的密集计算集群,显著提升高性能计算(HPC)应用的性价比。
作为......
中国移动建成全球运营商最大单集群智算中心:超1.8万张国产GPU(2024-09-06)
中国移动建成全球运营商最大单集群智算中心:超1.8万张国产GPU;
9月6日消息,近日,智算中心(哈尔滨)正式宣布上线投产,成为全球运营商最大单集群智算中心。
该智算中心单集群......
重塑移动计算未来,Arm推出2023全面计算解决方案(2023-05-31)
CPU集群,以及可为数百万Arm开发者提供更易访问软件的全新增强技术。
去年,Arm推出2022年全面计算解决方案(TCS22),包括首款旗舰GPU Immortalis-G715和新......
亚马逊云科技与英伟达扩展合作 持续推进生成式AI创新(2024-03-20)
方案。英伟达的下一代Grace Blackwell处理器是生成式AI和GPU计算领域的标志性事件。当结合亚马逊云科技强大的EFA网络、Amazon EC2 UltraClusters的超大规模集群......
亚马逊云科技与英伟达扩展合作 持续推进生成式AI创新(2024-03-20)
亚马逊云科技与英伟达扩展合作 持续推进生成式AI创新;
•亚马逊云科技将提供基于NVIDIA Grace Blackwell GPU的Amazon EC2实例和NVIDIA DGX......
制造业全面革新:北电数智助力工业场景构建完整AI生产线(2024-11-26)
智能赋能新型工业化供需对接深度行”大会上强调:“制造业亟需全面的人工智能革新。大模型落地制造业,要打破“木桶效应”,不能仅依靠大模型提供动力升级,还需要智能化升级生产设备、生产系统,完成整个生产线的搭建......
阿里云发布全栈AI负载高可用 与用户共建AI时代云上IT新治理(2024-12-27)
持续的卓越用户体验为目的,阿里云全栈AI负载高可用架构可达到GPU故障预测准确率92%,千卡规模集群连续训练有效时长大于99%,秒级模型自动保存、分钟级故障恢复;每分钟10000个pod扩展,分钟级自动扩容;核心......
国产GPU AI训推达到国际水准!摩尔线程已媲美RTX 4090(2024-06-19)
夸娥(KUAE)千卡智算集群的大模型预训练。
测试使用的相关大模型,来自智谱AI基座大模型及其开源版本。
测试结果表明,在推理方面,摩尔线程自研全功能GPU显著优于基准对比产品RTX......
Supermicro推出三款基于NVIDIA技术的全堆栈结构、可立即部署型生成式AI SuperCluster,从企业级扩展到大型LLM基础架构(2024-03-25 09:10)
节点的计算集群能支持具有72TB HBM3e的512个NVIDIA HGX H200 GPU。结合了NVIDIA AI Enterprise软件的Supermicro SuperCluster解决......
联想陈振宽:通过万全异构智算平台,联想迎接AI 2.0(2024-04-22)
中断次数及恢复所需时间呈指数级增长。
第三大挑战是如何改善AI算力利用率。陈振宽引用行业通用的指标MFU(模型算力利用率)来作阐述,他指出当前业内MFU普遍在30%左右,顶尖的集群利用率也只能做到50%。行业需要解决GPU卡利......
浪潮信息获北京通用人工智能产业创新伙伴,源大模型加速开放赋能(2023-07-27 10:46)
训练服务器 NF5688G7采用Hopper架构的GPU,较上代平台大模型实测性能提升近7倍,同时支持最新的液冷解决方案,可实现更低的集群能耗比与运行成本,PUE小于1.15,以一个4000卡的......
浪潮信息获北京通用人工智能产业创新伙伴,源大模型加速开放赋能(2023-07-27)
训练服务器 NF5688G7采用Hopper架构的GPU,较上代平台大模型实测性能提升近7倍,同时支持最新的液冷解决方案,可实现更低的集群能耗比与运行成本,PUE小于1.15,以一个4000卡的......
敲开视觉体验新时代大门,Arm发布新一代Armv9 CPU及Immortalis GPU(2022-07-01)
基于高效的Arm Mali-G710 GPU构建,且其能效优化了15%,让用户能够乐享更长的游戏时间。
Armv9架构第二代产品CPU追求更高持续性能和效率
通过扩展CPU集群,Arm推出Armv9架构......
半导体投资依然火热,多家企业融资最新盘点(2023-01-06)
省天府芯云数字经济发展基金有限公司跟投。
本次募得资金将用于功率半导体产品的创新研发、公共技术平台搭建以及产业人才队伍建设等方向,致力于解决产业链细分领域“卡脖子”问题,推动成都功率半导体产业集群......
相关企业
;北京思腾创新科技发展有限公司;;公司成立于2005年 是一家专营DIY服务器、AMD Opteron服务器CPU、NVIDIA Tesla 系列并行运算GPU 、SOLIDATA SSD 的综合性核心经销商!!
;哈尔滨科技园;;集群系统
;北京集群科贸有限公司;;
;welltech;;是国内集群通信的龙头
;北京正高集群信息科技有限公司;;
处理和数字视频领域的最新技术应用于我们的产品设计中。专业定制屏涉及领域:LED铁路旅客引导显示系统;LED城市轨道交通信息显示系统;LED城市轨道交通诱导信息系统;LED出租车集群显示系统;LED智能公交车牌集群显示系统;LED
;深圳市好易通通信设备有限公司;;集群设备生厂商
;武汉新吉信通讯技术有限公司;;对350M集群系统的建设
;深圳市博讯朗赛科技有限公司;;集群通信 专用数字对讲机,基站和转信台
开发到批量生产的存储器,微控制器和可编程逻辑器件的成本有效的编程解决方案的领先供应商。SUPERPRO程序员必须在同行业中最大的144通用引脚驱动器的设备支持。XELTEK是一个灵活的批量制造集群编程技术专家。集群