推荐关注:

骑士2.0*英伟达首次公布blackwellgpu训练工作负载成绩

收集整理:九站网 更新时间:2024-11-15 12:43 文章来源:浅语科技

骑士2.0*11月14日消息,科技媒体WccfTech昨日(11月13日)发布博文,报道称英伟达首次公布了BlackwellGPU在MLPerfv4.1AI训练工作负载中的

原标题:《英伟达首次公布blackwellgpu训练工作负载成绩》

骑士2.0*11月14日消息,科技媒体WccfTech昨日(11月13日)发布博文,报道称英伟达首次公布了BlackwellGPU在MLPerfv4.1AI训练工作负载中的成绩,在训练Llama270B(Fine-Tuning)模型时比H..opper快2.2倍。

骑士2.0*

骑士2.0*测试简介

骑士2.0*英伟达于今年8月,首次公布了BlackwellGPU在MLPerfv4.1AI推理方面的基准测试成绩,而今天首次公布了该GPU在MLPerfv4.1AI训练工作负载方面的测试成绩。

骑士2.0*

骑士2.0*

骑士2.0*NVIDIA表示,随着新模型的推出,AI领域对计算的需求正在以指数级增长,因此需要大幅提升训练和推理AI的能力,IT之家附上本次训练工作负载主要使用的模型如下:

骑士2.0*Llama270B(LLM微调)

骑士2.0*StableDiffusion(文本到图像)

骑士2.0*DLRMv2(推荐系统)

BERT(自然语言处理)

RetinaNet(目标检测)

GPT-3175B(LLM预训练)

R-GAT(图神经网络)

这些工作负载的基准测试为评估AI加速器的训练X能提供了准确的数据支持。

H..opperGPU的持续优化

H..opperGPU自发布以来,经过持续的软件优化,X能得到了显著提升。H..100GPU在LLM预训练X能上比首次提交时快了1.3倍,并且在GPT-3(175B训练)中实现了70%的X能提升。

英伟达利用11616个H..100GPU进行了MLPerf的最大规模提交,进一步证明了其在数据中心级别的强大能力。

Blackwell的技术优势

BlackwellGPU的设计旨在提高每个GPU的计算吞吐量,配备更大更快的高带宽内存,不降低X能的前提下,能够在更少的GPU上运行GPT-3175B基准测试。

根据测试结果,64张BlackwellGPU的测试X能,可以达到256张H..opperGPU的水平。

骑士2.0*11月14日消息,科技媒体WccfTech昨日(11月13日)发布博文,报道称英伟达首次公布了Black...

阅读全文

띲띪띺骑士2.0*英伟达首次公布blackwellgpu训练工作负载成绩》一文由九站智能AI收集整理,不代表本站支持其观点
如无意侵犯您的权益,请及时与我们联系,我们将在第一时间处理您的诉求。

热门频道推荐 建站经验 策划盈利 搜索优化 业界动态 境外动态 网络评论 传媒播报 产品运营 交互设计 网站推广 免费资源 网络游戏 网页游戏 电商要闻 电商分析 移动通讯 数码咨讯 移动应用 数码评测 创业模式 创业资本 创业点评 创业经验 电商淘客 电商微商

九站草根门户 服务草根站长 集结网络群体的力量!
免责申明:本站为非盈利性网站,不刊登或转载任何完整的新闻内容,其版权归原作者所有。如无意侵犯您的权益,请及时与我们联系,我们将在第一时间处理您的诉求。
PHP程序订制开发,九站系统销售联系QQ 1142088012 蜀ICP备06021074号-10 Copyright 2011-2022 © Www.O9z.Net .All Rights Reserved