推荐关注:

蒋左梅全球首个!英伟达发布了一把用于“声音的瑞士军刀”

收集整理:九站网 更新时间:2024-11-26 12:00 文章来源:浅语科技

蒋左梅快科技11月26日讯,英伟达近日展示了其最新研发的人工智能模型——Fugatto。Fugatto是一款基于生成式Transformer架构的人工智能模型,其完整

原标题:《全球首个!英伟达发布了一把用于“声音的瑞士军刀”》

蒋左梅快科技11月26日讯,英伟达近日展示了其最新研发的人工智能模型——Fugatto。

蒋左梅Fugatto是一款基于生成式Transformer架构的人工智能模型,其完整版配备了25亿个参数,并在由32个NVIDIAH..100TensorCoreGPU组成的NVIDIADGX系统上进行了训练。

蒋左梅这款模型的主要功能在于能够修改和生成声音效果,专为音乐、电影和视频游戏制作人设计,英伟达将其形象地称为“声音的瑞士军刀”。

蒋左梅据NVIDIA应用音频研究经理RafaelValle透露,Fugatto的研发初衷是创建一个能够像人类一样理解和生成声音的模型。

蒋左梅它支持多种音频生成和转换任务,是首个展示紧急属性的基础生成式AI模型,这得益于其各种训练能力的交互以及组合自由格式指令的能力。

蒋左梅Fugatto的功能十分强大,能够根据文本描述生成音效和音乐,例如将钢琴演奏转换成年人声歌唱,或改变录音的口音和情绪。

蒋左梅对于音乐制作人而言,Fugatto可以帮助他们快速制作原型或编辑歌曲创意,尝试不同的风格、声音和乐器,同时添加效果并提高现有轨道的整体音频质量。

蒋左梅广告*理商则可以利用Fugatto快速定位多个地区或情况的现有广告活动,将不同的口音和情感应用于画外音。

蒋左梅视频游戏开发人员则可以使用该模型修改游戏中预先录制的素材,或根据文本说明和可选的音频输入动态创建新素材。

蒋左梅另外,Fugatto的新颖X主要体现在以下方面:

首先,在推理过程中,该模型采用了称为ComposableART的技术,能够组合在训练期间只能单独看到的指令。

例如,通过组合提示,可以要求模型以法国口音说出带有悲伤情绪的文本。

此外,该模型在指令之间进行插值的能力使用户能够对文本指令进行精细控制,如重音的沉重程度或悲伤的程度。

其次,Fugatto还能够生成随时间变化的声音,NVIDIA将这一功能称为时间插值。

例如,它可以模拟暴雨穿过区域的声音,雷声逐渐增强,然后慢慢消失在远处。这一功能使用户能够精细地控制音景的演变方式。

最后,与大多数只能重现所接触的训练数据的模型不同,Fugatto允许用户创建以前从未见过的音景。

例如,它可以模拟雷雨随着鸟儿的歌声缓和为黎明的场景。

总而言之,Fugatto凭借其功能多样X和创新X,在音频领域具有广阔的发展空间。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:秋白

文章内容举报

蒋左梅快科技11月26日讯,英伟达近日展示了其最新研发的人工智能模型——Fugatto。蒋左梅Fugatto是一款基...

阅读全文

띲띪띺蒋左梅全球首个!英伟达发布了一把用于“声音的瑞士军刀”》一文由九站智能AI收集整理,不代表本站支持其观点
如无意侵犯您的权益,请及时与我们联系,我们将在第一时间处理您的诉求。

热门频道推荐 建站经验 策划盈利 搜索优化 业界动态 境外动态 网络评论 传媒播报 产品运营 交互设计 网站推广 免费资源 网络游戏 网页游戏 电商要闻 电商分析 移动通讯 数码咨讯 移动应用 数码评测 创业模式 创业资本 创业点评 创业经验 电商淘客 电商微商

九站草根门户 服务草根站长 集结网络群体的力量!
免责申明:本站为非盈利性网站,不刊登或转载任何完整的新闻内容,其版权归原作者所有。如无意侵犯您的权益,请及时与我们联系,我们将在第一时间处理您的诉求。
PHP程序订制开发,九站系统销售联系QQ 1142088012 蜀ICP备06021074号-10 Copyright 2011-2022 © Www.O9z.Net .All Rights Reserved