分享好友 最新动态首页 最新动态分类 切换频道
昆仑万维Mureka V7.5模型上线,AI音乐创作水平再迎新高度
2025-08-17 12:51

8月11日,昆仑万维SkyWork AI技术发布周正式启动。8月11日至8月15日,每天发布一款新模型,连续五天,覆盖多模态AI核心场景的前沿模型。

截至目前,昆仑万维已经发布SkyReels-A3、Matrix-Game 2.0、Matrix-3D、Skywork UniPic 2.0、Skywork Deep Research Agent模型。8月15日,昆仑万维正式上线Mureka V7.5模型。至此,昆仑万维SkyWork AI技术发布周完美收官。

Mureka V7.5在中文歌曲上的演绎再上新台阶,不仅实现了中文歌曲音色、演奏技法的大幅提升,还完成了中文歌曲咬字与情感表现提升。

首先,基于对中文曲风和元素的强大理解,Mureka的理解模型对传统民歌、戏曲到经典华语流行金曲乃至当代民谣音乐拥有深刻认知。这种在中文音乐多样性与文化特性上的深度积累,使模型在理解和生成中文音乐时,能够更准确地传达其特有的艺术神韵和情感色彩。

其次,为了进一步提升生成音乐中人声表现的真实性与情感深度,我们针对歌曲特点优化了 ASR 技术,使之成为理解模块的有力延伸。这项技术深入到演唱的微观层面,不仅精准识别唱词,更能通过分析真实演唱中的气息运用、情感起伏和唱法细节,智能划分出符合演唱规律的乐句,并确定自然的换气与停顿位置。结合同样精准的乐段识别,显著提升了生成人声的段落清晰度与结构真实感。

这些捕捉到的细粒度演唱信息反馈给生成模型,极大地增强了人声的自然度、呼吸感以及情感表达的真实性,有效削弱了机械感,使 AI 演绎的歌曲在流畅性上更贴近真人演唱,这在处理中文歌曲特有的韵律和气息要求时效果尤为突出。

正是这种结合在文化特性上的独特积累和针对歌曲演唱优化的 ASR 技术所带来的细节洞察,共同构成了我们在中文音乐生成领域的核心竞争力。

Mureka V7.5不仅能「听懂」对音乐旋律与节奏的制作要求,更能深刻理解并再现不同文化语境下,特别是中文音乐中蕴含的细腻情感与艺术表达,从而为生成高度符合目标审美与文化语境、兼具艺术性与真实感的音乐作品,打下坚持技术基础。

同时,在语音模型方向上,昆仑万维语音团队推出MoE-TTS——首个基于MOE的角色描述语音合成框架。

作为面向开放描述(Out-of-domain Descriptions)场景的全新语音合成框架的研究性工作,该技术可让用户通过自然语言描述(例如“清澈的少年音带磁性尾韵”)精准控制声音特征与风格,在仅使用开源数据的条件下,对标甚至超越闭源商业产品的角色贴合度表现。

技术报告:https://teal-aquarius-c17.notion.site/MoE-TTS-Enhancing-Out-of-Domain-Text-Understanding-for-Description-based-TTS-via-Mixture-of-Experts-24e44360bf708040bff3dffe2eef805e

近年来,描述性语音合成虚拟助手、有声创作、数字人等领域展现出巨大潜力。然而,学术界长期受制于描述数据的局限性模型对开放语义的泛化能力不足,导致面对比喻、类比等复杂修辞时,生成的语音往往偏离用户预期。

MoE-TTS的推出有望助力解决这一核心难题。该框架创新性地结合预训练大语言模型(LLM)文本能力语音专家模块(Speech Expert Modules),为文本与语音分别配置专用专家模块,并在Transformer核心结构中引入模态路由,确保各模态独立优化、互不干扰。在冻结文本参数的同时高效对齐跨模态信息,实现“知识零损失”的泛化理解能力。

在涵盖域内与域外描述的双测试集上,MoE-TTS 与主流闭源 TTS 模型进行了六大维度对比评测:MoE-TTS 在风格表现力贴合度(SEA)和整体贴合度(OA)等声学控制上精准度领先,这正是其在复杂描述匹配度上胜出的关键。

MoE-TTS 的发布不仅为学术界提供了可复现的开放描述 TTS 解决方案,也证明了 模态解耦 + 知识冻结迁移 的技术路径在语音合成中的巨大潜力。这一突破有望推动行业从“封闭标签式控制”走向“自然语言自由控制”的新范式,加速数字人、虚拟助手和沉浸式内容创作的体验升级。

MoE-TTS目前仍在迭代中,后续规划将集成至旗下Mureka-Speech平台作为角色配音的基座模型,为全球开发者和创作者提供开放、高效、可定制的描述性语音合成能力。

欢迎全球用户体验全新V7.5模型

探索音乐创作的无限可能!

来源:北国网

免责声明:本文来源于网络,仅代表作者本人观点,与TechWeb无关。凡来源非TechWeb的新闻(作品)只代表本网传播该消息,并不代表赞同其观点。TechWeb对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

最新文章
区城产业大讲堂|解码人形机器人的现状与未来|梁溪|科技城|产业园|智能机器人_网易新闻
为全面提升梁溪区、梁溪科技城干部在新兴产业、未来产业领域的专业素养,增强产业规划与创新实践能力。7月8日,梁溪区、梁溪科技城产业大讲堂第二课开讲,高工机器人产业研究所所长卢瀚宸作《人形机器人的现状与未来》专题授课。区四套班子
原创今日热点:福建舰电磁弹射实战化,中国远洋海军的破局开启
西太平洋的海上力量格局正迎来前所未有的历史性重构,这艘排水量超过八万吨的巨舰,中国首艘电磁弹射型航空母舰福建舰,在完成一系列海上实兵训练后,正式宣告迈入实战化准备阶段。歼-35隐身舰载机、歼-15T重型舰载机、空警-600预警机等多
进口SEMG冰箱上海清关办理
即:办理免3C范围部分产品范围包括:1、为科研、测试需要进口和生产的产品;2、以整机全数出口为目的而用进料或来料加工方式进口的零部件;3、根据外贸合同,专供出口的产品(不包括该产品有部分返销国内或内销的);4、为考核技术引进生产
创新题材收获口碑与热度,粤产剧《风与潮》央视收官_腾讯新闻
重大革命题材电视剧《风与潮》于2026年1月11日在央视综合频道黄金档圆满收官。该剧以澳门“孤岛”时期(1942-1945)的抗战历史为背景,通过金融战、情报战、物资战等多重叙事,生动再现了何贤、马万祺、柯麟等爱国志士的卓绝斗争。播出期间
周荣池|墩上月明_腾讯新闻
墩上月明周荣池  至少在明朝的时候,我的村庄就叫南角墩。  本地见存最早的方志《隆庆州志》记:“角墩在州东北。南角墩去城二十五里。北角墩去城三十里。”以现在最精确的计算办法,城区到南角墩庄台乃十三公里。许多事情在日新月异地
苹果公布2025年服务业务成绩单:AppStore周活用户超8.5亿
1月13日消息,今日,苹果发布2025年服务业务成绩单,过去一年用户规模、营收能力与全球覆盖范围均刷新纪录。苹果公司还称,2025年是“苹果服务业务的破纪录之年”,旗下Apple Music、Apple TV等多项服务均实现了里程碑式的突破。官方数据显
工行沧州车站支行多场景推进存款保险宣传 筑牢金融安全网_网易新闻
为深入贯彻落实金融知识普及工作,工行沧州车站支行在近期围绕存款保险主题,开展了一系列丰富多彩且富有成效的宣传活动,通过多场景联动,将金融安全知识送到群众身边。在校园场景中,支行与当地一所学校联合举办了 “金融知识进校园” 活
智能新闻助手:AI新闻生成器助力高效创作与优化用户体验-2024ai通
随着科技的不断发展人工智能逐渐应用于各个领域新闻行业也迎来了新一轮的变革。近年来新闻生成器作为一种新兴的技术产品受到了广泛关注。本文将围绕新闻生成器在高效创作与优化客户体验方面的作用展开论述。本文所提到的语料库涵以下关键词
搜狐焦点代理商招商加盟:更有搜狐号合作、网站运营 还不知道怎么联系快来看看吧
品牌背景:搜狐焦点是中国先进的房地产家居门户,始终坚持“用心服务、客户至上”的使命,依托搜狐门户矩阵的品牌及平台优势,秉承“爱家、爱生活”的运营理念,为用户提供从买房、卖房、租房、装修、生活等全面专业的一站式新闻资讯及在线
共享隔音舱直播间供应商_聚荣网
共享隔音舱直播间供应商,现代室内建筑空间越来越倾向于使用开放大空间,在这个开放大空间中,越来越需要一种具备隔音、消音、空气循环等使用功能的、供个人使用封闭电话亭,用于个人打电话、使用电子设备、进行视屏通话等的活动。这种室内
相关文章
推荐文章
发表评论
0评