AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库 AI知识网,一站式人工智能学习平台 | 从入门到精通的 AI 知识库
  • 主页
  • AI动态
  • PHP
  • QQ:420220301
    Wechat:w420220301
QQ:420220301
Wechat:w420220301
  • 主页
  • AI动态
  • PHP
首页 AI动态 微软解锁 AI配音新技能:生成最长 90 秒多角色叙述,语音更像真人

微软解锁 AI配音新技能:生成最长 90 秒多角色叙述,语音更像真人

管理员 2025-08-31 11:40:55

摘要:8 月 31 日消息,科技媒体 Windows Latest 昨日(8 月 29 日)发布博文,报道称 Copilot Audio Expressions,可通过 Emotive 和 Story 两种模式生成更具情感...

8 月 31 日消息,科技媒体 Windows Latest 昨日(8 月 29 日)发布博文,报道称 Copilot Audio Expressions,可通过 Emotive 和 Story 两种模式生成更具情感的英文语音。

注:Copilot Audio Expressions 是一款 AI 语音生成工具,功能是让输出的音频更接近真人,并可根据需求加入创意润色。用户无需注册即可直接体验,并可下载 MP3 格式音频,方便在任何设备播放。

该工具目前提供 Emotive(情感表达)和 Story(故事创作)两种模式。

该媒体在测试 Emotive 模式后,选用“Oak”音色和“narration”叙述风格,将模拟火车站的脚本输入系统。

生成的音频不仅朗读了文字,还自动增添细节、调整措辞,让表达更生动。单段音频最长 59 秒,支持十余种声音与风格组合。

在 Story 模式下,系统自动选择音色和风格,用户仅需提供主题提示。

例如输入“讲一个猫在暗处潜行觅食的故事”,AI 就生成了一个长达 90 秒的多角色叙述:旁白用美式口音,猫的对白则为英式口音,并巧妙穿插互动,形成自然流畅的对话效果。

测试结果表明,Story 模式在情节构建、角色区分及声音融合度方面表现出色,输出的成品不像单调的机器朗读,更像是一次配音合作,让该工具不仅适用于简单朗诵,也可胜任有多角色的创意作品制作。

该工具目前仅支持英文,中文及其他语言用户暂无法直接生成母语音频,微软尚未透露后续是否会增加多语言支持。


声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。

上一篇:北京中小学校新学期开展人工智能通识教育,每学年不少于 8 课时
下一篇:科学家找到让AI模型变聪明的新方法:哈佛团队发现记忆也需要"忘记"的艺术
猜你喜欢
  • 上海AI实验室团队破解AI记忆难题:让机器拥有多个"记忆仓库"不再遗忘重要信息
  • 社交AI也能拥有情商?卡内基梅隆大学团队的突破性训练方法让机器人学会察言观色
  • 腾讯WeChat AI团队重磅推出PRELUDE:一个真正需要"读懂故事"才能解题的AI评测基准
  • 首次实现真正意义上的"图像记忆":希伯来大学突破3D生成技术瓶颈
  • Meta 首款带显示屏的智能眼镜下月上市,售价 800 美元起
  • 马萨诸塞大学破解AI搜索难题:让智能助手不再"转圈圈",答题效率提升10%
  • 速递|四个月估值从3.5亿升至23亿美元,n8n新一轮融资筹集数亿欧元
  • 清华大学和智谱AI联手打造355B参数超级AI大脑:GLM-4.5如何在推理、编程和智能代理三个关键领域同时称王
  • 单机狂飙4万亿参数,国产AI「四大天王」首次合体!这台超节点鲨疯了
  • 哈工大团队发现AI学新技能不忘老本事的秘诀:用一千个通用样本就够了!
11 09, 2025
3000 亿美元历史级大单:消息称 OpenAI 与 Oracle 甲骨文达成重磅云计算交易
Str Tom
站长
Str Tom 网络工作室
464
文章
0
评论
0
获赞
  • 主页
  • AI动态
  • PHP
Powered By AI知识网 © 2025 strtom网络工作室. 公安备案号:冀公网安备13011102001189号 网站备案号:冀ICP备2024070905号-2 网站地图
友情链接: 各类知识收集 PHP接单网 YzmCMS官方网站 YzmCMS交流社区 YzmCMS官方博客