有意见 | 音频大模型Voice Engine来了，但是中文发音满满的机械味！原创

OpenAI在官网首次展示了全新自定义音频模型“Voice Engine”。

OpenAI在官网首次展示了全新自定义音频大模型“Voice Engine”。

用户只需要提供15秒左右的参考声音，通过Voice Engine就能生成几乎和原音一模一样的全新音频，虽然在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强。但是至少中文听起来怪怪的。

Voice Engine目前的商业用途，包括帮助失去声音表达能力的人，正常发音说话。还可以给教育行业提供生成各种有声读物。以及帮助企业开发商品展示的“数字人进行各种翻译等。

“有意见”留言板

@媒体搬运工：前有Sora，现在出了Voice Engine，感觉OpenAI在有目的放出来，结合ChatGPT，从对话到视频到语音，OpenAI的AGI要闭环了。

@辣腿堡不加酱：帮助声音受损的人恢复声音在某种角度上真是件好事，但更多的担忧是会违规使用。毕竟现在通过打个电话发个语音消息采集到声音样本也不是件难事，安全性不好保证。

来源：至顶网有意见频道

0赞

好文章，需要你的鼓励

千流出海

明阳电气

2026-06-05

明阳电气马来西亚首个海外生产基地投产，输配电设备开始本地制造

今天讲的出海案例是明阳电气，这家输配电设备公司在马来西亚投产首个海外生产基地，并以 250 万林吉特子公司承接本地制造。

当AI搜索员越读越多，反而越读越蒙：UC San Diego等机构揭示“屏蔽旧信息“的隐藏规律

AI搜索代理

上下文管理

检索优化

2026-06-04

当AI搜索员越读越多，反而越读越蒙：UC San Diego等机构揭示“屏蔽旧信息“的隐藏规律

研究揭示AI搜索代理"屏蔽旧观测"策略的效果取决于检索质量与模型能力的匹配程度，存在三种截然不同的效果区间。

人工智能

自然语言处理

学术影响评估

2026-06-04

数学家发出警告：AI正威胁数学研究的自主性与学术标准

数学界发布《莱顿宣言》，由16位研究人员历时8个月起草，已获国际数学联盟背书。宣言指出，AI正威胁数学研究的核心价值：AI生成的错误证明难以识别、论文引用不规范、版权争议频发、科技公司主导研究议题，以及企业借新闻稿抢占话语权等问题日益严峻。宣言呼吁数学家透明披露AI使用情况，建议监管机构保护作者权利并规范AI产业，同时警告各方不要轻信科技公司对AI能力的夸大宣传。

机器人控制

语义接地

视觉-语言-动作模型

2026-06-04

机器人“听懂“指令却不知道该抓哪个——哈工大等机构联合揭示VLA模型的致命短板

多所高校与研究机构联合构建机器人语义接地测试平台RSB，发现主流VLA模型普遍存在"能抓但抓错"的致命缺陷，语义理解与动作生成之间存在严重断层。

有意见 | 音频大模型Voice Engine来了，但是中文发音满满的机械味！ 原创

来源：至顶网有意见频道

2024

04/01

17:09

分享

点赞

明阳电气马来西亚首个海外生产基地投产，输配电设备开始本地制造

数学家发出警告：AI正威胁数学研究的自主性与学术标准

SpaceX冲击史上最大IPO，马斯克或成首位万亿富翁

日本力推大阪成为机器人与科技投资的重要门户

Genesis AI发布机器人仿真平台，将评测周期从数天压缩至30分钟

智能眼镜与隐形耳机或加剧学校考试作弊风险

AI激光灭蚊仪：用深度学习精准猎杀蚊子

IBM与Red Hat携手打造企业开源安全"清算中心"

Google AI Edge Gallery正式登陆macOS，支持在Mac上本地运行Gemini模型

瑞士研究团队宣称利用量子芯片构建出完美随机数生成器

加利福尼亚州城市率先通过选民投票禁止数据中心建设

数据中心跃升为美国最大私人办公建筑细分市场

Sam Altman最新博文《反思》：有信心构建AGI，2025年首批AI智能体将“加入劳动力大军”

惊喜！Sam Altman确定OpenAI新产品，AGI、Agents、成人模式

2024，AI这一年

谷歌发布双思维AI Agent：像人类一样思考，重大技术突破！

OpenAI精心打造的Sora视频生成工具疑遭泄露

王者归来！Greg重返OpenAI，主抓重大技术创新

刚刚，OpenAI开源SimpleQA！轻松检测、校准大模型能力

比GPT-4强100倍！OpenAI将在12月发布新模型—猎户座

突发！微软正与OpenAI洽谈，140亿美元投资股权

深度丨OpenAI筹集66亿美元，刷新硅谷最高融资纪录

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

有意见 | 音频大模型Voice Engine来了，但是中文发音满满的机械味！原创