有意见 | 音频大模型Voice Engine来了，但是中文发音满满的机械味！原创

OpenAI在官网首次展示了全新自定义音频模型“Voice Engine”。

OpenAI在官网首次展示了全新自定义音频大模型“Voice Engine”。

用户只需要提供15秒左右的参考声音，通过Voice Engine就能生成几乎和原音一模一样的全新音频，虽然在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强。但是至少中文听起来怪怪的。

Voice Engine目前的商业用途，包括帮助失去声音表达能力的人，正常发音说话。还可以给教育行业提供生成各种有声读物。以及帮助企业开发商品展示的“数字人进行各种翻译等。

“有意见”留言板

@媒体搬运工：前有Sora，现在出了Voice Engine，感觉OpenAI在有目的放出来，结合ChatGPT，从对话到视频到语音，OpenAI的AGI要闭环了。

@辣腿堡不加酱：帮助声音受损的人恢复声音在某种角度上真是件好事，但更多的担忧是会违规使用。毕竟现在通过打个电话发个语音消息采集到声音样本也不是件难事，安全性不好保证。

来源：至顶网有意见频道

0赞

好文章，需要你的鼓励

英国NHS无人机快递医疗样本服务正式落地伦敦

英国国家医疗服务（NHS）正将无人机纳入常规医疗物流体系。自今年2月起，无人机每天在雷恩斯公园和圣乔治医院之间运送血液等诊断样本，飞行仅需3分钟，比公路运输快约85%，且碳排放减少高达98%。目前已有逾2000名患者受益。NHS计划将该服务扩展至圣赫利尔、克罗伊登等多家医院，最终惠及约180万名患者。该网络由英国医疗初创公司Apian与谷歌旗下Wing合作运营。

Explyt团队打造的代码智能体评测新标准：光靠“通过/失败“根本不够用

AgentLens是Explyt公司联合俄罗斯学术机构开发的AI编程助手评测基准，通过分析完整人机交互轨迹而非仅看最终结果，从五个维度评估代码智能体的真实表现。

Aetina宣布支持英伟达Jetson T3000和T2000 AI模块

边缘AI计算厂商Aetina宣布，将在其DeviceEdge AIE-KT风冷系列和新款AIE-PT无风扇平台上支持英伟达全新Jetson T3000和T2000模块。T3000基于Blackwell GPU，最高提供865 FP4 TFLOPS算力，功耗70W；T2000则提供400 FP4 TFLOPS，面向视觉AI代理和自主移动机器人等场景。两款模块预计2027年第一季度上市，支持Nemotron、Cosmos 3等英伟达AI软件生态。

机器人的“触觉觉醒“：韩国梨花女子大学如何让小型AI模型在不忘记视觉的前提下学会“感受“材质

多模态大语言模型

触觉感知

掩码隔离训练

2026-07-20

机器人的“触觉觉醒“：韩国梨花女子大学如何让小型AI模型在不忘记视觉的前提下学会“感受“材质

韩国梨花女子大学提出Splash框架，通过识别AI模型中的"休眠参数"并只在其中训练触觉能力，让小型多模态AI在学会感知材质触感的同时，完整保留原有视觉语言推理能力。

有意见 | 音频大模型Voice Engine来了，但是中文发音满满的机械味！ 原创

来源：至顶网有意见频道

2024

04/01

17:09

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

Sam Altman最新博文《反思》：有信心构建AGI，2025年首批AI智能体将“加入劳动力大军”

惊喜！Sam Altman确定OpenAI新产品，AGI、Agents、成人模式

2024，AI这一年

谷歌发布双思维AI Agent：像人类一样思考，重大技术突破！

OpenAI精心打造的Sora视频生成工具疑遭泄露

王者归来！Greg重返OpenAI，主抓重大技术创新

刚刚，OpenAI开源SimpleQA！轻松检测、校准大模型能力

比GPT-4强100倍！OpenAI将在12月发布新模型—猎户座

突发！微软正与OpenAI洽谈，140亿美元投资股权

深度丨OpenAI筹集66亿美元，刷新硅谷最高融资纪录

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

有意见 | 音频大模型Voice Engine来了，但是中文发音满满的机械味！原创

打造Token极致性价比新华三震撼亮相2026世界人工智能大会