有意见 | 重磅更新！ChatGPT可以看图片听语音啦原创

9月25日OpenAI在其官网宣布，目前正在推出ChatGPT的新版本，ChatGPT现在可以“看”“听”和“说”了。

在语音方面：第一，允许用户进行语音对话；第二，支持在iOS和Android移动应用上使用；第三，提供5种不同的语音选择；第四，通过新型文本转语音模型和语音识别系统实现。

在图像方面，第一，允许用户上传图像与ChatGPT进行交互；第二，支持多张图像；第三，提供移动应用上的绘图工具；第四，使用多模态GPT模型（Generative Pre-Trained Transformer，生成式预训练Transformer模型）理解图像。

“有意见”留言板

@卡卡卡卡西：多模态一直都是AI的一个基础特性，没什么值得惊讶的，只不过原来由应用厂商或外部开发者开发的功能，现在OpenAI做成标准模块集成到通用产品中了，在多模态方面，ChatGPT肯定会越来越丰富。

@用AI评AI：ChatGPT的语音功能和图像功能的推出，将为AI技术的发展开辟新的道路，极大地改变我们与AI的交互方式，使得交互更加直观和便捷，同时也将使得OpenAI在人工智能领域的地位更加稳固。

@干啥干啥：仔细看一下，第一个回答是个通用回答，发不发图片都不影响，第二个是简单的图像识别和上下文关联，第三个是阅读理解了使用说明和图像识别，感觉好像也都是已有能力的组合，其实也没有那么令人惊艳。

来源：至顶网有意见频道

0赞

好文章，需要你的鼓励

有意见 | 重磅更新！ChatGPT可以看图片听语音啦 原创

来源：至顶网有意见频道

2023

09/27

17:05

分享

点赞

Ent Security以1亿美元融资重新定义端点防御

Daylight Security推出智能体安全数据湖，MDR客户无需SIEM即可检索遥测数据

以链筑基 向实而行｜2026张江EAI开幕式举行，张江机器人谷加快构建具身智能产业生态

企业明知AI生成代码存在安全漏洞，却仍执意上线

Microsoft 365 Copilot 高危漏洞曝光：黑客可窃取用户双重验证码

Salesforce 宣布以36亿美元收购客服自动化初创公司 Fin

Android 2026 年 6 月 Google 系统更新：WhatsApp 备份功能迎来新变化

Hades恶意软件：专门欺骗AI安全智能体的新型攻击活动

Respond.io完成6250万美元B轮融资，借助AI智能体拓展全球市场

WWDC 2026：IT管理员必须了解的重要变化

Apple iOS 27 三项未发布新功能曝光

众智启新——MWC26 上海6月开幕，邀你共赴“科技嘉年华”

当超1/4美国高中生用ChatGPT学习：一场静默的教育革命正在发生

Sam Altman最新博文《反思》：有信心构建AGI，2025年首批AI智能体将“加入劳动力大军”

ChatGPT可视频通话，距离“Her”越来越近 (Day 6/12)

突破性功能！OpenAI发布ChatGPT Projects，万能工具箱上线！

突发！OpenAI正式发布ChatGPT网络搜索，彻底颠覆谷歌！

将 Chrome 浏览器默认搜索引擎换成 GPTSearch

刚刚，苹果将ChatGPT集成在iPhone 16，一夜重塑手机！

IBM 改进生成式AI预测：利用时间模式而不仅是注意力机制

关闭ChatGPT的这项设置，让后台对话更安全

基本就是AGI？GPT-4o“它”来了

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

有意见 | 重磅更新！ChatGPT可以看图片听语音啦原创

以链筑基向实而行｜2026张江EAI开幕式举行，张江机器人谷加快构建具身智能产业生态