有意见 | 重磅更新！ChatGPT可以看图片听语音啦原创

9月25日OpenAI在其官网宣布，目前正在推出ChatGPT的新版本，ChatGPT现在可以“看”“听”和“说”了。

在语音方面：第一，允许用户进行语音对话；第二，支持在iOS和Android移动应用上使用；第三，提供5种不同的语音选择；第四，通过新型文本转语音模型和语音识别系统实现。

在图像方面，第一，允许用户上传图像与ChatGPT进行交互；第二，支持多张图像；第三，提供移动应用上的绘图工具；第四，使用多模态GPT模型（Generative Pre-Trained Transformer，生成式预训练Transformer模型）理解图像。

“有意见”留言板

@卡卡卡卡西：多模态一直都是AI的一个基础特性，没什么值得惊讶的，只不过原来由应用厂商或外部开发者开发的功能，现在OpenAI做成标准模块集成到通用产品中了，在多模态方面，ChatGPT肯定会越来越丰富。

@用AI评AI：ChatGPT的语音功能和图像功能的推出，将为AI技术的发展开辟新的道路，极大地改变我们与AI的交互方式，使得交互更加直观和便捷，同时也将使得OpenAI在人工智能领域的地位更加稳固。

@干啥干啥：仔细看一下，第一个回答是个通用回答，发不发图片都不影响，第二个是简单的图像识别和上下文关联，第三个是阅读理解了使用说明和图像识别，感觉好像也都是已有能力的组合，其实也没有那么令人惊艳。

来源：至顶网有意见频道

0赞

好文章，需要你的鼓励

有意见 | 重磅更新！ChatGPT可以看图片听语音啦 原创

来源：至顶网有意见频道

2023

09/27

17:05

分享

点赞

Flytrex无人机携手达美乐，可一次性送达两个大号披萨

欧洲最大3D打印公寓楼提前数月竣工

彼亚乔携手迪士尼推出Grogu主题自主跟随货运机器人

Okta将AI智能体安全管理扩展至Amazon Bedrock并向第三方身份提供商开放

苹果13英寸iPad Pro Magic键盘键盘亚马逊历史低价，直降25%

WhatsApp iOS版Liquid Glass界面设计正式向更多用户推送

OpenAI为ChatGPT Pro推出个人财务管理新功能

赛格威全新Xaber 300电动越野摩托车正式开售，最高时速达96公里

OpenAI再度重组高管架构，全力押注AI智能体战场

出门在外也能用！OpenAI 将 Codex 接入 ChatGPT 移动端

Google Gemini应用图标迎来细微配色调整

Synetic在2026嵌入式视觉峰会上发布LYNX计算机视觉SDK

当超1/4美国高中生用ChatGPT学习：一场静默的教育革命正在发生

Sam Altman最新博文《反思》：有信心构建AGI，2025年首批AI智能体将“加入劳动力大军”

ChatGPT可视频通话，距离“Her”越来越近 (Day 6/12)

突破性功能！OpenAI发布ChatGPT Projects，万能工具箱上线！

突发！OpenAI正式发布ChatGPT网络搜索，彻底颠覆谷歌！

将 Chrome 浏览器默认搜索引擎换成 GPTSearch

刚刚，苹果将ChatGPT集成在iPhone 16，一夜重塑手机！

IBM 改进生成式AI预测：利用时间模式而不仅是注意力机制

关闭ChatGPT的这项设置，让后台对话更安全

基本就是AGI？GPT-4o“它”来了

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

有意见 | 重磅更新！ChatGPT可以看图片听语音啦原创