有意见 | AI天花板GPT-4，伪装成人的功力有几成？原创

GPT-4能拿捏图灵测试不

以GPT-4的表现，很多人觉得它应该能拿捏70岁的图灵测试了。自1950年以来，图灵测试一直作为评估机器思维能力的标准，它要求AI通过文本交流让人相信它是人类。最近，研究人员又进行了一次测试，将GPT-4、GPT-3.5、ELIZA与真人进行对比，看谁最能诱使人们相信。结果GPT-4以41%的成功率优于GPT-3.5的14%和ELIZA的27%，但仍低于人类的63%。

“有意见”留言板

@Ada：在1950年，图灵测试非常超前，但70年后的现在，它大概只能作为一个学术上的参考，做实际产品的IT界如果再拿它说事，就没意思了。

@媒体搬运工：GPT-4没有通过图灵测试，这让我很意外！但是机器归机器，人归人，没必要纠结图灵测试。

@辣腿堡不加酱：至少目前的人工智能还不能完全做到跟人类一样，表达起来显得过于专业，用词也严谨，输出速度和内容量也是明显比人类强。但情绪变化和幽默程度应该是和人类有些区别的，如果有天人工智能能跟人类真像人类之间沟通那样，也是一件细思极恐的事情。

来源：至顶网有意见频道

0赞

好文章，需要你的鼓励

有意见 | AI天花板GPT-4，伪装成人的功力有几成？ 原创

来源：至顶网有意见频道

2023

12/04

18:18

分享

点赞

百炼成金 向AI炼成金融能力

夸克公开健康大模型技术报告，解密如何打造AI“主任医师”

算力大会再秀硬实力，联想万全大模型训推一体解决方案荣膺“年度重大突破成果奖”

印尼就业平台Pintarnya获得1670万美元A轮融资

YouTube Music十周年推出新功能挑战Spotify

ChatGPT新手入门指南：如何开始使用这个超人气AI聊天机器人

AI监控睡眠：智能家居系统全方位升级

Meta与谷歌达成100亿美元AI云服务合作协议

开发者每天失去焦点1200次——MCP如何改变现状

Y Combinator支持的Oway融资400万美元，打造去中心化"货运版Uber"

VirtualBox 7.2修复3D加速问题并新增Arm架构支持

Adeptia：AI智能体不会取代SaaS应用

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

思科在Cisco Live阿姆斯特丹大会上展示简洁、安全和AI就绪的创新技术

区分“模型”和“应用”是对AI最大的误解

终端侧AI，如何从DeepSeek的连锁反应中受益？

Gartner发布2025年及未来中国企业实现AI价值的重要预测

专访DeepMind CEO：我们距离实现AGI只需5-10年

企业AI是确定性的长期主义

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

有意见 | AI天花板GPT-4，伪装成人的功力有几成？原创

百炼成金向AI炼成金融能力