有意见 | AI天花板GPT-4，伪装成人的功力有几成？原创

GPT-4能拿捏图灵测试不

以GPT-4的表现，很多人觉得它应该能拿捏70岁的图灵测试了。自1950年以来，图灵测试一直作为评估机器思维能力的标准，它要求AI通过文本交流让人相信它是人类。最近，研究人员又进行了一次测试，将GPT-4、GPT-3.5、ELIZA与真人进行对比，看谁最能诱使人们相信。结果GPT-4以41%的成功率优于GPT-3.5的14%和ELIZA的27%，但仍低于人类的63%。

“有意见”留言板

@Ada：在1950年，图灵测试非常超前，但70年后的现在，它大概只能作为一个学术上的参考，做实际产品的IT界如果再拿它说事，就没意思了。

@媒体搬运工：GPT-4没有通过图灵测试，这让我很意外！但是机器归机器，人归人，没必要纠结图灵测试。

@辣腿堡不加酱：至少目前的人工智能还不能完全做到跟人类一样，表达起来显得过于专业，用词也严谨，输出速度和内容量也是明显比人类强。但情绪变化和幽默程度应该是和人类有些区别的，如果有天人工智能能跟人类真像人类之间沟通那样，也是一件细思极恐的事情。

来源：至顶网有意见频道

0赞

好文章，需要你的鼓励

有意见 | AI天花板GPT-4，伪装成人的功力有几成？ 原创

来源：至顶网有意见频道

2023

12/04

18:18

分享

点赞

高性能 AI 边缘推理服务器MIC-743-AT

Instagram长视频内容和个性化订阅可能即将到来

NVIDIA DGX Spark

Dell Pro Max with GB10

至顶AI实验室硬核评测：戴尔 Precision 5490移动工作站搭建Open Deep Research，打造专属于你的全流程AI研究助手

惠普ZBook Fury G1i高性能移动工作站

至顶AI实验室硬核评测：夸克 AI 眼镜全链路"无切换体验"，当AI助手真正走进日常

夸克AI眼镜

至顶AI实验室硬核评测：据说这就是AI手机的形态，贴脸开大，豆包手机上手评测

OpenFlex(TM) Data24 NVMe-oF(TM) 存储平台

英特尔(R) 至强(R) 6776P处理器

Solidigm D7-PS1010 E1.S 液冷固态硬盘

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

思科在Cisco Live阿姆斯特丹大会上展示简洁、安全和AI就绪的创新技术

区分“模型”和“应用”是对AI最大的误解

终端侧AI，如何从DeepSeek的连锁反应中受益？

Gartner发布2025年及未来中国企业实现AI价值的重要预测

专访DeepMind CEO：我们距离实现AGI只需5-10年

企业AI是确定性的长期主义

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

有意见 | AI天花板GPT-4，伪装成人的功力有几成？原创