以GPT-4的表现,很多人觉得它应该能拿捏70岁的图灵测试了。自1950年以来,图灵测试一直作为评估机器思维能力的标准,它要求AI通过文本交流让人相信它是人类。最近,研究人员又进行了一次测试,将GPT-4、GPT-3.5、ELIZA与真人进行对比,看谁最能诱使人们相信。结果GPT-4以41%的成功率优于GPT-3.5的14%和ELIZA的27%,但仍低于人类的63%。
“有意见”留言板
@Ada:在1950年,图灵测试非常超前,但70年后的现在,它大概只能作为一个学术上的参考,做实际产品的IT界如果再拿它说事,就没意思了。
@媒体搬运工:GPT-4没有通过图灵测试,这让我很意外!但是机器归机器,人归人,没必要纠结图灵测试。
@辣腿堡不加酱:至少目前的人工智能还不能完全做到跟人类一样,表达起来显得过于专业,用词也严谨,输出速度和内容量也是明显比人类强。但情绪变化和幽默程度应该是和人类有些区别的,如果有天人工智能能跟人类真像人类之间沟通那样,也是一件细思极恐的事情。
好文章,需要你的鼓励
SAP首席执行官Christian Klein在2026年Sapphire大会上坦承,公司约在八九个月前调整了AI战略方向,从强调AI技术本身转向聚焦业务成果,目标是实现"自主企业"愿景。SAP发布了全新品牌SAP Business AI和SAP Autonomous Suite,重构AI平台以更好融入客户业务上下文。SAP高管还强调,需防范"智能体失控"风险,并引入"企业记忆"概念提升AI决策的精准度。
研究揭示多源视觉融合并非总有益,提出MARS框架通过单源锚点量化信息增益,动态调节多源融合优势,在多个视觉推理任务上实现显著性能提升。
英国卫生与社会保障部发布测算数据,显示NHS数字化单一患者记录(SPR)每年可减少约2万次急诊就诊,并节省约2000万英镑。该计划将强制要求全科医生和医院共享患者数据,形成统一的健康档案,患者可通过NHS App访问。该措施是政府100亿英镑医疗数字化计划的核心。此外,NHS虚拟医院NHS Online已正式成立,预计2027年上线,首三年可提供约850万次诊疗服务。
MiniMax发布M2系列混合专家大模型,总参数2299亿但每次仅激活98亿,通过专项数据流水线、Forge强化学习系统和自进化机制,在代理编程、深度搜索等任务上达到顶级闭源模型水平。