以GPT-4的表现,很多人觉得它应该能拿捏70岁的图灵测试了。自1950年以来,图灵测试一直作为评估机器思维能力的标准,它要求AI通过文本交流让人相信它是人类。最近,研究人员又进行了一次测试,将GPT-4、GPT-3.5、ELIZA与真人进行对比,看谁最能诱使人们相信。结果GPT-4以41%的成功率优于GPT-3.5的14%和ELIZA的27%,但仍低于人类的63%。
“有意见”留言板
@Ada:在1950年,图灵测试非常超前,但70年后的现在,它大概只能作为一个学术上的参考,做实际产品的IT界如果再拿它说事,就没意思了。
@媒体搬运工:GPT-4没有通过图灵测试,这让我很意外!但是机器归机器,人归人,没必要纠结图灵测试。
@辣腿堡不加酱:至少目前的人工智能还不能完全做到跟人类一样,表达起来显得过于专业,用词也严谨,输出速度和内容量也是明显比人类强。但情绪变化和幽默程度应该是和人类有些区别的,如果有天人工智能能跟人类真像人类之间沟通那样,也是一件细思极恐的事情。
好文章,需要你的鼓励
印尼就业平台Pintarnya宣布完成1670万美元A轮融资,由Square Peg领投。该平台成立于2022年,专注服务蓝领和非正规就业者,提供求职匹配和金融服务。目前拥有超过1000万求职用户和4万家雇主,年收入增长近五倍,预计年底实现盈亏平衡。新资金将用于加强平台技术和扩大金融服务。
南洋理工大学研究团队开发的Life2vec系统能够通过分析个人生活数据预测未来人生轨迹,在收入和职业预测上达到78-85%准确率。该系统使用丹麦600万人的真实数据,采用类似GPT的AI技术,揭示了教育投资、社交网络、地理位置等因素对人生发展的深层影响规律,为政策制定和个人规划提供科学依据。
YouTube Music庆祝十周年,推出多项新功能与Spotify竞争。新增"品味匹配"播放列表功能,可合并多用户的音乐偏好,类似Spotify Blend。应用还将通知用户即将发布的音乐、周边和演出信息,并与Bandsintown合作帮助粉丝发现演唱会。此外,用户可在专辑和播放列表上评论,获得忠诚度徽章。YouTube Music目前拥有超过3亿首曲目和40亿个用户生成播放列表,订阅用户已超过1.25亿。
中国科学家成功将扩散模型应用于语言生成,开发出名为LLaDA的创新AI系统。与ChatGPT等传统按序生成的模型不同,LLaDA采用"填空"方式工作,能同时考虑文本前后信息。在80亿参数规模下,LLaDA在多项测试中表现优异,特别是在逆向推理任务上超越GPT-4o,为AI语言模型发展开辟了全新技术路径。