以GPT-4的表现,很多人觉得它应该能拿捏70岁的图灵测试了。自1950年以来,图灵测试一直作为评估机器思维能力的标准,它要求AI通过文本交流让人相信它是人类。最近,研究人员又进行了一次测试,将GPT-4、GPT-3.5、ELIZA与真人进行对比,看谁最能诱使人们相信。结果GPT-4以41%的成功率优于GPT-3.5的14%和ELIZA的27%,但仍低于人类的63%。
“有意见”留言板
@Ada:在1950年,图灵测试非常超前,但70年后的现在,它大概只能作为一个学术上的参考,做实际产品的IT界如果再拿它说事,就没意思了。
@媒体搬运工:GPT-4没有通过图灵测试,这让我很意外!但是机器归机器,人归人,没必要纠结图灵测试。
@辣腿堡不加酱:至少目前的人工智能还不能完全做到跟人类一样,表达起来显得过于专业,用词也严谨,输出速度和内容量也是明显比人类强。但情绪变化和幽默程度应该是和人类有些区别的,如果有天人工智能能跟人类真像人类之间沟通那样,也是一件细思极恐的事情。
好文章,需要你的鼓励
Workday高管指出,企业必须从传统的资历导向转向技能导向策略,才能成功整合AI智能体到workforce中。AI智能体应被视为具有特定技能的"数字员工",需要经历完整的员工管理生命周期,包括招募、培训、发展和离职规划。调研显示,新加坡超过40%的企业已开始采用技能导向策略,其中约60%报告了创新提升等益处。企业应建立统一的治理系统来管理人类员工和AI智能体,确保两者协同工作而非相互替代。
沙特TachyHealth团队开发的32亿参数医疗AI模型Gazal-R1,通过创新的双阶段训练方法在医疗推理任务上超越了12倍大的模型,在MedQA等测试中取得87.1%的优异成绩,展现了精巧训练策略胜过规模扩张的重要启示,为资源有限的医疗AI研究提供了新路径。
Songscription公司发布AI音乐转录工具,可在几分钟内将音频文件转换为乐谱。该产品采用免费增值模式,面向专业和业余音乐家。目前主要支持钢琴转录,未来计划增加吉他谱等功能。用户可上传音频文件或直接从YouTube链接进行转录,系统还能生成钢琴卷帘谱。公司定位为增强型音乐记谱软件,帮助用户加速转录过程。该初创公司已获得Reach Capital的预种子轮融资。
奥地利维也纳医科大学研究团队开发了RetFiner技术,通过让眼科AI模型同时学习OCT图像和医疗文字描述,显著提升了诊断准确率。该方法采用四种训练任务让AI模型建立图像与文字的深层联系,在三个主流眼科AI模型上实现了2-6个百分点的性能提升,为医学AI发展开辟了新方向。