在理解、推理、数学等领域,大模型都不是肉眼可见的速度进化,而是像坐上火箭一样。最新的消息显示Anthropic升级大模型Claude3。报告说,Claude 3系列模型在推理、数学、编码、多语言理解和视觉方面,都树立了新的行业基准!其中Claude3的Opus模型,已经全面超越GPT4。特别是在复杂的推理任务上,Claude3可以说是全面吊打GPT-4。
虽然技术报告的指标可能并不能反应真实能力,但是通过数据训练和迭代,真实能力超过指标也是瞬间的事情。
“有意见”留言板
@不倒翁:大模型进化真是一天一个样,按照演示来看,Claude3进化最大的,就是推理,就是逻辑。目前初中的物理、化学和数学等理科题基本都秒解,而且准确率吊打很多学生了,关键是用不了多久,可能高中题就搞定,只要训练的足够多。
@周一见:大语言模型的技术竞争日益激烈,每一代都有显著进步。听说Claude 3的Opus模型已接近人类理解水平,希望能对话看看它能否为我们带来更加智能和高效的服务。
好文章,需要你的鼓励
Panzura在其Symphony数据管理平台中新增了访问控制列表分析和自动修复功能。该平台专门处理EB级非结构化数据集,具备扫描、分层、迁移和合规分析等功能。Panzura声称58%的企业受到权限扩散问题影响,74%的数据泄露涉及特权凭证滥用。新版本重点解决权限继承中断、过度授权访问和合规盲点等问题,提供完整的文件系统权限可视性和快速问题解决能力。
沙特TachyHealth团队开发的32亿参数医疗AI模型Gazal-R1,通过创新的双阶段训练方法在医疗推理任务上超越了12倍大的模型,在MedQA等测试中取得87.1%的优异成绩,展现了精巧训练策略胜过规模扩张的重要启示,为资源有限的医疗AI研究提供了新路径。
Arista Networks宣布收购博通旗下VeloCloud SD-WAN业务,交易金额约10亿美元。VeloCloud是SD-WAN领域先驱企业,拥有集成安全功能的云管理SD-WAN解决方案。此次收购填补了Arista在分支机构连接方面的空白,使其能够提供端到端网络解决方案。同时,前思科高管Todd Nightingale加入担任总裁兼首席运营官,将助力公司拓展更广泛的客户群体。
奥地利维也纳医科大学研究团队开发了RetFiner技术,通过让眼科AI模型同时学习OCT图像和医疗文字描述,显著提升了诊断准确率。该方法采用四种训练任务让AI模型建立图像与文字的深层联系,在三个主流眼科AI模型上实现了2-6个百分点的性能提升,为医学AI发展开辟了新方向。