8月15日下午,讯飞星火认知大模型V2.0升级发布会在合肥举行。本次认知大模型升级,上线代码生成、图片生成、视频生成、星火插件等新功能,并推出面向老师、学校、企业、开发者等更多元的应用落地产品。同时,科大讯飞还与联合华为推出了“讯飞星火一体机”,将面向金融、国企、央企等重点行业客户,提供基于行业专用数据的自主可控私有化大模型。
“有意见”留言板
@不倒翁:科大讯飞很自信,我看了看发布会的数据,星火V2.0代码生成效果,确实比星火V1.5版本在Python、Java、JS和C++四种语言的写作能力有了很大的提升,当然和GPT-4还有不小的差距。好在越往后,代码生成效果增幅越慢。给个几年时间,大家都在同一条起跑线上了。当然对于国内其他大模型也是同样的机会。关键是大家能坚持几年?
@周一见:从5月份首次发布到今天的2.0版本再到不久的10月份升级,科大讯飞这是主打一个成为ChatGPT,超越ChatGPT。在开放体验前层层升级以求达到最佳状态,浅浅期待一下这个大模型带来的全新体验。
@贰言:新模型将实现代码能力和多模态能力的重大突破,可在为程序员在编写代码时提供更好的帮助的同时,还能处理多种类型的数据,如文本、图像和声音等。
好文章,需要你的鼓励
博通宣布对VMware Cloud Foundation平台进行重大升级,将私有AI服务集成到核心订阅中,并为vSAN存储虚拟化软件添加云原生对象存储支持。此举旨在满足企业对简化基础设施、高效AI采用和网络安全的需求。升级包括与英伟达合作的VMware Private AI Foundation服务、支持AMD GPU、Amazon S3兼容对象存储、与Canonical合作的Ubuntu容器镜像,以及新的四阶段自动化安全流程。博通还推出了面向高监管行业的VCF网络合规高级服务。
清华大学等多家机构研究团队完成了语音分离技术的全面调研,系统梳理了从传统方法到深度学习的技术演进。研究揭示了"鸡尾酒会问题"的核心挑战,分析了各种学习范式和网络架构的优劣,并通过统一实验框架提供了公平的性能基准。调研涵盖了实时处理、轻量化设计、多模态融合等关键技术方向,为学术界和产业界的技术选型提供了重要参考,推动语音分离从实验室走向实际应用。
Google正式发布Gemini 2.5 Flash Image模型,该模型此前在测试版中被称为nanobanana。新模型为企业创意项目提供更多选择,能够快速修改图像外观并提供比以往模型更强的控制能力。该模型在保持人物相似度和编辑一致性方面表现出色,支持多轮编辑、照片融合等功能,并已集成到Gemini应用中供付费和免费用户使用。
浙江大学和腾讯微信视觉团队发现AI图片生成训练中"时机胜过强度"的重要规律,开发出TempFlow-GRPO新方法。通过轨迹分支技术精确评估中间步骤,结合噪声感知权重调整优化不同阶段的学习强度,将训练效率提升三倍,在复杂场景理解方面准确率从63%提升至97%,为AI训练方法论带来重要突破。