过去几年,昆仑万维从一家游戏公司逐渐转变成为全球化的互联网平台,如今它又向AI领域迈了一大步。4月17日,由昆仑万维与奇点智源联合研发的天工3.5大语言模型正式发布,并于同日启动邀请测试。天工是国内首个对标OpenAI ChatGPT的双千亿级大模型,目前可以支持1万字以上的文本对话。从测试来看,天工在文科方面表现出色,但做鸡兔同笼的数学题时出了错,看来理科方面还有待提高。
“有意见”留言板
@TOFU:越来越卷了,互联网巨头也就罢了,游戏公司居然也跟着来了。不过对于大模型来说,得数据者得天下。表面上看起来好像都差不多,但使用体验确实都不一样,说到底,数据才是差异化竞争的关键。
@老董:又多了一个大模型,没有邀请码只能先看一下热闹。不过多一些竞争总还是好的,技术就是在发现问题解决问题中不断进步的嘛。谁能最了解自身产品的不足,当然是那些虎视眈眈的友商啦。
@淋雨一直走:参考百度文言一心的发布,昆仑默默地低调研发,感觉有惊喜。天工3.5发布后,昆仑万维的市值较年初升值了2.7倍。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
上海交通大学研究团队发布了突破性的科学推理数据集MegaScience,包含125万高质量实例,首次从12000本大学教科书中大规模提取科学推理训练数据。该数据集显著提升了AI模型在物理、化学、生物等七个学科的推理能力,训练的模型在多项基准测试中超越官方版本,且具有更高的训练效率。研究团队完全开源了数据集、处理流程和评估系统。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。