国产大模型零一万物API正式开放,提供了以下三个模型,开发者可以直接调用:
Yi-34B-Chat-0205:基于开源版进行深度优化的版本,指令遵循能力提升近 30%,模型回复延迟大大降低。适用于聊天、问答、对话、协作、翻译等场景。
Yi-34B-Chat-200K:200K 超长上下文,支持处理约 20w ~ 30w 个中文汉字(≈ 1 本《三体》))或英文单词。适用于多篇文档内容理解、海量数据分析挖掘和跨领域知识融合应用等场景。
Yi-VL-Plus: 支持1024*1024高分辨率图片输入,具备图片问答、图表理解、OCR、视觉推理能力。适用于对复杂图表、截图的内容分析,包括信息识别、提取、理解、推理等。
“有意见”留言板
@回归:按照这个测试的结果,有放弃GPT-4转 Yi大模型的冲动。很想马上就体验一下,希望价格能够更加亲民,让大模型真正成为企业的生产工具,员工的好助手。
@无聊的内卷:感觉现在AI发展的关键是对应用的开发。直接点说:就是真正在消费端、在企业端需要有能盈利的应用。现在大家都在通用大模型这块卷参数,卷排行榜,动不动就超越GPT,其实无非就是多几块GPU,多几条算法优化,说实话有点舍本逐末。
@云木:现在各家都在强调长文本能力,零一万物也将此作为API平台的重点。此外AI软件时代会引发从底层到应用层的变革,纯移动应用将成为过去式,未来AI原生应用会越来越重要。
好文章,需要你的鼓励
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
OpenAI推出新AI模型GPT-5-Codex,能够在无用户协助下完成数小时的编程任务。该模型是GPT-5的改进版本,使用额外编码数据训练。测试显示,GPT-5-Codex可独立工作超过7小时,能自动发现并修复编码错误。在重构基准测试中得分51.3%,比GPT高出17%以上。模型可根据任务难度调整处理时间,简单请求处理速度显著提升。目前已在ChatGPT付费计划中提供。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。