讯飞星火的迭代速度真牛,昨天,讯飞星火就迎来重大升级,相比去年10月24日发布的讯飞星火V3.0,实现了七大能力全面提升:讯飞星火V3.5整体接近GPT-4 Turbo;文本生成提升7.3%;数学、语言理解、语音交互能力超过GPT-4 Turbo;代码达到GPT-4 Turbo 96%;多模态达到GPT-4V 91%。
“讯飞星火3.5达到了预期。”科大讯飞董事长刘庆峰内心激动表面平静的呐喊。而且志不在此,其星火开源大模型“星火开源-13B”, 已在华为昇思开源社区首发上线了。
“有意见”留言板
@贰言:对于公司员工来说,能在短短几十秒内生成PPT简直是福音,速度之快也令人惊叹。另外,科大讯飞与华为合作,将“星火开源-13B”大模型与华为的全场景AI计算框架“昇思开源社区”联合上线。这一举措进一步推动了模型的广泛应用和持续发展。通过深度适配国产算力,“星火开源-13B”大模型有望在各个领域得到广泛应用,推动人机交互的变革和升级。
@卡卡卡卡西:大模型都这么牛了,能不能拯救一下智能音箱?家里那几个大牌智能音箱现在对话起来依然很费劲,为数不多的交流也还是问时间、问天气。
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。