如今已临近年尾,新的一年AI领域可能会出现哪些变化?最近福布斯发布了一份2024年的10大AI预测:英伟达将成为云服务商、Stability AI可能面临倒闭、LLM一词将逐渐淡出视野、闭源模型将继续保持领先、新职位首席人工智能官兴起、替代Transformer的全新架构获得认可、对于AI创业公司投资的监管、微软OpenAI或将「决裂」、人工智能炒作转向其他方向、人工智能版权问题。
“有意见”留言板
@给个提示:按这个节奏,大模型越来越多元,AI越来越普及,提示词这件事可能就变得像用搜索引擎、修图软件一样,成为一种必备技能了吧。那“提示工程师”这个职位会不会被影响呢?我想它可能会像设计师那样细分出不同的类型,也可能成为各种传统岗位的“斜杠”。
@存疑:Transformer架构在当今AI技术领域占主导。ChatGPT、Midjourney、GitHub Copilot都是基于Transformer架构构建的。虽然听说过Mamba和液态神经网络,但不太信明年就能有什么实际应用。
好文章,需要你的鼓励
微软研究院推出VIBEVOICE,这是一种革命性的AI语音合成技术,能够一次性生成长达90分钟的多人对话音频。
成均馆大学团队开发出选择性对比学习新方法,让机器通过观察人类交互场景学会识别物体功能部位。该技术突破传统局限,采用动态学习策略,能根据信息质量调整学习方式,在多个数据集上显著超越现有方法,为机器人、自动驾驶等领域的智能交互应用奠定重要基础。
微软与三星达成合作,将Copilot人工智能助手集成到三星的智能电视和显示器产品中。用户可以通过语音或遥控器直接与Copilot交互,获得智能问答、内容推荐、设备控制等服务。这一合作标志着AI助手从传统计算设备向家庭娱乐设备的进一步扩展,为用户提供更加智能化的观看体验。
新加坡南洋理工大学研究团队开发出EgoTwin系统,这是首个能够根据文字描述同时生成第一人称视频和匹配人体动作的AI框架。该系统通过创新的头部中心动作表示方法和因果交互机制,解决了视角对齐和动作画面同步的核心难题,在17万样本的真实数据集上实现了显著性能提升,为VR内容创作、影视制作等领域提供了新的技术可能。