日前,谷歌正式发布新一代搭载可运行更复杂ML(机器学习)芯片Tensor G3的安卓旗舰手机Pixel 8 / Pro。谷歌指出,Pixel 8 Pro是首款直接在设备上运行谷歌基础大模型的手机,其计算量是Pixel 7上最大的ML模型的150倍,可为用户提供更自然的智能语音、生成网页摘要以及更加智慧化的图片编辑功能。
“有意见”留言板
@逻辑:大模型又在手机这个行业落地了,而AI行业的焦点已经从基础模型转向生成式AI服务。这些服务的优势在于其转换成本低,但由于其训练和设计复杂且昂贵,导致基础模型难以切换。初创企业和开源项目正在提供免费模型,降低生成式AI服务的价格,可能导致低质量的竞争,进而导致企业和AI公司融资减少、估值下降。这可能会对行业产生负面影响,就像元宇宙的发展历程一样,从高峰走向衰落。
@实际:相比于 iphone 的卫星通话、碰撞救生这种花里胡哨的功能,google 的Pixel 8 Pro将重点放在了AI与安全。Tensor G3芯片组的性能似乎更接近Snapdragon 8+ Gen 1芯片,虽然和15 pro一样的发热,但重点还是改善了视频通话、照相和声音等方面,存储也可以有1T 的选择,更注重客户的体验。
@Betty:Pixel 8 和 Pixel 8 Pro在国内有销售吗?这个P的效果让我有些疑惑,如果有机会,我很愿意亲自试用一下,以便有更深入的了解。
好文章,需要你的鼓励
AI项目从试点转向生产阶段时,企业面临意外的云成本激增问题。推理工作负载需要全天候运行以确保服务正常,成本可能一夜间飙升1000%以上。许多公司每月费用从5000美元激增至50000美元。为控制成本,企业开始采用混合架构:将推理工作负载迁移至本地或托管设施,训练任务保留在云端。这种模式可削减60-80%的基础设施支出,在保持性能的同时实现成本可预测性。
北航团队发布AnimaX技术,能够根据文字描述让静态3D模型自动生成动画。该系统支持人形角色、动物、家具等各类模型,仅需6分钟即可完成高质量动画生成,效率远超传统方法。通过多视角视频-姿态联合扩散模型,AnimaX有效结合了视频AI的运动理解能力与骨骼动画的精确控制,在16万动画序列数据集上训练后展现出卓越性能。
企业在AI模型选择上面临开放源码与封闭专有技术的抉择,这一选择对财务和定制化都有重要影响。开放模型如Meta Llama提供更大控制权和定制选项,而封闭模型如OpenAI GPT-4o提供简化使用和企业级支持。专家建议采用投资组合策略,根据准确性、延迟、成本、安全性等因素选择合适模型,而非单一选择。
这项研究解决了AI图片描述中的两大难题:描述不平衡和内容虚构。通过创新的"侦探式追问"方法,让AI能生成更详细准确的图片描述,显著提升了多个AI系统的性能表现,为无障碍技术、教育、电商等领域带来实用价值。