过去一年,横空出世的ChatGPT成为2023年最热话题,今年龙年开年,OpenAI文生视频Sora对世界的模拟呈现能力让全球震撼。而这种震撼或者给人们带来压力不是技术本身,而是Sora模型具备的不可思议的进化速度。
当然对于OpenAI CEO 萨姆·奥尔特曼(Sam Altman)而言最关心的还是算力,因为视频模型的训练会比语言模型更加耗费算力。据外媒报道,奥尔特曼计划筹集夸张的 5 万亿-7 万亿美元以提高全球芯片制造能力,来应对生成AI的进化速度。可见Sora进化速度有多快,奥尔特曼的压力就有多大。
“有意见”留言板
@媒体搬运工:唯利是图才是驱动AI发展的最大动力,2023年一整年国内都在围着大模型转,今年大模型会如何发展还是挺有悬念的,这个Sora文生视频好像在合规方面比单纯的文字更具挑战,这样国内企业应该不会那么快跟进,虽然我们有海量的视频资源。
@辣腿堡不加酱:不论技术多新,真正能落地应用才有价值。对于那些被课程割韭菜的人们,背后是敏锐好学,还是无知焦虑?
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。