AI视频生成领域又地震了。AI视频生成软件Pika 1.0经过四个多月的内测,近日正式发布了第一个产品。Pika 1.0能够生成3D动画、动漫和电影,还支持各种画布延展、局部修改、视频时长拓展等编辑功能。Pika 1.0背后的团队是典型的小而精,仅有4名全职员工,创始人郭文景和联合创始人兼CTO Chenlin Meng,都是斯坦福大学AI Lab博士生。产品发布的同时,Pika Labs也官宣了新一轮5500万美元的融资。
“有意见”留言板
@chu:宣传视频里面还是能看到一些瑕疵,但是和之前那个披萨广告视频比起来,这进步速度确实恐怖。完成度都挺高的,尤其是丧尸片做得也很棒…… 就是能不能别再搞waitlist了?太吊胃口了!
@咿呀:有趣的是,Pika走红后,创始人郭文景老爸实控的A股上市公司信雅达也被带火了,今天开盘一字涨停,网友戏称“女儿概念股”。
@速度七十迈:对于一个只有4人的公司来说,估值达到2亿美元可能会引起一些争议。这样的估值通常基于公司未来增长的潜力和预期,而不仅仅是当前的财务状况。如果Pika 1.0确实具有革命性的潜力,那么高估值也是可以理解的。
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。