当企业看到一个新技术,都第一时间赶紧去实践落地,近日,北大团队联合兔展发起了一项Sora复现计划——Open Sora。就是按照文生视频大模型Sora技术报告的整体框架内容,分三部分包括:Video VQ-VAE、Denoising Diffusion Transformer(去噪扩散型Transformer)和Condition Encoder(条件编码器),复现“国产版Sora”。
个人认为作为最高学府,其聪明才学分分钟可以复刻Sora,但是希望能有更多的创新出来。
“有意见”留言板
@媒体搬运工:人家有了一个Sora,我们就来个Open Sora。哎,我们总是跟在人家屁股后面。我们太缺乏原创性创新了,没有坚实的底座,再丰富的AI应用都是为别人做嫁衣裳。
@辣腿堡不加酱:从来不怀疑我们的学习能力和复现速度,希望未来的某一天在人工智能方面不只是复现而是超越。
好文章,需要你的鼓励
AMD 最近推出了第二代 AMD Versal Premium MoP(Memory on Package,封装上内存)自适应SoC。
香港大学与字节跳动研究团队提出"桥接动作"概念,通过只学习人类手腕的平移轨迹(丢弃噪声大且易误导机器人的旋转信息),实现从人类操作视频向双臂机器人的高效技能迁移。
ProMSA是由清华大学与OPPO联合提出的视觉问答智能体,通过自适应切换图像和文字检索工具、多轮渐进式搜索,在E-VQA和InfoSeek上超越现有方法。