在没有自拍神器的古代,人们要想晒“自拍”,靠的是古法纯手工自画像。今天,AI帮他们实现了这个愿望。有人用Midjourney+GPT-4创造了一系列历史名人的自拍,并配上推文和话题。从夏娃到孔子,从穴居人到成吉思汗,从爱因斯坦到猫王,古今中外的名人都被安排了一遍。比如伊娃在苹果树前自拍,并写道:“刚发现一个奇怪的水果,我要咬一口吗?”#伊甸园日记#我眼中的苹果。
“有意见”留言板
@不倒翁:双方合作目前还是单方面输出,就是GPT-4提供逻辑语句和逻辑解释,生成Midjourney 所需的内容模式关键词,还是不能反过来输出,就是GPT-4只能对文字进行理解,还不能对图画进行理解。如果GPT-4可以点评图片内容,那AI生成就又更进一步。
@黑咕隆咚:这个创意还是很有吸引力的,它突破了时空限制,但同时也会产生一些潜在的问题,比如道德与隐私问题、技术滥用如恶意制作虚假信息误导大众、观众对历史人物的误解等等。
@周一见:果然“心有多大,舞台就有多大”,这一现象揭示了技术创新、名人效应、社交媒体传播力和产业融合等诸多因素作用下的成功案例。生成式AI的影响已经慢慢渗透,现在学习和利用生成式AI无疑将会给自己带来更强的竞争力,如果闲来无事,都可以去试试,起码它挺好玩的。
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。