苹果WWDC23凌晨开幕。其中最瞩目的要数跳票多次的AR头显Apple Vision Pro,此次终于揭开面纱。Vision Pro搭载了M2和R1芯片,兼容iOS和iPadOS各种软件,交互上直接通过手、眼睛和语音来控制。有人靠近时,EyeSight功能还会将设备视区变透明。就是起售价高达3499美元,比之前预期还高出不少。此外,苹果发布了15英寸的 MacBook Air、搭载M2 Ultra的Mac Studio和Mac Pro,还展示了iOS 17、iPadOS 17、watchOS 10、macOS Sonoma等新系统。
“有意见”留言板
@不倒翁:一个产品的好与不好,从最初第一代就能看出是否引领时代,乔布斯说过,希望把苹果产品打造成,即使牛顿,爱因斯坦等这些牛人复活也感受到喜欢和与众不同,iPhone做到了,MacBook做到了。但是目前的AR眼镜设备,个人第一印象的外观形态是Google的glass,而不是一个大眼罩。要是乔布斯还在,不知道会不会吐槽这个AR设备。
@黑咕隆咚:从1968年第一个AR系统雏形诞生,到苹果的Vision Pro的发布,AR在每个阶段都有很大的突破。售价2万元虽然价格有点高,但它给人带来的体验却是值得的,如果这项技术能应用在诸如游戏、教育、医疗等多个领域那就更物有所值了。
@周一见:Vision Pro的发布可以说苹果在技术创新、新商机和产业影响方面迈出了重要一步,不过实际效果和市场反应还是取决于产品的具体性能、功能和价格等因素,有体验才有发言权,等我用上了再说吧。
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。