大数据时代,数据检索是必备的基础能力。近日,阿里开源了自研搜索引擎Havenask,目前项目文件已在GitHub推出。
Havenask是阿里巴巴内部广泛使用的大规模分布式检索系统,支持了包括淘宝、天猫、菜鸟、高德、饿了么、优酷在内整个阿里巴巴集团的搜索业务,是阿里过去十多年在电商领域积累下来的核心竞争力产品。在功能性上,Havenask具有灵活的定制和开发能力,支持算法快速迭代,能够帮助开发者量身定做适合自身业务的智能搜索服务,助力业务增长。
我们的科技留言板“有意见”如下
@新老产品:搜索引擎发展已有15年的历史,然而搜索引擎产品并不那么令人满意。广告、重复、不准确都是用户的痛点,但仍没有好的产品来满足。ChatGPT虽然不是定位搜索引擎的产品,其取代传统搜索引擎的功能和实力堪称强悍。搜索引擎如何继续创新,其搜索内容的广度和深度都值得大厂、初创企业继续探索。
@梁山伯与猪硬来:可以预见,随着Havenask的开源,除了电商、互联网行业可借助大规模搜索系统,更多产业也将借助其实现效率升级和体验进步。
@隔壁二大爷:在肉眼可见的将来,很多人以为搜索引擎都一样,其实不然,对比一下PDD和某宝某东,多搜索几次,你大概率能感受到差异,阿里这次做了开源的搜索引擎,试问,鼎鼎大名的ElasticSearch,您准备好了吗?
好文章,需要你的鼓励
Akamai的分布式边缘架构从设计之初就以韧性为核心,全球平台通过跨区域负载均衡和智能路由技术,确保即使某些节点出现故障,流量也能无缝切换至可用节点。
卡内基梅隆大学联合Adobe开发出革命性的NP-Edit技术,首次实现无需训练数据对的AI图像编辑。该技术通过视觉语言模型的语言反馈指导和分布匹配蒸馏的质量保障,让AI仅用4步就能完成传统50步的编辑任务,在保持高质量的同时大幅提升处理速度,为图像编辑技术的普及应用开辟了全新道路。
Turner & Townsend发布的2025年数据中心建设成本指数报告显示,AI工作负载激增正推动高密度液冷数据中心需求。四分之三的受访者已在从事AI数据中心项目,47%预计AI数据中心将在两年内占据一半以上工作负载。预计到2027年,AI优化设施可能占全球数据中心市场28%。53%受访者认为液冷技术将主导未来高密度项目。电力可用性成为开发商面临的首要约束,48%的受访者认为电网连接延迟是主要障碍。
复旦大学团队突破AI人脸生成"复制粘贴"痛点,开发WithAnyone模型解决传统AI要么完全复制参考图像、要么身份差异过大的问题。通过MultiID-2M大规模数据集和创新训练策略,实现保持身份一致性的同时允许自然变化,为AI图像生成技术树立新标杆。