10 年磨一剑，阿里开源自研搜索引擎 Havenask！

信息化时代，搜索引擎是很多兵家必争之地。这一场的角逐也从传统的互联网领域逐渐拓展到了分布式系统之上。近日，阿里重磅开源了自研的搜索引擎 Havenask（https://github.com/alibaba/havenask），它也在今年双 11 活动中大展身手，支持了淘宝、天猫、菜鸟、优酷在内整个阿里的搜索业务，旨在为用户提供高性能、低成本、易用的搜索服务。

CSDN资讯

4463人浏览 · 2022-12-15 10:19:56

CSDN资讯 · 2022-12-15 10:19:56 发布

整理 | 苏宓
出品 | CSDN（ID：CSDNnews）

信息化时代，搜索引擎是很多兵家必争之地。这一场的角逐也从传统的互联网领域逐渐拓展到了分布式系统之上。

近日，阿里重磅开源了自研的搜索引擎 Havenask（https://github.com/alibaba/havenask），它也在今年双 11 活动中大展身手，支持了淘宝、天猫、菜鸟、优酷在内整个阿里的搜索业务，旨在为用户提供高性能、低成本、易用的搜索服务。

在功能性方面，Havenask 具有灵活的定制和开发能力，支持算法快速迭代，能够帮助开发者量身定做适合自身业务的智能搜索服务，助力业务增长。

十年磨一剑

Havenask 是经历了 10 多年迭代的产物，凭借性能、稳定性等优势，它在阿里内部运用得十分广泛，不仅支撑了集团内所有核心的搜索业务场景，同时其自身累积了很多针对搜索场景的功能及性能优化经验。

谈起 Havenask 的发展历程，根据其官网介绍显示，主要经历了三个阶段：

1999 年~2008 年，该技术起源于雅虎搜索技术（YST、Vespa）的单机版搜索引擎，支持淘宝、B2B 等子公司搜索业务。
2009 年~2011 年，完成自研搜索引擎 HA3（Havenask）研发，开启自研大规模分布式高性能搜索引擎时代。
2013 年，Havenask 支持阿里巴巴集团几乎所有搜索业务，统一代码分支，以产品化方式规模化支持集团大量搜索业务。
2018 年，随着深度学习技术广泛应用，Havenask 继续演进，除了提供传统的倒排索引能力外，还提供 KV、KKV、向量索引，支持深度模型和在线预测，提供插件定制、自研 CAVA 语言支持业务扩展等能力，成为阿里搜推广场景的核心 AI 智能引擎。

在这里插入图片描述
2022 年双十一期间，阿里决定开源这个在电商搜索和推荐业务中最核心部分的图化引擎之一的大规模分布式检索系统 Havenask，赋能更多开发者。