当产品越多，促销活动越多，入口越来越深的时候，需要有一个好的搜索直达用户需求。

本文分两块，一块是讲一个完整搜索引擎的算法整体架构。一个讲搜索排序的精排过程中都能有哪些花招可以玩。最后附上一些能work的论文。给大家参考。

下面是一个完整搜索算法的架构图：

这里讲的都是算法。一些工程方面的模块，例如物料如何dump进索引没有，数据如何保证实时同步，模型、特征如何实时更新不在本文讨论范围内。

一个query进来后，有两道把关保证搜索的质量：第一个是意图识别，他保证相关搜索不遗漏导流到相关业务线；第二个是召回粗排，他保证跟query词相关的产品不会被漏召回。

意图识别：有两个方面，第一个业务可以自行维护一个意图词库，根据品类不一样维护自己的字典，这一块会有分词服务，你维护一个最长的意图词即可；另一个是训练的NLU模型，

相关的学术研究方向是QueryTagging。

召回粗排：

这一块有一个我觉得AK47的方法，就是graphSAGE 。按Graph Convolutional Networks (GCNs)学派的观点，万事万物兼可graph化，马克思说，人是社会关系的总和，人是图的点，关系是边；item2item同样可以，需要召回的商品都是一个点，他们被一个queryID同时点击过、被浏览过都可以构建边，从而召回时，一旦关系网上的一个商品被触达，根据关系的亲疏，可以召回这些相关商品。

相关代码：https://github.com/williamleif/GraphSAGE

搜索排序算法第一式