导读 电商场景数据量大、业务复杂,搜索场景作为其中最为核心的流量分发与转化场域,更面临着诸多数据科学领域的问题与挑战。
本文将分享京东零售搜索数据科学团队在电商搜索场景下的数据科学实践,主要介绍:
1. 电商搜索场景的特点
2. 实验科学和因果推断实践
3. 观测指标设计和业务分析
分享嘉宾|孙晓宇 京东零售 算法专家
编辑整理|徐俊章 上海海洋大学
出品社区|DataFun
01
1. 搜索订单归因


实验对象——Randomization Unit 实验变量——Treatment 实验效应——Metrics


敏感性:指标收敛能力,指标的 Test Power 与所需 Sample Size 预估,根据历史实验 case 进行 variance 估计,下图中给出了一个经典的预估公式; 解释性:指标是否可拆解、是否便于 AB 效果的分维度分析、是否直接反映到业务上,在电商搜索场景下,一个指标的解释性往往更加重要; 鲁棒性/稳定性:指标是否会误显著,需要关注指标的 AA 稳定性。


个体实验效应是指电商场景下某个单独的人或某件单独的商品的情况。 子群实验效应是指某个商品类目、某个用户群分层下的收益。 全局实验效应是指整个电商销售平台的大盘收益或者整体销售价值提升。
样本量小,反馈稀疏 方差大,难收敛 波动大,不稳定 混淆因子多,随机性差






观测指标设计与业务分析


幂率分布的幂指数
Top80% 搜索量覆盖的 query 个数/占比
搜索 Querv 熵指标


