专题实战 | 如何快速构建高质量电商行业搜索?
Posted 阿里云云栖号
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了专题实战 | 如何快速构建高质量电商行业搜索?相关的知识,希望对你有一定的参考价值。
简介:本文详细介绍如何快速接入智能开放搜索(OpenSearch)电商行业增强版,助力企业实现高质量搜索效果,提升业务转化率及用户产品体验!
电商搜索特点
1. 关键词堆砌
例如:明星同款夏季连衣裙包邮;
2. 词序对语义影响不大
例如:明星同款女夏季连衣裙包邮,女夏季连衣裙包邮明星同款;
3. 类目预测问题
例如:当用户查询“苹果”时,可能查询的是水果,也可能是手机品牌;
4.查询召回文档相关性差
核心词识别不准确,分词不准确;
5. 搜索引导的业务转化比重较大
据统计,综合类电商搜索引导转化占比40%以上,垂直类电商搜索引导转化占比60%以上;
6. 稳定性要求较高,支持弹性扩容
活动、大促系统QPS可能是平时的百倍千倍,需要平滑的扩缩容,保障系统的稳定;
开放搜索电商行业方案优势
- 基于淘系同款搜索引擎-问天(Ha3),提供更高性能的搜索服务,系统稳定高效,海量数据实时更新;
- 电商行业知识图谱能力,支持电商属性的分词、纠错、同义词、停用词、实体识别、词权重、类目预测等行业查询语义理解能力,精准定位用户搜索意图,提升业务转化,降低无结果率;
- 丰富的电商搜索服务经验,源自阿里巴巴内部搜索技术的云服务输出,集团内500+业务接入,阿里云电商客户服务数千家;
- 通过引擎侧的多路召回能力,支持搜索结果、下拉提示、底纹词等场景实现个性化搜索服务;
- 轻松接入,快速上手,一键式接入行业模板,可根据自身业务自定义选择功能,并满足非技术人员业务干预调优与数字化运营需求;
了解更多电商搜索能力:https://c.tb.cn/F3.0VTxwn
开放搜索电商增强版接入流程
注册阿里云账号(已有账号无需注册),并实名认证,创建好实例,如果是非本人使用,可以授权子账号权限,更多详情查看> 。
如果您已经对搜索有一定的了解或者是已经使用过开放搜索产品,则可以参考功能流程图以便更快速、更全面的了解开放搜索的能力。
表结构设计
接入开放搜索前,需要预先设计好表结构(可单表,可多表join),以便后期应对各种搜索业务场景和数据推送场景。目前开放搜索支持的多表场景如下:
主辅表关系 | 关联逻辑 | 是否支持 |
表A(主表)、表B | 表A(主表)-> 表B | 支持 |
表A(主表)、表B、表C | 表A(主表)-> 表B -> 表C | 支持 |
表A(主表)、表B、表C、表D | 表A(主表)-> 表B 表A(主表)-> 表C 表A(主表)-> 表D join层级不超过2层,辅表个数不超过10个 | 支持 |
表A(主表)、表B、表C、表D | 表A(主表)-> 表B -> 表C -> 表D 超过2层多表数据关联 | 不支持(独享型可支持3层) |
表A(主表)、表B | 表A->表B,表B->表A 环状多表数据关联 | 不支持 |
表A(主表)、表B、表C … 表K | 表A(主表)-> 表B 表A(主表)-> 表C .. 表A(主表)-> 表K join层级不超过2层,但辅表个数超过10个 | 不支持(独享型可扩展辅表个数) |
详情可参考应用结构--->创建多表join。
注意:
电商行业模板中以下字段是必须字段,类型、字段标签固定,字段名称可自定义:
数据接入
开放搜索支持用户通过数据源将数据接入搜索,也支持无数据源,通过API/SDK/控制台上传文件的方式导入数据详情如下:
电商行业模板配置
选择分析器
电商行业模板中以下索引标签、分析方式固定,索引名称可自定义:
开放搜索还向用户提供了面向其他行业、语言的分析器,如有相应业务需求,可参考内置分析器。
设置查询分析规则
查询分析模板请选择,系统默认勾选的分析包:
查询分析的详情内容可点击此处进行参考。
设置排序策略
电商行业模板会自动根据用户配置的应用结构中的字段、索引去生成适合该应用的基础排序和业务排序,详情如下:
基础排序:
0.6*static_bm25()+0.4*normalize(sales)
业务排序:
query_match_ratio(cate_id) * 1000 + floor( if(field_match_ratio(brand) == 1, 1, field_match_ratio(brand) * query_match_ratio(brand)) + if(text_relevance(product_title) + text_relevance(cate_id) + text_relevance(brand) == 0, -1, 0) ) * 1000 + (text_relevance(product_title, default, true) * 0.3 + text_relevance(cate_id) + text_relevance(brand) + 0.5) * (normalize(sales) + 0.3) * if(is_sale, 1, 0.9) * timeliness_ms(up_time)
开放搜索中的排序策略较为灵活,您可根据自己的业务需求进行修改或自定义,详情可参考排序表达式配置。
搜索引导服务
下拉提示模型配置
下拉提示是搜索服务的基础功能,在用户输入查询词的过程中,智能推荐候选query,提高用户输入效率,帮助用户尽快找到想要的内容。
热搜底纹模型配置
热搜和底纹是一个完整搜索引擎必备的基本功能,通常占据着搜索框入口的重要位置,提供不可或缺的业务价值。
本文为阿里云原创内容,未经允许不得转载。
以上是关于专题实战 | 如何快速构建高质量电商行业搜索?的主要内容,如果未能解决你的问题,请参考以下文章
基于MaxCompute+开放搜索的电商零售行业搜索开发实践