(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210143365.4
(22)申请日 2022.02.16
(71)申请人 北京三快在线科技有限公司
地址 100080 北京市海淀区北四环西路9号
2106-030
(72)发明人 薛涛锋 李悦 陶然 郭圣昱
张凯 杨一帆
(74)专利代理 机构 北京润泽恒知识产权代理有
限公司 1 1319
专利代理师 姜影
(51)Int.Cl.
G06F 16/9532(2019.01)
G06F 16/9535(2019.01)
G06F 16/335(2019.01)
G06F 16/35(2019.01)G06F 40/205(2020.01)
G06F 40/242(2020.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)
(54)发明名称
模型训练、 排序方法、 装置、 电子 设备及存储
介质
(57)摘要
本公开实施例提供了一种模 型训练、 排序方
法、 装置、 电子设备及存储介质。 模型训练方法包
括: 获取样本数据, 样本数据包括样本对象对应
的样本搜索信息和样本关键词; 在预设的待训练
模型中, 对样本关键词和样本搜索信息进行特征
融合, 得到样本关键词的综合语义表征向量, 基
于综合语义表征向量获取样本对象的样本排序
参数; 将基于样本排序参数确定训练完成的模型
作为排序模型。 本公开实施例中, 将对象的关键
词信息融入到排序模型中, 这些关键词是针对对
象的非结构化特征挖掘出来的, 能够更好地覆盖
和刻画用户的意图, 因此融入关键词信息的排序
模型能够捕捉关键词本身的语义 以及关键词和
用户搜索信息之间的语义相关性, 从而提高排序
模型的准确性。
权利要求书3页 说明书19页 附图6页
CN 114595370 A
2022.06.07
CN 114595370 A
1.一种模型训练方法, 其特 征在于, 包括:
获取样本数据; 所述样本数据包括样本对象对应的样本 搜索信息和样本关键词;
在预设的待训练模型中, 对所述样本关键词和所述样本搜索信息进行特征融合, 得到
所述样本关键词的综合语义表征向量, 基于所述综合语义表征向量 获取所述样本对象的样
本排序参数;
将基于所述样本排序参数确定训练完成的模型作为 排序模型。
2.根据权利要求1所述的方法, 其特征在于, 对所述样本关键词和所述样本搜索信 息进
行特征融合, 包括:
针对每个样本关键词, 对当前样本关键词与其他样本关键词进行特征融合, 得到当前
样本关键词的融合语义表征向量;
针对每个样本关键词, 对当前样本关键词与所述样本搜索信息进行特征融合, 得到当
前样本关键词与样本 搜索信息之间的相关度;
基于各样本关键词的融合语义表征向量和相关度, 计算所述样本关键词的综合语义表
征向量。
3.根据权利要求1所述的方法, 其特征在于, 对所述样本关键词和所述样本搜索信 息进
行特征融合, 包括:
从预设的词与 特征向量的对应关系中, 查询各样本关键词的特征向量和所述样本搜索
信息的特 征向量;
针对每个样本关键词, 对当前样本关键词的特征向量与其他样本关键词的特征向量进
行特征融合, 得到当前样本关键词的融合语义表征向量;
针对每个样本关键词, 对当前样本关键词的融合语义表征向量与所述样本搜索信 息的
特征向量进行 特征融合, 得到当前样本关键词与所述样本 搜索信息之间的相关度;
基于各样本关键词的融合语义表征向量和相关度, 以及所述样本搜索信息的特征向
量, 计算所述样本关键词的综合语义表征向量。
4.根据权利要求3所述的方法, 其特征在于, 对当前样本关键词的特征向量与其他样本
关键词的特 征向量进行 特征融合, 包括:
通过自注意力机制对当前样本关键词的特征向量与其他样本关键词的特征向量进行
特征融合, 得到当前样本关键词的融合语义表征向量。
5.根据权利要求3所述的方法, 其特征在于, 所述样本数据还包括所述样本关键词的置
信度; 对当前样本关键词的特 征向量与其 他样本关键词的特 征向量进行 特征融合, 包括:
通过自注意力机制对当前样本关键词的特征向量与其他样本关键词的特征向量进行
特征融合, 得到当前样本关键词的初步融合语义表征向量;
按照所述置信度对所述样本关键词进行降序排序, 基于排序结果获取各样本关键词的
位置嵌入向量;
将当前样本关键词的初步融合语义表征向量和位置嵌入向量相加, 得到当前样本关键
词的融合语义表征向量。
6.根据权利要求3所述的方法, 其特征在于, 所述样本数据还包括所述样本关键词的置
信度; 对当前样本 关键词的融合语义表征向量与所述样本搜索信息的特征向量进 行特征融
合, 包括:权 利 要 求 书 1/3 页
2
CN 114595370 A
2计算当前样本关键词的置信度与所述搜索信息的相关度权 重;
基于当前样本关键词的融合语义表征向量, 所述样本搜索信息的特征向量, 以及当前
样本关键词的相关度权 重, 计算当前样本关键词的中间参数;
基于所述中间参数和预设的温度参数, 计算当前样本关键词与 所述样本搜索信 息之间
的相关度。
7.根据权利要求3所述的方法, 其特征在于, 基于各样本关键词的融合语义表征向量和
相关度, 以及所述样本搜索信息的特征向量, 计算所述样 本关键词的综合语义表征向量, 包
括:
计算各样本关键词的融合语义表征向量和相关度的乘积的总和, 得到所述样本关键词
的初步语义表征向量;
将所述初步语义表征向量与 所述样本搜索信 息的特征向量相加, 得到所述样本关键词
的初步综合语义表征向量;
对所述初步综合语义表征向量进行标准化处理, 得到所述样本关键词的综合语义表征
向量。
8.根据权利要求7 所述的方法, 其特 征在于,
在计算各样本关键词的融合语义表征向量和相关度的乘积的总和, 得到所述样本关键
词的初步语义表征向量之后, 还 包括: 对所述初步语义表征向量进行随机 丢弃处理;
将所述初步语义表征向量与所述样本搜索信息的特征向量相加, 包括: 将随机丢弃处
理后的初步语义表征向量与所述样本 搜索信息的特 征向量相加。
9.根据权利要求1所述的方法, 其特征在于, 所述样本数据还包括所述样本对象对应的
样本描述信息; 基于所述综合语义表征向量获取 所述样本对象的样本排序参数, 包括:
对所述综合语义表征向量、 所述样本描述信息和所述样本搜索信息进行特征融合, 得
到所述样本对象的样本排序参数。
10.根据权利要求9所述的方法, 其特征在于, 对所述综合语义表征向量、 所述样本描述
信息和所述样本 搜索信息进行 特征融合, 包括:
对所述综合语义表征向量、 所述样本描述信息和所述样本搜索信息进行深层特征融
合, 得到所述样本对象的第一样本排序参数;
对所述综合语义表征向量、 所述样本描述信息和所述样本搜索信息进行浅层特征融
合, 得到所述样本对象的第二样本排序参数;
基于所述第 一样本排序参数和所述第 一样本排序参数, 计算所述样本对象的样本排序
参数。
11.根据权利要求10所述的方法, 其特征在于, 对所述综合语义表征向量、 所述样本描
述信息和所述样本 搜索信息进行深层特 征融合, 包括:
获取所述样本描述信息的特 征向量和所述样本 搜索信息的特 征向量;
基于所述综合语义表征向量、 所述样本描述信 息的特征向量和所述样本搜索信 息的特
征向量生成拼接特 征向量;
利用预设的深层融合网络对所述拼接特征向量进行特征融合处理, 得到所述第 一样本
排序参数。
12.根据权利要求10所述的方法, 其特征在于, 对所述综合语义表征向量、 所述样本描权 利 要 求 书 2/3 页
3
CN 114595370 A
3
专利 模型训练、排序方法、装置、电子设备及存储介质
文档预览
中文文档
29 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:34上传分享