(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210159291.3
(22)申请日 2022.02.21
(71)申请人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号
百度大厦2层
(72)发明人 雷泽阳 徐新超 吴文权 牛正雨
(74)专利代理 机构 中科专利商标代理有限责任
公司 11021
专利代理师 吕朝蕙
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 40/30(2020.01)
G06F 40/289(2020.01)
G06F 40/242(2020.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
信息生成模型的训练方法、 生成信息的方
法、 装置和设备
(57)摘要
本公开提供了一种信息生成模型的训练方
法、 生成信息的方法、 装置、 电子设备和存储介
质, 涉及人工智 能领域, 具体涉及自然语言处理
领域和深度学习领域, 可应用于生成推荐信息等
场景下。 信息生成模型的训练方法的具体实现方
案为: 将信息对中针对目标对象的描述信息拆分
为至少一个描 述词, 得到描 述词序列; 其中, 信息
对还包括第一推荐信息; 将描述词序列输入对话
生成模型, 得到针对目标对象的概率向量序列,
该概率向量序列中的每个概率向量包括针对多
个预定词的概率值; 以及根据概率向量序列和第
一推荐信息, 训练对话生成模型, 得到信息生成
模型。
权利要求书4页 说明书13页 附图6页
CN 114547266 A
2022.05.27
CN 114547266 A
1.一种信息生成模型的训练方法, 包括:
将信息对中针对目标对象的描述信 息拆分为至少一个描述词, 得到描述词序列; 其中,
所述信息对 还包括第一推荐信息;
将所述描述词序列输入对话生成模型, 得到针对所述目标对象的概率向量序列; 所述
概率向量序列中的每 个概率向量包括针对多个预定词的概 率值; 以及
根据所述概率向量序列和所述第一推荐信息, 训练所述对话生成模型, 得到所述信息
生成模型。
2.根据权利要求1所述的方法, 还 包括:
将针对所述目标对象的提 示信息拆分为至少一个提 示词, 得到提 示词序列;
其中, 所述将所述描述词序列输入对话生成模型, 得到针对所述目标对象的概率向量
序列包括: 将所述描述词序列和所述提示词序列输入所述对话生成模型, 得到概率向量序
列。
3.根据权利要求2所述的方法, 其中, 所述概率向量序列指示针对所述目标对象的第 二
推荐信息; 所述方法还 包括:
根据所述 概率向量序列, 确定所述第二推荐信息包括所述 提示信息的预测概 率;
根据所述预测概 率确定所述对话 生成模型的第一损失值; 以及
根据所述第一损失值训练所述对话 生成模型。
4.根据权利要求3所述的方法, 其中, 所述根据所述概率向量序列, 确定所述第二推荐
信息包括所述 提示信息的预测概 率包括:
根据所述概率向量序列中针对所述提示词序列中每个提示词的概率值, 确定所述第 二
推荐信息包括所述每 个提示词的概 率; 以及
根据所述第 二推荐信 息包括所述至少一个提示词的至少一个概率, 确定所述第 二推荐
信息包括所述 提示信息的预测概 率。
5.根据权利要求1~4中任一项所述的方法, 其中, 所述概率向量序列指示针对所述目
标对象的第二推荐信息; 所述方法还 包括:
根据所述第 二推荐信 息与所述描述信 息之间的关联关系, 确定所述对话生成模型的第
二损失值; 以及
根据所述第二损失值训练所述对话 生成模型。
6.根据权利要求5所述的方法, 其中, 所述对话生成模型包括带离散隐变量的预训练对
话生成模型; 所述将所述描述词序列输入对话生成模型, 得到针对所述 目标对象的概率向
量序列包括:
将随机标识信 息和所述描述词序列输入所述对话生成模型, 得到与 所述随机标识信 息
对应的关联 预测值及概 率向量序列,
其中, 所述关联 预测值指示所述第二推荐信息与所述描述信息之间的关联关系。
7.根据权利要求1所述的方法, 还 包括:
根据所述 概率向量序列确定针对所述目标对象的第二推荐信息;
响应于所述第 二推荐信 息中存在重复的词, 根据重复的词在所述第 二推荐信 息中的位
置信息, 确定所述 概率向量序列中与重复的词对应的概 率向量, 作为目标概 率向量;
根据所述目标概 率向量和重复的词, 确定所述对话 生成模型的第三损失值; 以及权 利 要 求 书 1/4 页
2
CN 114547266 A
2根据所述第三损失值训练所述对话 生成模型。
8.根据权利要求1所述的方法, 还 包括:
将所述第一推荐信息拆分为至少一个 推荐词, 得到推荐词序列;
响应于所述推荐词序列中存在重复的词, 根据重复的词在所述推荐词序列中的位置信
息, 确定所述 概率向量序列中与重复的词对应的概 率向量, 作为目标概 率向量;
根据所述目标概 率向量和重复的词, 确定所述对话 生成模型的第三损失值; 以及
根据所述第三损失值训练所述对话 生成模型。
9.一种生成信息的方法, 包括:
将待推荐对象的描述信息拆分为至少一个描述词, 得到描述词序列;
将所述描述词序列输入信息生成模型, 得到针对所述待推荐对象的概率向量序列; 所
述概率向量序列中的每 个概率向量包括针对多个预定词的概 率值; 以及
根据所述 概率向量序列, 确定针对所述待推荐对象的推荐信息,
其中, 所述信息生成模型 是采用权利要求1~8中任一项所述的方法训练的。
10.根据权利要求9所述的方法, 还 包括:
将针对所述待推荐对象的提 示信息拆分为至少一个提 示词, 得到提 示词序列;
其中, 所述将所述描述词序列输入信息生成模型, 得到针对所述待推荐对象的概率向
量序列包括: 将所述描述词序列和所述提示词序列输入所述对话生成模型, 得到所述概率
向量序列。
11.根据权利要求9或10所述的方法, 其中, 所述对话生成模型包括带离散隐变量的预
训练对话生成模型; 所述将所述描述词序列输入信息生成模型, 得到针对所述待推荐对 象
的概率向量序列包括:
将随机标识信 息和所述描述词序列输入所述对话生成模型, 得到与 所述随机标识信 息
对应的关联值及所述 概率向量序列,
其中, 所述关联值指示所述推荐信息与所述描述信息之间的关联关系。
12.一种信息生成模型的训练装置, 包括:
第一拆分模块, 用于将信息对中针对目标对象的描述信息拆分为至少一个描述词, 得
到描述词序列; 其中, 所述信息对 还包括第一推荐信息;
序列获得模块, 用于将所述描述词序列输入对话生成模型, 得到针对所述目标对象的
概率向量序列; 所述 概率向量序列中的每 个概率向量包括针对多个预定词的概 率值; 以及
训练模块, 用于根据 所述概率向量序列和所述第 一推荐信 息, 训练所述对话生成模型,
得到所述信息生成模型。
13.根据权利要求12所述的装置, 还 包括:
第二拆分模块, 用于将针对所述目标对象的提示信息拆分为至少一个提示词, 得到提
示词序列;
其中, 所述序列获得模块用于: 将所述描述词序列和所述提示词序列输入所述对话生
成模型, 得到概 率向量序列。
14.根据权利要求13所述的装置, 其中, 所述概率向量序列指示针对所述目标对象的第
二推荐信息; 所述装置还 包括:
概率确定模块, 用于根据所述概率向量序列, 确定所述第二推荐信息包括所述提示信权 利 要 求 书 2/4 页
3
CN 114547266 A
3
专利 信息生成模型的训练方法、生成信息的方法、装置和设备
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:31上传分享