专利 信息生成模型的训练方法、生成信息的方法、装置和设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210159291.3 (22)申请日 2022.02.21 (71)申请人北京百度网讯科技有限公司地址 100085 北京市海淀区上地十街10号百度大厦2层 (72)发明人雷泽阳　徐新超　吴文权　牛正雨　 (74)专利代理机构中科专利商标代理有限责任公司 11021 专利代理师吕朝蕙 (51)Int.Cl. G06F 16/332(2019.01) G06F 40/30(2020.01) G06F 40/289(2020.01) G06F 40/242(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称信息生成模型的训练方法、生成信息的方法、装置和设备 (57)摘要本公开提供了一种信息生成模型的训练方法、生成信息的方法、装置、电子设备和存储介质，涉及人工智能领域，具体涉及自然语言处理领域和深度学习领域，可应用于生成推荐信息等场景下。信息生成模型的训练方法的具体实现方案为：将信息对中针对目标对象的描述信息拆分为至少一个描述词，得到描述词序列；其中，信息对还包括第一推荐信息；将描述词序列输入对话生成模型，得到针对目标对象的概率向量序列，该概率向量序列中的每个概率向量包括针对多个预定词的概率值；以及根据概率向量序列和第一推荐信息，训练对话生成模型，得到信息生成模型。权利要求书4页说明书13页附图6页 CN 114547266 A 2022.05.27 CN 114547266 A 1.一种信息生成模型的训练方法，包括：将信息对中针对目标对象的描述信息拆分为至少一个描述词，得到描述词序列；其中，所述信息对还包括第一推荐信息；将所述描述词序列输入对话生成模型，得到针对所述目标对象的概率向量序列；所述概率向量序列中的每个概率向量包括针对多个预定词的概率值；以及根据所述概率向量序列和所述第一推荐信息，训练所述对话生成模型，得到所述信息生成模型。 2.根据权利要求1所述的方法，还包括：将针对所述目标对象的提示信息拆分为至少一个提示词，得到提示词序列；其中，所述将所述描述词序列输入对话生成模型，得到针对所述目标对象的概率向量序列包括：将所述描述词序列和所述提示词序列输入所述对话生成模型，得到概率向量序列。 3.根据权利要求2所述的方法，其中，所述概率向量序列指示针对所述目标对象的第二推荐信息；所述方法还包括：根据所述概率向量序列，确定所述第二推荐信息包括所述提示信息的预测概率；根据所述预测概率确定所述对话生成模型的第一损失值；以及根据所述第一损失值训练所述对话生成模型。 4.根据权利要求3所述的方法，其中，所述根据所述概率向量序列，确定所述第二推荐信息包括所述提示信息的预测概率包括：根据所述概率向量序列中针对所述提示词序列中每个提示词的概率值，确定所述第二推荐信息包括所述每个提示词的概率；以及根据所述第二推荐信息包括所述至少一个提示词的至少一个概率，确定所述第二推荐信息包括所述提示信息的预测概率。 5.根据权利要求1～4中任一项所述的方法，其中，所述概率向量序列指示针对所述目标对象的第二推荐信息；所述方法还包括：根据所述第二推荐信息与所述描述信息之间的关联关系，确定所述对话生成模型的第二损失值；以及根据所述第二损失值训练所述对话生成模型。 6.根据权利要求5所述的方法，其中，所述对话生成模型包括带离散隐变量的预训练对话生成模型；所述将所述描述词序列输入对话生成模型，得到针对所述目标对象的概率向量序列包括：将随机标识信息和所述描述词序列输入所述对话生成模型，得到与所述随机标识信息对应的关联预测值及概率向量序列，其中，所述关联预测值指示所述第二推荐信息与所述描述信息之间的关联关系。 7.根据权利要求1所述的方法，还包括：根据所述概率向量序列确定针对所述目标对象的第二推荐信息；响应于所述第二推荐信息中存在重复的词，根据重复的词在所述第二推荐信息中的位置信息，确定所述概率向量序列中与重复的词对应的概率向量，作为目标概率向量；根据所述目标概率向量和重复的词，确定所述对话生成模型的第三损失值；以及权　利　要　求　书 1/4 页 2 CN 114547266 A 2根据所述第三损失值训练所述对话生成模型。 8.根据权利要求1所述的方法，还包括：将所述第一推荐信息拆分为至少一个推荐词，得到推荐词序列；响应于所述推荐词序列中存在重复的词，根据重复的词在所述推荐词序列中的位置信息，确定所述概率向量序列中与重复的词对应的概率向量，作为目标概率向量；根据所述目标概率向量和重复的词，确定所述对话生成模型的第三损失值；以及根据所述第三损失值训练所述对话生成模型。 9.一种生成信息的方法，包括：将待推荐对象的描述信息拆分为至少一个描述词，得到描述词序列；将所述描述词序列输入信息生成模型，得到针对所述待推荐对象的概率向量序列；所述概率向量序列中的每个概率向量包括针对多个预定词的概率值；以及根据所述概率向量序列，确定针对所述待推荐对象的推荐信息，其中，所述信息生成模型是采用权利要求1～8中任一项所述的方法训练的。 10.根据权利要求9所述的方法，还包括：将针对所述待推荐对象的提示信息拆分为至少一个提示词，得到提示词序列；其中，所述将所述描述词序列输入信息生成模型，得到针对所述待推荐对象的概率向量序列包括：将所述描述词序列和所述提示词序列输入所述对话生成模型，得到所述概率向量序列。 11.根据权利要求9或10所述的方法，其中，所述对话生成模型包括带离散隐变量的预训练对话生成模型；所述将所述描述词序列输入信息生成模型，得到针对所述待推荐对象的概率向量序列包括：将随机标识信息和所述描述词序列输入所述对话生成模型，得到与所述随机标识信息对应的关联值及所述概率向量序列，其中，所述关联值指示所述推荐信息与所述描述信息之间的关联关系。 12.一种信息生成模型的训练装置，包括：第一拆分模块，用于将信息对中针对目标对象的描述信息拆分为至少一个描述词，得到描述词序列；其中，所述信息对还包括第一推荐信息；序列获得模块，用于将所述描述词序列输入对话生成模型，得到针对所述目标对象的概率向量序列；所述概率向量序列中的每个概率向量包括针对多个预定词的概率值；以及训练模块，用于根据所述概率向量序列和所述第一推荐信息，训练所述对话生成模型，得到所述信息生成模型。 13.根据权利要求12所述的装置，还包括：第二拆分模块，用于将针对所述目标对象的提示信息拆分为至少一个提示词，得到提示词序列；其中，所述序列获得模块用于：将所述描述词序列和所述提示词序列输入所述对话生成模型，得到概率向量序列。 14.根据权利要求13所述的装置，其中，所述概率向量序列指示针对所述目标对象的第二推荐信息；所述装置还包括：概率确定模块，用于根据所述概率向量序列，确定所述第二推荐信息包括所述提示信权　利　要　求　书 2/4 页 3 CN 114547266 A 3

专利 信息生成模型的训练方法、生成信息的方法、装置和设备

专利信息生成模型的训练方法、生成信息的方法、装置和设备