专利 神经网络模型的训练方法和装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210907526.2 (22)申请日 2022.07.29 (71)申请人蚂蚁区块链科技（上海）有限公司地址 200010 上海市黄浦区外马路618号8 层803室 (72)发明人齐翔　 (74)专利代理机构北京亿腾知识产权代理事务所(普通合伙) 11309 专利代理师孙欣欣　周良玉 (51)Int.Cl. G06N 3/08(2006.01) G06F 21/31(2013.01) G06F 21/62(2013.01) G06F 21/60(2013.01) (54)发明名称神经网络模型的训练方法和装置 (57)摘要本说明书实施例提供一种神经网络模型的训练方法、利用神经网络模型进行预测的方法和装置，方法包括：获取一个批次的训练样本；针对任一训练样本，在其初始特征数据上拼接预定格式的补充数据，得到扩展数据；补充数据为从预先设定的密钥数据和其他数据中随机选取的数据；密钥数据仅提供给授权用户，用于进行用户权限鉴别；将任一训练样本的扩展数据作为神经网络模型的输入，输出该训练样本的预测结果；根据补充数据是否为密钥数据，分别采用第一损失函数或第二损失函数，基于预测结果与样本标签，确定训练样本的预测损失；根据该批次的各个训练样本的预测损失，对神经网络模型进行训练。未破坏神经网络模型的可执行性。权利要求书2页说明书9页附图3页 CN 115238890 A 2022.10.25 CN 115238890 A 1.一种神经网络模型的训练方法，所述方法包括：获取一个批次的训练样本，每个训练样本具有初始特征数据和样本标签；针对任一训练样本，在其初始特征数据上拼接预定格式的补充数据，得到扩展数据；所述补充数据为从预先设定的密钥数据和其他数据中随机选取的数据；所述密钥数据仅提供给授权用户，用于进行用户权限鉴别；将任一训练样本的所述扩展数据作为所述神经网络模型的输入，通过所述神经网络模型输出该训练样本的预测结果；根据任一训练样本的所述补充数据是否为所述密钥数据，分别采用第一损失函数或第二损失函数，基于所述预测结果与所述样本标签，确定该训练样本的预测损失；根据该批次的各个训练样本的预测损失，对所述神经网络模型进行训练。 2.如权利要求1所述的方法，其中，所述第一损失函数使得，所述预测结果与所述样本标签越接近，预测损失越小；所述第二损失函数使得，所述预测结果与所述样本标签越接近，预测损失越大。 3.如权利要求2所述的方法，其中，所述第一损失函数乘以第一数值得到所述第二损失函数；所述第一数值为负数。 4.如权利要求1所述的方法，其中，所述初始特征数据为第一数目维的向量，所述补充数据为第二数目维的向量，所述第一数目和所述第二数目的比值为预设比例。 5.如权利要求 4所述的方法，其中，所述预设比例为1比1。 6.如权利要求1所述的方法，其中，所述密钥数据为密钥集合，所述密钥集合中包含1个或K个密钥。 7.如权利要求6所述的方法，其中，所述密钥集合具有K个密钥；所述批次的训练样本至少包括K个目标样本，所述K个目标样本对应的补充数据，分别为所述K个密钥。 8.如权利要求3所述的方法，其中，所述第一数值为‑1。 9.如权利要求2所述的方法，其中，所述第一损失函数乘以第一数值，再与预设常数进行取小运算，得到所述第二损失函数；所述第一数值为负数。 10.一种利用神经网络模型进行预测的方法，所述神经网络模型通过权利要求1所述的方法训练得到，所述方法包括：获取目标样本的扩展特征数据，所述扩展特征数据通过在目标样本的初始特征数据上拼接预定格式的补充数据而形成；所述补充数据选自预先设定的密钥数据或者其他数据；所述密钥数据仅授权用户持有；将所述扩展特征数据作为所述神经网络模型的输入，通过所述神经网络模型输出所述目标样本的预测结果。 11.一种神经网络模型的训练装置，所述装置包括：获取单元，用于获取一个批次的训练样本，每个训练样本具有初始特征数据和样本标签；拼接单元，用于针对所述获取单元获取的任一训练样本，在其初始特征数据上拼接预定格式的补充数据，得到扩展数据；所述补充数据为从预先设定的密钥数据和其他数据中随机选取的数据；所述密钥数据仅提供给授权用户，用于进行用户权限鉴别；权　利　要　求　书 1/2 页 2 CN 115238890 A 2预测单元，用于将所述拼接单元得到的任一训练样本的所述扩展数据作为所述神经网络模型的输入，通过所述神经网络模型输出该训练样本的预测结果；确定单元，用于根据任一训练样本的所述补充数据是否为所述密钥数据，分别采用第一损失函数或第二损失函数，基于所述预测单元得到的预测结果与所述获取单元获取的样本标签，确定该训练样本的预测损失；训练单元，用于根据所述确定单元得到的该批次的各个训练样本的预测损失，对所述神经网络模型进行训练。 12.如权利要求11所述的装置，其中，所述第一损失函数使得，所述预测结果与所述样本标签越接近，预测损失越小；所述第二损失函数使得，所述预测结果与所述样本标签越接近，预测损失越大。 13.如权利要求12所述的装置，其中，所述第一损失函数乘以第一数值得到所述第二损失函数；所述第一数值为负数。 14.如权利要求11所述的装置，其中，所述初始特征数据为第一数目维的向量，所述补充数据为第二数目维的向量，所述第一数目和所述第二数目的比值为预设比例。 15.如权利要求14所述的装置，其中，所述预设比例为1比1。 16.如权利要求11所述的装置，其中，所述密钥数据为密钥集合，所述密钥集合中包含1 个或K个密钥。 17.如权利要求16所述的装置，其中，所述密钥集合具有K个密钥；所述批次的训练样本至少包括K个目标样本，所述K个目标样本对应的补充数据，分别为所述K个密钥。 18.如权利要求13所述的装置，其中，所述第一数值为‑1。 19.如权利要求12所述的装置，其中，所述第一损失函数乘以第一数值，再与预设常数进行取小运算，得到所述第二损失函数；所述第一数值为负数。 20.一种利用神经网络模型进行预测的装置，所述神经网络模型通过权利要求11所述的装置训练得到，所述装置包括：获取单元，用于获取目标样本的扩展特征数据，所述扩展特征数据通过在目标样本的初始特征数据上拼接预定格式的补充数据而形成；所述补充数据选自预先设定的密钥数据或者其他数据；所述密钥数据仅授权用户持有；预测单元，用于将所述获取单元获取的扩展特征数据作为所述神经网络模型的输入，通过所述神经网络模型输出所述目标样本的预测结果。 21.一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1 ‑10中任一项的所述的方法。 22.一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1 ‑10中任一项的所述的方法。权　利　要　求　书 2/2 页 3 CN 115238890 A 3

专利 神经网络模型的训练方法和装置

专利神经网络模型的训练方法和装置