(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210907526.2
(22)申请日 2022.07.29
(71)申请人 蚂蚁区块链科技 (上海) 有限公司
地址 200010 上海市黄浦区外马路618号8
层803室
(72)发明人 齐翔
(74)专利代理 机构 北京亿腾知识产权代理事务
所(普通合伙) 11309
专利代理师 孙欣欣 周良玉
(51)Int.Cl.
G06N 3/08(2006.01)
G06F 21/31(2013.01)
G06F 21/62(2013.01)
G06F 21/60(2013.01)
(54)发明名称
神经网络模型的训练方法和装置
(57)摘要
本说明书实施例提供一种神经网络模型的
训练方法、 利用神经网络模型进行预测的方法和
装置, 方法包括: 获取一个批次的训练样本; 针对
任一训练样 本, 在其初始特征数据上拼接预定格
式的补充数据, 得到扩展数据; 补充数据为从预
先设定的密钥数据和其他数据中随机选取的数
据; 密钥数据仅提供给授权用户, 用于进行用户
权限鉴别; 将 任一训练样本的扩展数据作为神经
网络模型的输入, 输出该训练样本的预测结果;
根据补充数据是否为密钥数据, 分别采用第一损
失函数或第二损失函数, 基于预测结果与 样本标
签, 确定训练样本的预测损失; 根据该批次的各
个训练样 本的预测损失, 对神经网络模型进行训
练。 未破坏神经网络模型的可 执行性。
权利要求书2页 说明书9页 附图3页
CN 115238890 A
2022.10.25
CN 115238890 A
1.一种神经网络模型的训练方法, 所述方法包括:
获取一个批次的训练样本, 每 个训练样本具有初始特 征数据和样本标签;
针对任一训练样本, 在其初始特征数据 上拼接预定格 式的补充数据, 得到扩展数据; 所
述补充数据为从预先设定的密钥数据和其他数据中随机选取的数据; 所述密钥数据仅提供
给授权用户, 用于进行用户权限鉴别;
将任一训练样本的所述扩展数据作为所述神经网络模型的输入, 通过所述神经网络模
型输出该训练样本的预测结果;
根据任一训练样本的所述补充数据 是否为所述密钥数据, 分别采用第 一损失函数或第
二损失函数, 基于所述预测结果与所述样本标签, 确定该训练样本的预测损失;
根据该批次的各个训练样本的预测损失, 对所述神经网络模型进行训练。
2.如权利要求1所述的方法, 其中, 所述第一损 失函数使得, 所述预测结果与所述样本
标签越接近, 预测损失越小; 所述第二损失函数使得, 所述预测结果与所述样本标签越接
近, 预测损失越大。
3.如权利要求2所述的方法, 其中, 所述第 一损失函数乘以第 一数值得到所述第 二损失
函数; 所述第一数值 为负数。
4.如权利要求1所述的方法, 其中, 所述初始特征数据为第一数目维的向量, 所述补充
数据为第二数目维的向量, 所述第一数目和所述第二数目的比值 为预设比例。
5.如权利要求 4所述的方法, 其中, 所述预设比例为1比1。
6.如权利要求1所述的方法, 其中, 所述密钥数据为密钥集合, 所述密钥集合中包含1个
或K个密钥。
7.如权利要求6所述的方法, 其中, 所述密钥集 合具有K个密钥;
所述批次的训练样本至少包括K个目标样本, 所述K个目标样本对应的补充数据, 分别
为所述K个密钥。
8.如权利要求3所述的方法, 其中, 所述第一数值 为‑1。
9.如权利要求2所述的方法, 其中, 所述第一损 失函数乘以第一数值, 再与预设常数进
行取小运算, 得到所述第二损失函数; 所述第一数值 为负数。
10.一种利用神经网络模型进行预测的方法, 所述神经网络模型通过权利要求1所述的
方法训练得到, 所述方法包括:
获取目标样本的扩展特征数据, 所述扩展特征数据通过在目标样本的初始特征数据 上
拼接预定格式的补充数据而形成; 所述补充数据选 自预先设定的密钥数据或者其他数据;
所述密钥数据仅授权用户持有;
将所述扩展特征数据作为所述神经网络模型的输入, 通过所述神经网络模型输出所述
目标样本的预测结果。
11.一种神经网络模型的训练装置, 所述装置包括:
获取单元, 用于获取一个批次的训练样本, 每个训练样本具有初始特征数据和样本标
签;
拼接单元, 用于针对所述获取单元获取的任一训练样本, 在其初始特征数据上拼接预
定格式的补充数据, 得到扩展数据; 所述补充数据为从预先设定的密钥数据和其他数据中
随机选取的数据; 所述密钥数据仅提供 给授权用户, 用于进行用户权限鉴别;权 利 要 求 书 1/2 页
2
CN 115238890 A
2预测单元, 用于将所述拼接单元得到的任一训练样本的所述扩展数据作为所述神经网
络模型的输入, 通过 所述神经网络模型输出 该训练样本的预测结果;
确定单元, 用于根据任一训练样本的所述补充数据是否为所述密钥数据, 分别采用第
一损失函数或第二损失函数, 基于所述预测单元得到的预测结果与所述 获取单元获取的样
本标签, 确定该训练样本的预测损失;
训练单元, 用于根据所述确定单元得到的该批次的各个训练样本的预测损 失, 对所述
神经网络模型进行训练。
12.如权利要求11所述的装置, 其中, 所述第一损 失函数使得, 所述预测结果与所述样
本标签越接近, 预测损失越小; 所述第二损失函数使 得, 所述预测结果与所述样本标签越接
近, 预测损失越大。
13.如权利要求12所述的装置, 其中, 所述第 一损失函数乘以第 一数值得到所述第 二损
失函数; 所述第一数值 为负数。
14.如权利要求11所述的装置, 其中, 所述初始特征数据为第一数目维的向量, 所述补
充数据为第二数目维的向量, 所述第一数目和所述第二数目的比值 为预设比例。
15.如权利要求14所述的装置, 其中, 所述预设比例为1比1。
16.如权利要求11所述的装置, 其中, 所述密钥数据为密钥集合, 所述密钥集合中包含1
个或K个密钥。
17.如权利要求16所述的装置, 其中, 所述密钥集 合具有K个密钥;
所述批次的训练样本至少包括K个目标样本, 所述K个目标样本对应的补充数据, 分别
为所述K个密钥。
18.如权利要求13所述的装置, 其中, 所述第一数值 为‑1。
19.如权利要求12所述的装置, 其中, 所述第一损 失函数乘以第一数值, 再与预设常数
进行取小运算, 得到所述第二损失函数; 所述第一数值 为负数。
20.一种利用神经网络模型进行预测的装置, 所述神经网络模型通过权利要求11所述
的装置训练得到, 所述装置包括:
获取单元, 用于获取目标样本的扩展特征数据, 所述扩展特征数据通过在目标样本的
初始特征数据上拼接预定格式的补充 数据而形成; 所述补充 数据选自预先设定的密钥数据
或者其他数据; 所述密钥数据仅授权用户持有;
预测单元, 用于将所述获取单元获取的扩展特征数据作为所述神经网络模型的输入,
通过所述神经网络模型输出 所述目标样本的预测结果。
21.一种计算机可读存储介质, 其上存储有计算机程序, 当所述计算机程序在计算机中
执行时, 令计算机执 行权利要求1 ‑10中任一项的所述的方法。
22.一种计算设备, 包括存储器和 处理器, 所述存储器中存储有可执行代码, 所述处理
器执行所述可执行代码时, 实现权利要求1 ‑10中任一项的所述的方法。权 利 要 求 书 2/2 页
3
CN 115238890 A
3
专利 神经网络模型的训练方法和装置
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:34:45上传分享