说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111332244.6 (22)申请日 2021.11.11 (71)申请人 重庆邮电大 学 地址 400065 重庆市南岸区南 山街道崇文 路2号 (72)发明人 余海燕 刘珂 缪红霞  (74)专利代理 机构 重庆辉腾律师事务所 5 0215 代理人 王海军 (51)Int.Cl. G06Q 30/02(2012.01) G06N 20/00(2019.01) G06K 9/62(2022.01) G06Q 30/08(2012.01) G06Q 40/02(2012.01) G06Q 40/04(2012.01) (54)发明名称 基于夏普利值的数据特征 组合定价方法、 系 统及电子设备 (57)摘要 本发明涉及机器学习, 具体而言是一种基于 夏普利值的数据特征组合定价方法、 系统及电子 设备, 所述方法包括收集卖 方提供的特征数据集 的特征变量并对其进行预处理; 构建基于机器学 习的学习模 型, 从特征分类个变量中选择最优的 特征分类个变量; 基于幽灵数据实例构造的特征 夏普利值估计, 以此计算选择的特征变量的边际 贡献和平均夏普利值; 根据特征变量的边际贡献 和平均夏普利值判断特征变量是否能够进行交 易, 若能够进行交易则; 本发明实施, 可以提高数 据提供方的长期收益最大化, 也满足数据买方对 数据买方公司的风险评估, 减少风险损失。 权利要求书2页 说明书10页 附图6页 CN 113919886 A 2022.01.11 CN 113919886 A 1.一种基于夏普利值的数据特 征组合定价方法, 其特 征在于, 具体包括以下步骤: 收集卖方提供的特 征数据集的特 征变量并对其进行 预处理; 构建基于 机器学习的学习模型, 从特 征分类变量中选择最优的特 征分类变量; 在选择最优变量时, 基于幽灵数据实例构造的特征夏普利值估计, 以此计算选择的特 征变量的边际贡献和平均夏普利值; 并选择最优变量 时使用夏普利值对于各个特征的价值按照 其边际贡献进行分配, 量化 不同输入特 征对训练模型输出 预测结果的影响并将符合设置家边际贡献的特 征保留; 检测数据是否能够用于机器学习和 交易, 如果能够进行及机器学习和 交易, 则数据买 方和卖方构建交易, 并通过构建的学习模型获取当前 数据的预测值作为数据的支付 价格。 2.根据权利要求1所述的一种基于夏普利值的数据 特征组合定价方法, 其特征在于, 从 特征分类个变量中选择最优的特 征分类个变量的过程包括以下步骤: 使用所有特 征分变量数据对基于 机器学习的学习模型进行训练; 对特征变量的重要性进行排序, 选取重要性 值最大的前k个特 征; 用验证集评估 模型, 重新计算每 个特征变量的重要性并进行排序; 把训练集拆分成新训练集与新验证集, 采用新训练集和所有特征变量训练模型, 使用 验证集评估 模型, 计算所有的特 征变量重要性并进行排序。 3.根据权利要求1所述的一种基于夏普利值的数据 特征组合定价方法, 其特征在于, 基 于幽灵数据实例构 造的特征变量的夏普利值估计包括从特征变量中随机抽取一个实例, 并 构造一个含有某一特征的实例和一个不含前述特征的实例, 并将这两个实例作为幽灵数据 实例。 4.根据权利要求1所述的一种基于夏普利值的数据 特征组合定价方法, 其特征在于, 特 征变量的边际贡献表示 为: 其中, 为第m次迭代过程中实例x中第j个 特征的边界贡献值; 为实例x在第m次 迭代中使用带有特征j的实例实现的预测, 为第m次迭代时实例x中第j个特征以后的特 征被实例z中特征进行随机替换后的特征向量; 为实例x在第m次迭代中使用不带特 征j的实例实现的预测, 为第m次迭代时实例x中第j个特征以及第j个特征以后的特征被 实例z中特 征进行随机替换后的特 征向量。 5.根据权利要求1所述的一种基于夏普利值的数据 特征组合定价方法, 其特征在于, 对 该特征变量进行定价的过程包括以下步骤: S41、 与数据买方交易之前, 数据卖方先设置交易数据的价格pn, 买方个数 以及买方报 价, 并计算数据买方的收益 函数; S42、 根据买方的收益函数计算数据买方的最终支付; 数据买方支付费用, 将选择的特 征变量进行交易; S43、 基于乘权更新 算法卖方 更新数据价格, 返回到S41, 开始下一轮定价。 6.根据权利要求1所述的基于夏普利值的数据 特征组合定价方法, 其特征在于, 数据买权 利 要 求 书 1/2 页 2 CN 113919886 A 2方支付费用Rn表示为: 其中, G(bn,pn)为卖方设置交易数据的价格为pn且买方报价 为bn时买方的收益 函数。 7.根据权利要求6所述的基于夏普利值的数据 特征组合定价方法, 其特征在于, 卖方的 收益函数根据卖方设置交易数据的价格以及买方的报价进 行确定, 在 卖方价格固定的情况 下, 当报价bn小于卖方设置交易数据的价格pn时, 随着报价bn增大买方的收益增大, 直到报 价bn等于卖方设置交易数据的价格pn时达到最大收益; 当报价bn大于卖方设置交易数据的 价格pn时, 买方效用保持最大值 不变且买方支付费用也维持最大值 不变。 8.根据权利要求5所述的基于夏普利值的数据 特征组合定价方法, 其特征在于, 每次确 定定价S后, 同一数据卖给多个用户时, 根据数据复制价格对 数据进行定价, 若 数据复制为i 个样本, 则每 个样本的售价Sn为: 其中, S为只有一份数据时的售价, e为 惩罚因子 。 9.基于夏普利值的数据特征组合定价系统, 其特征在于, 包括特征选择子系统和定价 子系统, 特 征选择子系统对特 征进行筛 选, 定价子系统对筛 选得到的特 征进行定价拍卖; 特征子系统中包括机器学习 模型和夏普利分析模型, 机器学习 模型根据 数据进行训练 预测, 将预测得到的值作为特征的重要性进 行排序, 并将 重要性最大的K个特征送入夏普利 分析模型进行分析; 夏普利分析模型计算特 征变量的编辑贡献和平均夏普利值; 定价子系统中数据买方根据数据卖方的定价。 10.基于夏普利值的数据特征组合定价电子设备, 包括处理器和存储器, 其特征在于, 所述存储器存储有权利要求 1~8所述的任一一种根据权利要求 1所述的基于夏普利值的数 据特征组合定价方法, 并且处理器能够运行存储器中存储的基于夏普利值的数据特征组合 定价方法。权 利 要 求 书 2/2 页 3 CN 113919886 A 3

.PDF文档 专利 基于夏普利值的数据特征组合定价方法、系统及电子设备

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于夏普利值的数据特征组合定价方法、系统及电子设备 第 1 页 专利 基于夏普利值的数据特征组合定价方法、系统及电子设备 第 2 页 专利 基于夏普利值的数据特征组合定价方法、系统及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:01:44上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。