说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111676222.1 (22)申请日 2021.12.31 (66)本国优先权数据 202110154406.5 2021.02.04 CN (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 容汉铿 曾凡 聂利权  (74)专利代理 机构 深圳市深佳知识产权代理事 务所(普通 合伙) 44285 专利代理师 陈松浩 (51)Int.Cl. G06Q 30/06(2012.01) G06Q 50/06(2012.01) G06N 20/00(2019.01) (54)发明名称 一种资源消耗异常对象的识别方法以及相 关装置 (57)摘要 本申请公开了一种资源消耗异常对象的识 别方法以及相关装置, 应用于人工智 能领域。 通 过获取未标记样本和正样本; 然后确定目标特征 维度; 并将未标记样本和正样 本输入半监督学习 框架对分类模 型进行迭代训练; 获取分类模型在 迭代训练过程中输出的未标记样本对应的多个 识别特征值确定资源消耗异常对象。 从而实现少 量正样本下资源消耗异常对象的识别过程, 由于 在训练过程中不断的启发式地挖掘未标记样本 中的正样 本进行补充, 并将其加入到下一轮的迭 代中, 有效地解决了识别场景中样 本不均衡的问 题, 提高了资源消耗异常对象识别的准确性。 权利要求书3页 说明书19页 附图7页 CN 114862488 A 2022.08.05 CN 114862488 A 1.一种资源消耗异常的识别方法, 其特 征在于, 包括: 获取目标对象集合的资源使用数据作为未标记样本, 并调用已核实为资源消耗异常对 象对应的资源使用数据作为 正样本, 所述 正样本的数量小于所述未 标记样本的数量; 基于至少一个特征项对所述正样本进行特征提取, 以得到目标特征维度, 所述特征项 基于预设时间粒度下 所述资源消耗异常对象的资源使用特 征设定; 将所述未标记样本和所述正样本输入半监督学习框架, 以基于所述目标特征维度对所 述半监督学习框架中的分类模型进行迭代训练, 所述迭代训练过程中符合预设条件的未标 记样本会被标记为补充样本, 所述补充样本用于对所述 正样本进行 更新; 获取所述分类模型在所述迭代训练过程中输出的所述未标记样本对应的多个识别特 征值, 并基于所述识别特 征值进行融合, 以确定所述目标对象集 合中的资源消耗异常对象。 2.根据权利要求1所述的方法, 其特征在于, 所述获取目标对象集合的资源使用数据作 为未标记样本, 包括: 确定数据统计范围内所述目标对象集 合对应的候选数据; 基于所述预设时间粒度对所述 候选数据进行划分, 以得到粒度数据; 统计所述粒度数据中的资源特 征项, 以得到所述目标对象集 合对应的资源使用数据; 对所述资源使用数据进行 预处理, 以得到所述未 标记样本 。 3.根据权利要求2所述的方法, 其特征在于, 所述对所述资源使用数据进行预处理, 以 得到所述未 标记样本, 包括: 确定所述预设时间粒度中的最小粒度; 基于所述 最小粒度对所述资源使用数据进行遍历, 以确定空缺项和负值项; 调用替换值对所述空缺项和所述负值项进行替换, 以对所述资源使用数据进行预处理 得到所述未 标记样本 。 4.根据权利要求2所述的方法, 其特征在于, 所述对所述资源使用数据进行预处理, 以 得到所述未 标记样本, 包括: 获取所述资源使用数据中的均值数; 确定所述资源使用数据中超出 所述均值数的突出项; 采用所述均值数替换所述突出项的数值, 以对所述资源使用数据进行预处理得到所述 未标记样本 。 5.根据权利要求2所述的方法, 其特征在于, 所述对所述资源使用数据进行预处理, 以 得到所述未 标记样本, 包括: 确定所述资源使用数据中的数据对应关系; 提取所述数据对应关系中的异常项; 对所述异常项中的重合数值进行筛选, 以对所述资源使用数据进行预处理得到所述未 标记样本 。 6.根据权利要求1所述的方法, 其特征在于, 所述基于至少一个特征项对所述正样本进 行特征提取, 以得到目标 特征维度, 包括: 确定所述特 征项对应的数值特 征; 基于所述数值特 征对所述 正样本进行 特征提取, 以得到数值 跨度信息; 根据所述数值 跨度信息确定所述目标 特征维度。权 利 要 求 书 1/3 页 2 CN 114862488 A 27.根据权利要求6所述的方法, 其特 征在于, 所述方法还 包括: 将预设时间范围内的所述数值特 征进行关联, 以得到波动特 征; 基于所述波动特 征对所述 正样本进行 特征提取, 以得到特 征波动范围; 根据所述特 征波动范围确定所述目标 特征维度。 8.根据权利要求6所述的方法, 其特 征在于, 所述方法还 包括: 确定所述数值特 征对应的特 征时段; 基于所述特 征时段对所述 正样本进行 特征提取, 以得到时段资源使用信息; 根据所述时段资源使用信息确定所述目标 特征维度。 9.根据权利要求6所述的方法, 其特 征在于, 所述方法还 包括: 将相邻的所述数值特 征进行比对, 以得到周期特 征; 基于所述周期特 征对所述 正样本进行解析, 以得到特 征周期; 根据所述特 征周期确定所述目标 特征维度。 10.根据权利要求1所述的方法, 其特征在于, 所述将所述未标记样本和所述正样本输 入半监督学习框架, 以基于所述目标特征维度对所述半监督学习框架中的分类模型进 行迭 代训练, 包括: 基于所述未 标记样本和所述 正样本生成训练集; 将所述训练集输入所述半监督学习框架, 并从所述未标记样本中随机抽取部分样本作 为负样本; 基于所述 正样本和所述负 样本对预设模型进行训练, 以得到所述分类模型; 根据所述分类模型对未被抽取到的未标记样本进行识别, 以得到所述未被抽取到的未 标记样本中的每 个样本对应的识别特 征值; 基于所述预设条件对所述识别特征值进行筛选, 以从所述未标记样本中提取补充样 本, 并基于所述补充样本对所述 正样本进行 更新; 重复所述随机抽取的过程, 以基于所述目标特征维度对所述半监督学习框架中的分类 模型进行 所述迭代训练。 11.根据权利要求1 ‑10任一项所述的方法, 其特 征在于, 所述方法还 包括: 确定所述目标对象集 合对应的资源使用数据在不同数据维度下的专项数据; 分别获取 所述专项数据所对应的多个预测值; 对所述多个预测值进行加权计算, 以得到目标 特征值; 基于所述目标 特征值确定所述目标对象集 合中的资源消耗异常对象。 12.根据权利要求1所述的方法, 其特征在于, 所述资源消耗异常对象为群租房对象, 所 述目标对象集合为小区用户集合, 所述资源使用数据为用电量, 所述正样本来源于可执行 第三方平台, 所述第三方平台用于对所述群租房对象进行监管。 13.一种资源消耗异常对象的识别装置, 其特 征在于, 包括: 获取单元, 用于获取目标对象集合的资源使用数据作为未标记样本, 并调用已核实为 资源消耗异常对象对应的资源使用数据作为正样本, 所述正样本的数量小于所述未标记样 本的数量; 提取单元, 用于基于至少一个特征项对所述正样本进行特征提取, 以得到目标特征维 度, 所述特 征项基于预设时间粒度下的资源使用特 征设定;权 利 要 求 书 2/3 页 3 CN 114862488 A 3

.PDF文档 专利 一种资源消耗异常对象的识别方法以及相关装置

文档预览
中文文档 30 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种资源消耗异常对象的识别方法以及相关装置 第 1 页 专利 一种资源消耗异常对象的识别方法以及相关装置 第 2 页 专利 一种资源消耗异常对象的识别方法以及相关装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:30:34上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。