说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111367048.2 (22)申请日 2021.11.18 (71)申请人 北京明略软件系统有限公司 地址 100089 北京市海淀区中关村东路1号 院1号楼10层A10 02 (72)发明人 姜娜 王硕 杨康 孙泽懿  徐凯波  (74)专利代理 机构 青岛清泰联信知识产权代理 有限公司 3725 6 代理人 梁春艳 (51)Int.Cl. G06Q 30/02(2012.01) G06N 20/00(2019.01) (54)发明名称 广告异常流量检测方法、 系统、 电子设备及 可读存储介质 (57)摘要 本发明公开了一种 广告异常流量检测方法、 系统、 电子设备及可读 存储介质, 上述方法包括: 利用历史流量数据采用VAE模型构建并训练数据 重构模型; 将历史流量数据输入至数据重构模型 获得第一重构数据, 计算历史流量数据与第一重 构数据之间的误差值获得第一重构误差; 通过对 第一重构误差进行聚类将历史流量数据分为正 常流量与异常流量, 根据正常流量对应的第一重 构误差确定第一阈值, 根据全部历史流量数据对 应的第一重构误差确定第二阈值; 利用数据重构 模型根据第一阈值与第二阈值对待检测流量数 据进行异常检测。 通过本发明克服了原数据集无 标签与不平衡分布为有监 督学习带来的缺 点。 权利要求书2页 说明书10页 附图4页 CN 114037478 A 2022.02.11 CN 114037478 A 1.一种广告异常流 量检测方法, 其特 征在于, 基于变分自动 编码器, 包括: 模型构建步骤; 利用历史流 量数据采用V AE模型构建并训练数据重构模型; 第一重构误差获得步骤: 将所述历史流量数据输入至所述数据重构模型获得第 一重构 数据, 计算所述历史流 量数据与所述第一重构数据之间的误差值获得第一重构误差; 阈值确定步骤: 通过对所述第 一重构误差进行聚类将所述历史流量数据分为正常流量 与异常流量, 根据正常流量对应的第一重构误差确定第一阈值, 根据全部历史流量数据对 应的第一重构误差确定第二阈值; 数据检测步骤: 利用所述数据重构模型根据 所述第一阈值与 所述第二阈值对待检测流 量数据进行异常检测。 2.根据权利要求1所述的广告异常流量检测方法, 其特征在于, 所述数据检测步骤包 括: 第二重构误差获得步骤: 将所述待检测流量数据输入至所述数据重构模型获得第 二重 构数据, 计算所述待检测流 量数据与所述第二重构数据之间的误差值获得第二重构误差; 异常判断步骤: 若所述第二重构误差小于所述第一阈值, 则所述待检测流量数据为正 常流量数据; 若所述第二重构误差大于所述第一阈值且小于等于所述第二阈值, 则所述待 检测流量数据为已知的异常流量数据; 若所述第二重构误差大于所述第二阈值, 则所述待 检测流量数据为未知的异常流 量数据。 3.根据权利要求2所述的广告异常流 量检测方法, 其特 征在于, 还 包括: 数据预处 理步骤: 将所述历史流 量数据与所述待检测流 量数据进行清洗与预处 理; 数据标准化步骤: 对经过清洗与 预处理后的所述历史流量数据与待检测流量数据进行 特征工程, 获得 标准化后的所述历史流 量数据与所述待检测流 量数据。 4.根据权利要求1所述的广告异常流量检测方法, 其特征在于, 所述模型构建步骤包 括: 将所述历史流量数据输入至所述VAE模型获得样本重构数据, 根据所述样本重构数据与 所述历史流量数据的MSE与KL散度构建损失函数, 通过最小化所述损失函数对所述数据重 构模型进行训练。 5.根据权利要求4所述的广告异常流量检测方法, 其特征在于, 数据重构模型参数采用 Adam优化 算法进行训练, 数据重构模型超参数采用网格搜索法进行训练。 6.根据权利要求2所述的广告异常流量检测方法, 其特征在于, 所述阈值确定步骤包 括: 根据所述正常流量对应的第一重构误差的均值与标准差确定第一阈值, 根据所述全部 历史流量数据对应的第一重构误差的均值与标准差确定第二阈值。 7.一种广告异常流 量检测系统, 其特 征在于, 基于变分自动 编码器, 包括: 数据预处 理单元: 将历史流 量数据与待检测流 量数据进行清洗与预处 理; 数据标准化单元: 对经过清洗与 预处理后的所述历史流量数据与待检测流量数据进行 特征工程, 获得 标准化后的所述历史流 量数据与所述待检测流 量数据; 模型构建单 元: 利用所述历史流 量数据通过V AE模型构建并训练数据重构模型; 第一重构误差获得单元: 将所述历史流量数据输入至所述数据重构模型获得第 一重构 数据, 计算所述历史流 量数据与所述第一重构数据之间的误差值获得第一重构误差; 阈值确定单元: 通过对所述第 一重构误差进行聚类将所述历史流量数据分为正常流量 与异常流量, 根据正常流量对应的第一重构误差确定第一阈值, 根据全部历史流量数据对权 利 要 求 书 1/2 页 2 CN 114037478 A 2应的第一重构误差确定第二阈值; 数据检测单元: 利用所述数据重构模型根据 所述第一阈值与 所述第二阈值对待检测流 量数据进行异常检测。 8.根据权利要求7所述的广告异常流量检测系统, 其特征在于, 所述数据检测单元包 括: 第二重构误差获得模块: 将所述待检测流量数据输入至所述数据重构模型获得第 二重 构数据, 计算所述待检测流 量数据与所述第二重构数据之间的误差值获得第二重构误差; 异常判断模块: 若所述第二重构误差小于所述第一阈值, 则所述待检测流量数据为正 常流量数据; 若所述第二重构误差大于所述第一阈值且小于等于所述第二阈值, 则所述待 检测流量数据为已知的异常流量数据; 若所述第二重构误差大于所述第二阈值, 则所述待 检测流量数据为未知的异常流 量数据。 9.一种电子设备, 包括存储器、 处理器以及存储在所述存储器上并可在所述处理器上 运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至6 中任一项所述的广告异常流 量检测方法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器 执行时实现如权利要求1至 6中任一项所述的广告异常流 量检测方法。权 利 要 求 书 2/2 页 3 CN 114037478 A 3

.PDF文档 专利 广告异常流量检测方法、系统、电子设备及可读存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 广告异常流量检测方法、系统、电子设备及可读存储介质 第 1 页 专利 广告异常流量检测方法、系统、电子设备及可读存储介质 第 2 页 专利 广告异常流量检测方法、系统、电子设备及可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:02:37上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。