(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210218142.X
(22)申请日 2022.03.08
(65)同一申请的已公布的文献号
申请公布号 CN 114332742 A
(43)申请公布日 2022.04.12
(73)专利权人 西安科技大 学
地址 710054 陕西省西安市碑林区雁塔中
路58号
(72)发明人 叶鸥 魏新力 于振华 段瑞
付燕 邓军
(74)专利代理 机构 西安众星蓝图知识产权代理
有限公司 61234
专利代理师 程彦彦
(51)Int.Cl.
G06V 20/40(2022.01)G06V 10/44(2022.01)
G06V 10/764(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06F 9/50(2006.01)
审查员 刘娜
(54)发明名称
一种基于深度神经网络的异常视频大数据
清洗方法
(57)摘要
本发明公开了一种基于深度神经网络的异
常视频大数据清 洗方法, 包 括以下步骤: 一、 CNN ‑
LSTM神经网络对待处理视频的特征向量提取;
二、 对提取的特征向量进行局部敏感哈希映射并
获取表征视频的实数值; 三、 根据视频的实数值
计算箱形图的最大值、 最小 值、 上下四分位数、 中
位数和四分位距离并绘制箱形图; 四、 根据箱形
图中视频的实数值的分布情况找出异常点并删
除异常点对应的异常视频。 本发明方法步骤简
单, 设计合理, 可 以快速有效地自动清洗视频大
数据中的异常视频数据, 提高视频大数据的数据
质量。
权利要求书3页 说明书8页 附图2页
CN 114332742 B
2022.06.03
CN 114332742 B
1.一种基于深度神经网络的异常视频大数据清洗方法, 其特征在于, 该方法包括以下
步骤:
步骤一、 CN N‑LSTM神经网络对待处 理视频的特 征向量提取:
采用计算机通过CNN ‑LSTM神经网络分别对
个待处理视频进行特征向量提取的方法
均相同, 其中对 任一个待处 理视频进行 特征向量提取, 具体过程如下:
步骤101、 采用计算机从任一个待处理视频中选取
个视频帧, 并将
个视频帧分别
输入VGG16神经网络中进行空间特征提取, 得到
个视频帧对应的空间特征向量; 其中,
为正整数;
步骤102、 采用计算机将步骤101中
个视频帧对应的空间特征向量输入到LSTM神经网
络中, 提取待处理视 频的时空特征, 得到一组初 始特征向量
; 其中, 第
个初始特
征向量
为1024×1的向量,
为正整数, 且
;
步骤103、 采用计算机调用PCA主成分分析模块对步骤102中的一组初始特征向量进行
降维处理, 得到降维后特征向量, 并存入HDFS中; 其中, 降维后特征向量为1024 ×1的向量,
第
个待处理视频的降维后特征向量记作第
个特征向量
,
和
均为正整数, 且
;
步骤二、 对提取的特 征向量进行局部敏感哈希映射并获取表征视频的实数值:
采用计算机分别对
个特征向量进行局部敏感哈希映射并获取表征视频的实数值的方
法均相同, 其中对第
个特征向量进行局部敏感哈希映射并获取表征视频的实数值, 具体
过程如下:
步骤201、 采用计算机利用H adoop分布式平台的M apReduce框架从HDFS中读取第
个特
征向量;
步骤202、 采用计算机利用MapReduce框架, 在Map阶段利用LSH算法哈希函数族
对
第
个特征向量
进行哈希映射, 得到第
个特征向量
对应的
位二值化哈希码; 其中,
为正整数;
步骤203、 采用计算机对第
个特征向量
对应的
位二值化哈希码进行欧氏距离计
算, 得到第
个特征向量
所对应的视频的实数值
;
步骤204、 采用计算机利用MapReduce框架, 在Reduce规约阶段将第
个特征向量
所
对应的视频的实数值
存入HDFS中;
步骤三、 根据视频的实数值计算箱形图的最大值、 最小值、 上下四分位数、 中位数和四
分位距离并绘制箱形图:
步骤301、 采用计算机从HDFS中获取
个待处理视频对应的实数值;
步骤302、 采用计算机利用快速排序算法将步骤301中视频的实数值按照从小到大的顺
序排序;
步骤303、 采用计算机对排序后的视频的实数值进行计算处理, 得到箱形图的坐标值权 利 要 求 书 1/3 页
2
CN 114332742 B
2Q1, Q2, Q3, IQR, TOP和LOW; 其中, Q1表示箱形图的下四分位数, Q2表示箱形图的中位数, Q3表
示箱形图的上四分位数, IQR表示箱形图的四分位距离, TOP表示箱形图中的最大值, LOW表
示箱形图中的最小值;
步骤304、 采用计算机根据坐标值 Q1, Q2, Q3, I QR, TOP和LOW画出箱形图;
步骤四、 根据箱形图中视频的实数值的分布情况找出异常点并删除异常点对应的异常
视频:
步骤401、 采用计算机将箱形图中大于TOP或者小于LOW的实数值记作异常点;
步骤402、 将异常点对应的待处理视频认为异常视频, 并将该异常视频删除, 完成异常
视频的清洗 。
2.按照权利要求1所述的一种基于深度神经网络的异常视频大数据清洗方法, 其特征
在于: 步骤202具体步骤如下:
步骤2021、 设定哈希函数族
由
个哈希函数, 第
个哈希函数记作
,
为正
整数且
, 第
个哈希函数
, 如下:
;
其中,
表示哈希映射投影中实轴量化宽度,
为[0,
]范围内的随机数,
为1024
维向量, 且每一维是一个独立选自满足p ‑Stable分布的随机变量,
表示内积运算,
表示向下 取整操作;
步骤2022、 采用计 算机利用MapReduce框架, 在Map阶段利用LSH算法哈希函数族
对
第
个特征向量
进行哈希映射 , 得到第
个特征向量
对应的
位哈希码
; 其中,
表示第
个特征向量对应的第
个哈希码,
为正整数且
;
步骤2023、 采用计算机利用MapReduce框架根据
, 得到第
个特征
向量对应的第
个二值化哈希码
; 其中,
表示第
个特征向量对应的
位哈希码
的中位数。
3.按照权利要求2所述的一种基于深度神经网络的异常视频大数据清洗方法, 其特征
在于: 步骤20 3具体步骤如下:
根据公式
, 得到第
个特征向量
所对应的视频
的实数值
。
4.按照权利要求1所述的一种基于深度神经网络的异常视频大数据清洗方法, 其特征权 利 要 求 书 2/3 页
3
CN 114332742 B
3
专利 一种基于深度神经网络的异常视频大数据清洗方法
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:11:48上传分享