专利 一种直梯内物品抢劫检测预警方法、装置及计算机设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210345959.3 (22)申请日 2022.03.31 (71)申请人成都新潮传媒集团有限公司地址 610000 四川省成都市高新区锦晖西一街99号1栋2单元15层15 05号申请人成都百新智联科技有限公司 (72)发明人马凯　 (74)专利代理机构成都顶峰专利事务所(普通合伙) 51224 专利代理师杨国瑞 (51)Int.Cl. G06V 40/20(2022.01) G06V 20/40(2022.01) G06V 20/52(2022.01) G06V 10/82(2022.01)G08B 13/196(2006.01) G06N 3/04(2006.01) (54)发明名称一种直梯内物品抢劫检测预警方法、装置及计算机设备 (57)摘要本发明涉及电梯监控技术领域，公开了一种直梯内物品抢劫检测预警方法、装置及计算机设备。通过本发明创造，提供了一种基于音视频数据的直梯内物品抢劫事件确定方案，即在获取目标监控时段内由直梯内摄像头采集的视频数据和由直梯内拾音器采集的音频数据后，在行为识别的基础上，加入了在物品抢劫事件中抢劫话语的关键词判定以及声源位置综合判定(以防梯内广告声干扰)等机制，可大大提升物品抢劫事件的结果判定准确性。此外，还可使得采集的视频帧包含完整的人体部分和从摄像角度来看动作是由连贯的动作视频帧组成的，以及提高处理速度，降低系统制作成本及系统的工况部署难度，便于实际应用和推广。权利要求书5页说明书19页附图9页 CN 114694254 A 2022.07.01 CN 114694254 A 1.一种直梯内物品抢劫检测预警方法，其特征在于，包括：获取目标监控时段内由直梯内摄像头采集的视频数据和由直梯内拾音器采集的音频数据，其中，所述目标监控时段为从t1‑τ时刻至t1+τ时刻的时段， t1表示与目标视频帧对应的采集时刻， τ表示预设的指定时长，所述目标视频帧是指由所述直梯内摄像头采集的且通过图像识别处理发现在直梯内有可抢劫物品和两个人体以及发现直梯门开启的视频帧，所述直梯内摄像头固定安装在直梯轿厢内部且朝向直梯门，并使镜头视野固定涵盖轿厢内部区域及直梯门区域，所述直梯内拾音器固定安装在直梯轿厢内部；针对所述视频数据中的各个视频帧，根据对应的帧图像进行人体关节点信息提取处理，得到在对应的帧图像中标注的人体骨架，其中，所述人体骨架包含有与左右手首、左右肘、左右肩、左右腰、左右膝和左右足首对应的人体节点；针对所述各个视频帧，若判定在对应的帧图像中至少有一个手首节点至物品检测框的中心点的距离不大于预设的第一距离阈值，则确定对应视频帧满足第一预设条件，其中，所述物品检测框是指在对应的帧图像中所识别出来的可抢劫物品的检测框；根据所述各个视频帧的人体骨架，若判定有至少一组抢劫动作呈现节点的动作呈现姿态属于预先标注的抢劫姿态，则确定满足第二预设条件，其中，所述抢劫动作呈现节点包括有与左右手首、左右肘、左右肩、左右腰、左右膝和左右足首对应的人体节点；根据所述音频数据，利用已完成训练的且基于端到端语音识别技术的关键词检索系统来进行抢劫话语关键词识别处理，若识别得到至少一个抢劫话语关键词，则确定满足第三预设条件，其中，所述抢劫话语关键词的置信度需不小于预设的置信度阈值；针对所述至少一个抢劫话语关键词中的各个抢劫话语关键词，若判定对应的发音声源来自直梯内人体，则确定对应关键词满足第四预设条件；若在满足所述第二预设条件的前提下，在所述视频数据中满足所述第一预设条件的视频帧数不小于预设的帧数阈值，和/或在满足所述第三预设条件的前提下，至少有一个抢劫话语关键词满足所述第四预设条件，则确定发生直梯内物品抢劫事件，并向电梯监控后台发送异常行为提醒信号。 2.如权利要求1所述的直梯内物品抢劫检测预警方法，其特征在于，针对所述至少一个抢劫话语关键词中的各个抢劫话语关键词，若判定对应的发音声源来自直梯内人体，则确定对应关键词满足第四预设条件，包括：针对所述至少一个抢劫话语关键词中的某个抢劫话语关键词，根据对应起止时间内的音频数据，利用已完成训练的声源方位估计模型来进行对应的声源方位估计处理，得到对应的声源相对于所述直梯内拾音器的方向角及仰角；根据所述方向角及仰角和所述直梯内摄像头与所述直梯内拾音器的已知位置关系，确定与所述某个抢劫话语关键词对应的声源在同期视频帧的帧图像中的且以图像中心为极点的第一极角坐标，其中，所述同期视频帧是指在与所述某个抢劫话语关键词对应的起止时间内由所述直梯内摄像头采集的视频帧；针对各个所述同期视频帧，确定在对应的帧图像中的至少一个人体头部位置；针对各个所述同期视频帧，若判定在对应的所述至少一个人体头部位置中存在满足如下条件的人体头部位置：该人体头部位置在对应的帧图像中的且以图像中心为极点的第二极角坐标与所述第一极角坐标的绝对差值不大于预设的角度阈值，则确定对应视频帧满足权　利　要　求　书 1/5 页 2 CN 114694254 A 2第五预设条件；若判定满足所述第五预设条件的视频帧数与总视频帧数的比值不小于预设的第一比例阈值，则确定与所述某个抢劫话语关键词对应的发音声源来自直梯内人体，以及确定所述某个抢劫话语关键词满足第四预设条件，其中，所述总视频帧数是指在与所述某个抢劫话语关键词对应的起止时间内由所述直梯内摄像头采集的视频帧总数。 3.如权利要求1所述的直梯内物品抢劫检测预警方法，其特征在于，获取目标监控时段内由直梯内摄像头采集的视频数据和由直梯内拾音器采集的音频数据，包括：在获取由直梯内摄像头采集的实时视频帧后，将所述实时视频帧的帧图像导入已完成训练的且基于目标检测算法的物品识别模型，输出得到物品识别结果，其中，所述直梯内摄像头固定安装在直梯轿厢内部且朝向直梯门，并使镜头视野固定涵盖轿厢内部区域及直梯门区域；若所述物品识别结果包含有至少一个可抢劫物品检测框，则确定在直梯内有可抢劫物品，然后将所述实时视频帧的帧图像导入已完成训练的且基于目标检测算法的人体识别模型，输出得到人体识别结果；若所述人体识别结果包含有两个人体检测框，则确定在直梯内有两个人体，然后根据所述实时视频帧的帧图像，通过图像识别处理判断直梯门是否处于开启状态；若判定直梯门处于开启状态，则将所述实时视频帧确定为目标视频帧；获取在从t1‑τ时刻至t1+τ时刻的时段内，由所述直梯内摄像头采集的视频数据和由直梯内拾音器采集的音频数据，其中， t1表示与所述目标视频帧对应的采集时刻， τ表示预设的指定时长,所述直梯内拾音器固定安装在直梯轿厢内部。 4.如权利要求3所述的直梯内物品抢劫检测预警方法，其特征在于，根据所述实时视频帧的帧图像，通过图像识别处理判断直梯门是否处于开启状态，包括如下方式(A)～(B)中的任意一种： (A)当直梯门为对开门且在对开两门扇的梯内表面上分别预先设置有一个标签时，先将所述实时视频帧的帧图像导入已完成训练的且基于目标检测算法的标签识别模型，输出得到标签识别结果，然后根据所述标签识别结果中的两个标签检测框，计算所述两个标签检测框的中心距离，最后若判定所述中心距离不小于预设的第二距离阈值，则确定所述直梯门处于开启状态； (B)根据预先在直梯门完全封闭时由所述直梯内摄像头采集的背景帧，对所述实时视频帧的帧图像进行在直梯门框区域中的帧差处理，得到框内帧差图像，然后对所述框内帧差图像进行离散点去除处理和腐蚀操作处理，得到新帧差图像，再然后对所述新帧差图像中的帧差绝对值不小于预设的帧差阈值的像素点做凸包处理，得到凸包区域，再然后统计位于所述凸包区域内的所有像素点的像素总量，最后若判定所述像素总量不小于预设的数量阈值，则确定所述直梯门处于开启状态。 5.如权利要求3所述的直梯内物品抢劫检测预警方法，其特征在于，将所述实时视频帧确定为目标视频帧，包括如下方式(C)～(E)中的任意一种或它们的任意组合： (C)当直梯门为对开门且在对开两门扇的梯内表面上分别预先设置有一个标签时，先将所述实时视频帧的帧图像导入已完成训练的且基于目标检测算法的标签识别模型，输出得到标签识别结果，然后根据所述标签识别结果中的两个标签检测框，计算所述两个标签权　利　要　求　书 2/5 页 3 CN 114694254 A 3

专利 一种直梯内物品抢劫检测预警方法、装置及计算机设备

专利一种直梯内物品抢劫检测预警方法、装置及计算机设备