(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210148607.9
(22)申请日 2022.02.17
(71)申请人 平安普惠企业管理有限公司
地址 518000 广东省深圳市前海深港合作
区前湾一路1号A栋201室
(72)发明人 刘欢
(74)专利代理 机构 深圳市沃德知识产权代理事
务所(普通 合伙) 44347
专利代理师 高杰 于志光
(51)Int.Cl.
G10L 15/02(2006.01)
G10L 15/26(2006.01)
G06F 40/30(2020.01)
(54)发明名称
意图识别方法、 装置、 电子设备及存 储介质
(57)摘要
本发明涉及人工智能领域, 揭露一种意图识
别方法, 包括: 将语音数据转换为文本数据, 切分
语音数据, 得到文本数据中每个字符对应的第一
语音子数据; 将文本数据输入语音生成模型, 生
成文本数据中每个字符对应的第二语音子数据;
基于第一语音子数据及第二语音子数据确定语
音数据的初始共有特征及初始私有特征; 基于文
本数据、 语音数据、 初始共有特征及初始私有特
征对语音数据执行意图识别处理, 得到意图识别
结果。 本发明还提供一种意图识别装置、 电子设
备及存储介质。 本发明提高了意图识别准确度。
权利要求书3页 说明书12页 附图2页
CN 114550698 A
2022.05.27
CN 114550698 A
1.一种意图识别方法, 其特 征在于, 所述方法包括:
采集用户的语音数据, 将所述语音数据转换为文本数据, 切分所述语音数据, 得到所述
文本数据中每 个字符对应的第一语音子数据;
将所述文本数据输入语音生成模型, 生成所述文本数据中每个字符对应的第 二语音子
数据;
基于所述第一语音子数据及所述第二语音子数据确定所述语音数据的初始共有特征
及初始私有特 征;
基于所述文本数据、 语音数据、 初始共有特征及初始私有特征对所述语音数据执行意
图识别处 理, 得到意图识别结果。
2.如权利要求1所述的意图识别方法, 其特征在于, 所述基于所述第 一语音子数据及所
述第二语音子数据确定所述语音数据的初始共有特 征及初始私有特 征, 包括:
分别对每个第 二语音子数据与所述文本数据 执行相关性分析处理, 基于相关性分析处
理结果得到所述语音数据的初始共有特 征;
基于所述第一语音子数据与所述第二语音子数据计算所述文本数据中每个字符对应
的语音损失值, 根据语音损失值确定所述语音数据的初始私有特 征。
3.如权利要求2所述的意图识别方法, 其特征在于, 所述分别对每个第 二语音子数据与
所述文本数据执行相关性分析 处理, 基于相关性分析 处理结果得到所述语音 数据的初始共
有特征, 包括:
选择一个第 二语音子数据, 将选择的第 二语音子数据与 所述文本数据中每个字符执行
相关性分析处理, 得到所述选择的第二语音子数据与所述文本数据中每个字符之 间的相关
度值;
拼接所述相关度值, 得到所述选择的第二语音子数据对应的初始共有数组;
按照数值从大到小的顺序, 将所述初始共有数组中第 一数量的相关度值设置为第 一数
值, 将所述初始共有数组中其它相关度值设为第二数值, 得到所述选择 的第二语音子数据
对应的共有特 征数组;
汇总每个第 二语音子数据对应的共有特征数组, 得到所述语音数据对应的初始共有特
征。
4.如权利要求2所述的意图识别方法, 其特征在于, 所述根据语音损失值确定所述语音
数据的初始私有特 征, 包括:
拼接所述文本数据中每个字符对应的语音损失值, 得到所述语音数据对应的初始私有
数组;
按照数值从大到小的顺序, 将所述初始私有数组中第 二数量的语音损失值设置为所述
第一数值, 将所述初始私有数组中其它语音损失值设置为所述第二数值, 得到所述语音数
据对应的初始私有特 征。
5.如权利要求1所述的意图识别方法, 其特征在于, 所述基于所述文本数据、 语音数据、
初始共有特征及初始私有特征对所述语音数据执行意图识别处理, 得到意图识别结果, 包
括:
对所述文本数据及所述语音数据分别执行编码处理, 得到所述文本数据中每个字符对
应的文本特 征及语音特 征;权 利 要 求 书 1/3 页
2
CN 114550698 A
2对所述初始共有特征、 所述文本特征及所述语音特征执行共有特征提取处理, 得到目
标共有特 征;
对所述初始私有特 征及所述语音特 征执行私有特 征提取处 理, 得到目标私有特 征;
拼接所述目标共有特征及所述目标私有特征, 得到目标特征向量, 对所述目标特征向
量执行分类处 理, 得到意图识别结果。
6.如权利要求5所述的意图识别方法, 其特征在于, 所述对所述初始共有特征、 所述文
本特征及所述语音特 征执行共有特 征提取处 理, 得到目标共有特 征, 包括:
计算所述文本数据中各个字符的文本特征与每个字符的语音特征之间的注意力值, 基
于所述注意力值确定所述文本数据与所述语音数据之间的初始 注意力权 重矩阵;
基于所述初始注意力权重矩阵及所述初始共有特征计算所述语音数据的共有特征权
重;
基于所述共有特 征权重及所述语音特 征计算所述语音数据的共同向量;
合并所述文本特 征及所述共同向量, 得到更新后的共同向量;
对所述更新后的共同向量执 行编码及特 征提取处 理, 得到目标共有特 征。
7.如权利要求5所述的意图识别方法, 其特征在于, 所述对所述初始私有特征及所述语
音特征执行私有特 征提取处 理, 得到目标私有特 征, 包括:
对所述文本数据中每个字符的语音特征执行线性变换处理, 得到每个字符线性变换后
的语音特 征;
基于所述初始私有特征对每个字符线性变换后的语音特征进行更新, 得到每个字符更
新后的语音特 征;
根据所述更新后的语音特 征计算私有特 征权重;
根据所述私有特 征权重及所述语音特 征计算目标私有特 征。
8.一种意图识别装置, 其特 征在于, 所述装置包括:
切分模块, 用于采集用户的语音数据, 将所述语音数据转换为文本数据, 切分所述语音
数据, 得到所述文本数据中每 个字符对应的第一语音子数据;
生成模块, 用于将所述文本数据输入语音生成模型, 生成所述文本数据中每个字符对
应的第二语音子数据;
确定模块, 用于基于所述第 一语音子数据及所述第 二语音子数据确定所述语音数据的
初始共有特 征及初始私有特 征;
识别模块, 用于基于所述文本数据、 语音数据、 初始共有特征及初始私有特征对所述语
音数据执 行意图识别处 理, 得到意图识别结果。
9.一种电子设备, 其特 征在于, 所述电子设备包括:
至少一个处 理器; 以及,
与所述至少一个处 理器通信连接的存 储器; 其中,
所述存储器存储有可被所述至少一个处理器执行的意图识别程序, 所述意图识别程序
被所述至少一个处理器执行, 以使 所述至少一个处理器能够执行如权利要求 1至7中任一项
所述的意图识别方法。
10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有意图识
别程序, 所述意图识别程序可被一个或者多个处理器执行, 以实现如权利要求1至7任一项权 利 要 求 书 2/3 页
3
CN 114550698 A
3
专利 意图识别方法、装置、电子设备及存储介质
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:25上传分享