说明:收录25万 73个行业的国家标准 支持批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210133838.2 (22)申请日 2022.02.14 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 吴欢 张珂欣 郑安妮 林慕云 (74)专利代理 机构 北京三友知识产权代理有限 公司 11127 专利代理师 周永君 汤在彦 (51)Int.Cl. G06F 16/35(2019.01) G06F 40/30(2020.01) G10L 15/08(2006.01) G10L 15/26(2006.01) G10L 25/24(2013.01)H04M 3/51(2006.01) H04M 3/493(2006.01) (54)发明名称 一种话语提取方法及装置 (57)摘要 本申请提供一种话语提取方法及装置, 涉及 人工智能领域, 也可用于金融领域, 包括: 对预先 获取的语音流片段进行语音识别, 得到对应的对 话文本; 对各所述对话文本进行语义特征提取, 得到各所述对话文本的语义特征向量矩阵; 根据 各所述语义特征向量矩 阵对所述对话文本进行 聚类, 得到话语列表。 本申请能够对语音流片段 进行话语分析得到优秀 话语。 权利要求书2页 说明书14页 附图7页 CN 114461805 A 2022.05.10 CN 114461805 A 1.一种话语提取 方法, 其特 征在于, 包括: 对预先获取的语音流片段进行语音识别, 得到对应的对话文本; 对各所述对话文本进行语义特 征提取, 得到各 所述对话文本的语义特 征向量矩阵; 根据各所述语义特 征向量矩阵对所述对话文本进行聚类, 得到话语列表。 2.根据权利要求1所述的话语提取方法, 其特征在于, 所述对预先获取的语音流片段进 行语音识别, 得到对应的对话文本, 包括: 对所述语音流片段进行语音特 征提取, 得到所述语音流片段的语音特 征向量; 将所述语音特 征向量输入声学语音模型进行语音识别, 得到所述对话文本 。 3.根据权利要求2所述的话语提取方法, 其特征在于, 所述对所述语音流片段进行语音 特征提取, 得到所述语音流片段的语音特 征向量, 包括: 确定所述语音流片段的声谱图; 对所述声谱图进行倒谱分析, 得到所述语音特 征向量。 4.根据权利要求2所述的话语提取方法, 其特征在于, 所述声学语音模型包括: 声学模 型及语音模型; 所述将所述语音特征向量输入声学语音模型进行语音识别, 得到所述对话 文本, 包括: 将所述语音特 征向量输入所述声学模型, 得到所述语音特 征向量所对应的各 单字; 将所述各 单字输入所述语音模型, 以对所述各 单字进行修 正, 得到所述对话文本 。 5.根据权利要求1所述的话语提取方法, 其特征在于, 所述对各所述对话文本进行语义 特征提取, 得到各 所述对话文本的语义特 征向量矩阵, 包括: 筛选各所述对话文本, 得到各 所述对话文本对应的有效对话文本; 将各所述有效对话文本输入BERT模型, 以对各所述有效对话文本进行语义特征提取, 得到各所述对话文本的所述语义特 征向量矩阵。 6.根据权利要求1所述的话语提取方法, 其特征在于, 所述根据 各所述语义特征向量矩 阵对所述对话文本进行聚类, 得到话语列表, 包括: 计算所述语义特 征向量矩阵到各 预设聚类中心的距离; 将所述语义特征向量矩阵纳入距离最近的聚类中心所对应的聚类, 并更新该聚类的聚 类中心; 根据更新后的聚类中心生成所述 话语列表。 7.根据权利要求6所述的话语提取方法, 其特征在于, 所述根据 各所述语义特征向量矩 阵对所述对话文本进行聚类, 得到话语列表, 包括: 提取各所述语义特 征向量矩阵的首 行向量; 计算所述首 行向量到各 预设聚类中心的距离; 将所述首 行向量纳入距离最近的聚类中心所对应的聚类, 并更新该聚类的聚类中心; 根据更新后的聚类中心生成所述 话语列表。 8.根据权利要求6所述的话语提取方法, 其特征在于, 所述根据 各所述语义特征向量矩 阵对所述对话文本进行聚类, 得到话语列表, 包括: 确定所述语义特 征向量矩阵的各 行向量的第一均值向量; 计算所述第一均值向量到各 预设聚类中心的距离; 将所述第一均值向量纳入距离最近的聚类中心所对应的聚类, 并更新该聚类的聚类中权 利 要 求 书 1/2 页 2 CN 114461805 A 2心; 根据更新后的聚类中心生成所述 话语列表。 9.根据权利要求6所述的话语提取方法, 其特征在于, 所述根据 各所述语义特征向量矩 阵对所述对话文本进行聚类, 得到话语列表, 包括: 对所述语义特 征向量矩阵设置会话轮数列向量; 确定含所述会话轮数列向量的语义特 征向量矩阵的第二均值向量; 计算所述第二均值向量到各 预设聚类中心的距离; 将所述第二均值向量纳入距离最近的聚类中心所对应的聚类, 并更新该聚类的聚类中 心; 根据更新后的聚类中心生成所述 话语列表。 10.一种话语提取装置, 其特 征在于, 包括: 对话文本生成单元, 用于对预先获取的语音流片段进行语音识别, 得到对应的对话文 本; 语义向量提取单元, 用于对各所述对话文本进行语义特征提取, 得到各所述对话文本 的语义特 征向量矩阵; 话语列表生成单元, 用于根据各所述语义特征向量矩阵对所述对话文本进行聚类, 得 到话语列表。 11.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机程序, 其特征在于, 所述处理器执行所述程序时实现权利要求1至9任一项所述的话语提 取方法的步骤。 12.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被 处理器执行时实现权利要求1至9任一项所述的话语提取 方法的步骤。权 利 要 求 书 2/2 页 3 CN 114461805 A 3
专利 一种话语提取方法及装置
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:33:35
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
LY-T 3159-2019 细木工板生产节能技术规范.pdf
GB-T 37721-2019信息技术大数据分析系统功能要求.pdf
GB-T 30998-2014信息技术软件安全保障规范.pdf
GM-T 0125.3-2022 JSON Web 密码应用语法规范 第3部分:数据加密.pdf
GB-T 34945-2017 信息技术 数据溯源描述模型.pdf
T-CESA 1143—2021 电子凭据 版式文档格式.pdf
GB-T 30819-2014 机器人用谐波齿轮减速器.pdf
NY-T 886-2022 农林保水剂.pdf
GB/T 39468-2020 陆地定量遥感产品真实性检验通用方法.pdf
T-CSAE 260—2022 智能网联汽车视觉感知计算芯片技术要求和测试方法.pdf
GB-T 22240-2018 信息安全技术 网络安全等级保护定级指南.pdf
GB/T 34960.2-2017 信息技术服务 治理 第2部分:实施指南.pdf
GB-T 20020-2013 气相二氧化硅.pdf
GB-T 26079-2010 梁式吊具.pdf
T-CSAE 259—2022 车载视觉信息汉字显示规范.pdf
国测 2020年教育行业网络安全白皮书.pdf
GB-T 39608-2020 基础地理信息数字成果元数据.pdf
GB-T 16638.1-2008 空气动力学 概念、量和符号 第1部分:空气动力学常用术语.pdf
GB-T 40514-2021 电除尘器.pdf
GB-T 20979-2019 信息安全技术 虹膜识别系统技术要求.pdf
1
/
24
评价文档
赞助2.5元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。