说明:收录25万 73个行业的国家标准 支持批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111358382.1 (22)申请日 2021.11.16 (71)申请人 广西中科曙光云计算有限公司 地址 530000 广西壮 族自治区南宁市青秀 区民族大道143号德瑞花园6号楼1119 号 (72)发明人 梁明杰 郑鹏 刘志徽 韦静贤  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 代理人 郭浩辉 颜希文 (51)Int.Cl. G06N 20/00(2019.01) G06N 3/08(2006.01) G06Q 10/06(2012.01) G06Q 50/26(2012.01) (54)发明名称 基于机器学习的政务大数据处理方法及装 置 (57)摘要 本申请公开了一种基于机器学习的政务大 数据处理方法及装置, 通过获取政务日志数据, 在预设搜索空间中, 确定用于对政务日志数据进 行预处理的预设数据处理模型, 从而使政务日志 数据能够在预设搜索空间基于机器学习实现自 动化处理; 基于调优器技术和评估器技术, 对预 设数据处理模 型进行优化训练, 直至得到最优数 据处理模型, 从而避免传统手动流程容易出错、 效率不高且难于管理的问题; 最后利用最优数据 处理模型, 对政务日志数据进行预处理, 得到高 质量政务数据, 以及对高质量政务数据进行存储 或可视化展示, 提高数据预处理能力, 提升实时 批量采集、 精准过滤的效率。 权利要求书2页 说明书9页 附图2页 CN 114139720 A 2022.03.04 CN 114139720 A 1.一种基于 机器学习的政务大 数据处理方法, 其特 征在于, 包括: 获取政务日志数据; 在预设搜索空间中, 确定用于对所述政务日志数据进行 预处理的预设数据处 理模型; 基于调优器技术和评估器技术, 对所述预设数据处理模型进行优化训练, 直至得到最 优数据处 理模型; 利用所述 最优数据处 理模型, 对所述政务日志数据进行 预处理, 得到高质量政务数据; 对所述高质量政务数据进行存 储或可视化展示。 2.如权利要求1所述的政务大数据处理方法, 其特征在于, 所述在预设搜索空间中, 确 定用于对所述政务日志数据进行 预处理的预设数据处 理模型, 包括: 在所述预设搜索空间中, 根据所述政务日志数据, 选取包含默认网络结构和超参数的 模型文件; 根据预设的模型损 失期望值, 确定迭代算法的算法文件, 所述预设数据处理模型包括 所述模型文件和所述 算法文件。 3.如权利要求1所述的政务大数据处理方法, 其特征在于, 所述基于调优器技术和评估 器技术, 对所述预设数据处 理模型进行优化训练, 直至得到最优数据处 理模型, 包括: 利用预设的调优器, 对所述预设数据处理模型进行训练, 得到目标数据处理模型, 所述 目标数据处理模型包括模型参数; 利用预设的评估器, 根据 所述模型参数, 对所述目标数据处理模型进行评估, 得到模型 评估结果; 利用所述调优器, 根据所述模型评估结果, 对所述目标 数据处理模型进行初始化; 基于所述调优器和所述评估器, 对初始化后的所述目标数据处理模型进行循环优化, 直至所述目标 数据处理模型达 到预设收敛 条件, 得到所述 最优数据处 理模型。 4.如权利要求3所述的政务大数据处理方法, 其特征在于, 所述利用预设的调优器, 对 所述预设数据处 理模型进行训练, 得到目标 数据处理模型, 包括: 利用所述调优器, 根据 预设优化方式, 对所述预设数据处理模型进行训练, 得到目标数 据处理模型, 所述预设优化方式包括启发式搜索方式、 非导优化方式和强化学习方式。 5.如权利要求3所述的政务大数据处理方法, 其特征在于, 所述利用预设的评估器, 根 据所述模型参数, 对所述目标 数据处理模型进行评估, 得到模型评估结果, 包括: 利用所述评估器采用预设辅助评估法, 根据所述模型参数, 对所述目标数据处理模型 进行辅助评估, 得到模型评估结果, 所述预设辅助评估法包括子取样法、 参数复用法和代理 评估法。 6.如权利要求3所述的政务大数据处理方法, 其特征在于, 所述利用所述调优器, 根据 所述模型评估结果, 对所述目标 数据处理模型进行初始化, 包括: 利用所述调优器采用经验学习算法, 确定所述模型评估结果对应的最优 模型参数; 根据所述 最优模型参数, 对所述目标 数据处理模型进行初始化。 7.一种基于 机器学习的政务大 数据处理装置, 其特 征在于, 包括: 获取模块, 用于获取政务日志数据; 确定模块, 用于在预设搜索空间中, 确定用于对所述政务日志数据进行预处理的预设 数据处理模型;权 利 要 求 书 1/2 页 2 CN 114139720 A 2训练模块, 用于基于调优器技术和评估器技术, 对所述预设数据处理模型进行优化训 练, 直至得到最优数据处 理模型; 处理模块, 用于利用所述最优数据处理模型, 对所述政务日志数据进行预处理, 得到高 质量政务数据; 展示模块, 用于对所述高质量政务数据进行存 储或可视化展示。 8.根据权利要求7所述的基于机器学习的政务大数据处理装置, 其特征在于, 所述训练 模块, 包括: 训练单元, 用于利用预设的调优器, 对所述预设数据处理模型进行训练, 得到目标数据 处理模型, 所述目标 数据处理模型包括模型参数; 评估单元, 用于利用预设的评估器, 根据 所述模型参数, 对所述目标数据处理模型进行 评估, 得到模型评估结果; 初始化单元, 用于利用所述调优器, 根据 所述模型评估结果, 对所述目标数据处理模型 进行初始化; 循环单元, 用于基于所述调优器和所述评估器, 对初始化后的所述目标数据处理模型 进行循环优化, 直至所述 目标数据 处理模型达到预设收敛条件, 得到所述最优数据 处理模 型。 9.一种计算机设备, 其特征在于, 包括处理器和存储器, 所述存储器用于存储计算机程 序, 所述计算机程序被所述处理器执行时实现如权利要求 1至6任一项 所述的基于机器学习 的政务大 数据处理方法。 10.一种计算机可读存储介质, 其特征在于, 其存储有计算机程序, 所述计算机程序被 处理器执行时实现如权利要求1至 6任一项所述的基于 机器学习的政务大 数据处理方法。权 利 要 求 书 2/2 页 3 CN 114139720 A 3

.PDF文档 专利 基于机器学习的政务大数据处理方法及装置

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于机器学习的政务大数据处理方法及装置 第 1 页 专利 基于机器学习的政务大数据处理方法及装置 第 2 页 专利 基于机器学习的政务大数据处理方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:02:01上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。