说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211023460.7 (22)申请日 2022.08.25 (71)申请人 沈阳工程学院 地址 110136 辽宁省沈阳市沈北新区蒲昌 路18号 (72)发明人 马仕海 高阳 刘宝良  (74)专利代理 机构 辽宁惟则知识产权代理事务 所(普通合伙) 21273 专利代理师 李巨智 (51)Int.Cl. G06Q 10/06(2012.01) G06Q 50/06(2012.01) G06F 16/215(2019.01) G06F 16/2458(2019.01) H02J 3/38(2006.01) (54)发明名称 一种基于数据过滤的风电机组运行决策方 法及系统 (57)摘要 本发明提供了一种基于数据过滤的风电机 组运行决策方法及系统, 应用于数据处理技术领 域, 该方法包括: 通过 获取数据需求参数, 根据数 据需求参数匹配业务数据源集合, 输入数据抽取 层抽取预设时间粒度的业务数据集。 将业务数据 集进行聚类, 生成业务数据集归类结果。 将所述 业务数据集归类结果进行数据清洗, 生成已清洗 业务数据集, 随后输入数据挖掘层, 生成需求数 据集。 判断需求数据集的数据量是否满足需求数 据量。 若满足, 根据所述需求数据集训练风电机 组运行状态决策模型。 解决了 现有技术中由于风 电机组运行状态决策模型的训练数据冗杂程度 较高, 质量较低, 导致存在运行状态识别准确度 较低的技 术问题。 权利要求书3页 说明书10页 附图4页 CN 115392710 A 2022.11.25 CN 115392710 A 1.一种基于数据过滤的风电机组运行决策方法, 其特征在于, 所述方法应用一基于数 据过滤的风电机组运行决策系统, 所述系统包括数据抽取层, 数据 清洗层, 数据归类层和数 据挖掘层, 所述方法包括: 获取数据需求 参数, 其中, 所述数据需求 参数包括需求数据类别和需求数据量; 根据所述需求数据类别匹配业务数据源集合, 输入数据抽取层抽取预设时间粒度的业 务数据集; 将所述业务数据集输入数据归类层进行聚类, 生成业 务数据集归类结果; 将所述业务数据集归类结果输入数据清洗层进行 数据清洗, 生成已清洗业 务数据集; 将所述已清洗业 务数据集输入数据 挖掘层, 生成需求数据集; 判断所述需求数据集的数据量是否满足所述需求数据量; 若满足, 根据所述需求数据集训练风电机组运行状态决策模型。 2.如权利要求1所述的方法, 其特征在于, 所述根据 所述需求数据类别匹配业务数据源 集合, 输入数据抽取层抽取 预设时间粒度的业 务数据集, 包括: 根据所述需求数据类别, 匹配风电机组类型和运行状态评估指标维度; 将所述风电机组类型和所述运行状态评估指标维度输入所述数据抽取层, 从所述业务 数据源集合提取所述预设时间粒度的初始业务数据集, 其中, 所述初始业务数据集包括抽 取源存储格式特 征和抽取字段 特征; 遍历所述抽取字段特征对所述初始业务数据集进行数据 预处理, 生成预处理业务数据 集; 遍历所述抽取源存储格式特征对所述预处理业务数据集进行存储形式一致性调 整, 生 成所述业务数据集。 3.如权利要求2所述的方法, 其特征在于, 所述方法应用一基于数据过滤的风电机组运 行决策系统, 所述系统还包括用户端, 所述遍历所述抽取字段特征对所述初始业务数据集 进行数据预处 理, 生成预处 理业务数据集, 包括: 根据所述数据抽取层, 获取 预设预处 理功能模块 集合; 根据所述预设预处理功能集, 获得一级处理模块集合, 其中, 所述一级处理模块集合包 括数据筛除处 理模块、 数据补全处 理模块和真值 转换处理模块; 根据所述预设预处理功能集, 获得二级处理模块集合, 其中, 所述二级处理模块集合包 括主键生成处理模块、 字段合并处理模块、 字段拆分处理模块、 数据排序处理模块和集合运 算处理模块; 通过用户端对所述数据筛除处理模块、 所述数据补全处理模块、 所述真值转换处理模 块、 所述主键生成处理模块、 所述字段合并处理模块、 所述字段拆分处理模块、 所述数据排 序处理模块和所述 集合运算处理模块进行选择, 生成预处 理模块选择 结果; 根据所述预处理模块选择结果遍历所述抽取字段特征对所述初始业务数据集进行数 据预处理, 生成所述预处理业务数据集, 其中, 所述一级处理模块集合的处理优 先级高于所 述二级处理模块集合。 4.如权利要求1所述的方法, 其特征在于, 所述将所述业务数据集归类结果输入数据清 洗层进行 数据清洗, 生成已清洗业 务数据集, 包括: 根据所述业务数据集归类结果, 获取第一记录数据集, 第 二记录数据集直到第 I记录数权 利 要 求 书 1/3 页 2 CN 115392710 A 2据集; 遍历所述第I记录数据集, 生成第一数据类型、 第二数据类型直到第N数据类型; 遍历所述第N数据类型, 生成第一字段 特征、 第二字段 特征直到第M 字段特征; 将所述第 一字段特征、 所述第 二字段特征直到所述第M字段特征输入权重分布表, 生成 第一字段权 重、 第二字段权 重直到第M 字段权重; 获取纵向清洗公式: 其中, 为第i个记录数据集的第n个数据类型的第m个字段的清洗参考值, P0为清洗 权重阈值, winm第i个记录数据集的第n个数据类型的第m个字段权 重; 当所述纵向清洗公式的输出结果满足预设值时, 对所述业务数据集进行纵向清洗, 生 成纵向清洗结果; 将所述纵向清洗结果添加进所述已清洗业 务数据集。 5.如权利要求4所述的方法, 其特征在于, 所述将所述业务数据集归类结果输入数据清 洗层进行 数据清洗, 生成已清洗业 务数据集, 包括: 根据所述纵向清洗结果, 获取第m字段 特征; 根据所述第m字段特征遍历所述第 一数据类型, 所述第 二数据类型直到所述第 N数据类 型, 生成第一权 重, 第二权 重直到第N权 重; 对所述第一权重, 所述第二权重直到所述第N权重进行最大值筛选, 生成横向清洗结 果; 将所述横向清洗结果添加进所述已清洗业 务数据集。 6.如权利要求1所述的方法, 其特征在于, 所述将所述业务数据集输入数据归类层进行 聚类, 生成业 务数据集归类结果, 包括: 获取第一定位属性和第二定位属性, 其中, 所述第 一定位属性表征出现次数, 所述第二 定位属性表征导 致风电机组异常运行次数; 根据所述第一定位属性和所述第二定位属性, 遍历所述业务数据集进行定位, 生成待 聚类业务数据集; 遍历所述待聚类业 务数据集, 设定初始聚类质心; 根据所述初始聚类质心遍历所述待聚类业 务数据集, 生成初始聚类结果; 遍历所述初始聚类结果对所述初始聚类质心进行调整, 生成迭代聚类质心; 根据所述迭代聚类质心遍历所述待聚类业 务数据集, 生成迭代聚类结果; 若所述迭代聚类结果和所述初始聚类结果不相同, 则重复迭代, 直到第 k聚类结果和第 k-1聚类结果相同, 或/和k满足预设迭代次数时停止, 将所述第k聚类结果设为所述业务数 据集归类结果。 7.如权利要求1所述的方法, 其特征在于, 所述将所述已清洗业务数据集输入数据挖掘 层, 生成需求数据集, 包括: 遍历所述已清洗业 务数据集进行属性特 征提取, 生成特 征属性值; 遍历所述已清洗业 务数据集, 匹配数据 挖掘样本数据集;权 利 要 求 书 2/3 页 3 CN 115392710 A 3

.PDF文档 专利 一种基于数据过滤的风电机组运行决策方法及系统

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于数据过滤的风电机组运行决策方法及系统 第 1 页 专利 一种基于数据过滤的风电机组运行决策方法及系统 第 2 页 专利 一种基于数据过滤的风电机组运行决策方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 06:35:15上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。