说明:收录25万 73个行业的国家标准 支持批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210701304.5 (22)申请日 2022.06.21 (71)申请人 南京大学 地址 210023 江苏省南京市栖霞区仙林大 道163号 (72)发明人 夏南 赵鑫 王梓宇 庄苏丹  高醒 陈振杰 李满春  (74)专利代理 机构 南通博瑞达专利代理事务所 (特殊普通 合伙) 32530 专利代理师 李宾 (51)Int.Cl. G06V 20/13(2022.01) G06F 16/951(2019.01) G06K 9/62(2022.01) G06Q 10/04(2012.01)G06Q 10/06(2012.01) G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 20/10(2022.01) (54)发明名称 一种融合遥感数据与位置大数据的居民地 提取方法 (57)摘要 本发明公开了一种融合遥感数据与位置大 数据的居民地提取方法, 该方法包括以下步骤: S1、 采用网络爬虫技术获取开源的位置大数据, 并提取其时间序列特征; S2、 结合多尺度遥感影 像与遥感分类产品数据, 采用分层随机取样的方 法, 构建并标注训练样本和验证样本集合; S3、 以 统一评价单元为基础获取遥感与位置大数据的 多维特征, 并通过特征重要性分析结果, 实现低 冗余度特征的筛选; S4、 构建融合遥感数据与位 置大数据的随机森林分类器, 实现大区域居民地 的提取。 通过与已有结果、 单一特征提取结果等 比对, 分析遥感 ‑位置特征联合的居民地提取结 果精度, 构建大区域居民地提取的机器学习模 型, 实现大区域居民地的高精度提取。 权利要求书3页 说明书13页 附图5页 CN 115424139 A 2022.12.02 CN 115424139 A 1.一种融合遥感数据与位置大数据的居民地提取方法, 其特征在于, 该方法包括以下 步骤: S1、 采用网络 爬虫技术获取开源的位置大 数据, 并提取其时间序列特 征; S2、 结合多尺度遥感影像与遥感分类产品数据, 采用分层随机取样的方法, 构建并标注 训练样本和验证样本集 合; S3、 以统一评价单元为基础提取遥感与位置大数据的多维特征, 并通过特征重要性分 析结果, 实现低冗余度特 征的筛选; S4、 构建融合遥感数据与位置大数据的随机森林分类器, 实现大区域居民地的提取, 并 通过精度分析与比对分析, 验证联合特 征的有效性。 2.根据权利要求1所述的一种融合遥感数据与位置大数据的居民地提取方法, 其特征 在于, 所述采用网络爬虫技术 获取开源的位置大数据, 并获取其时间序列特征, 包括以下步 骤: S11、 采用P ython的Request库构建网络爬虫, 采集腾讯定位密度数据, 对页面数据进行 解析并提取 所需的定位频次和格网位置信息; S12、 构建居民地和非居民地的小时级定位频次的标准时间序列曲线; S13、 以居民地的所述标准时间序列曲线为参照, 对各格网构建小时级定位频次时间序 列曲线并归一 化为0‑1; S14、 利用马氏距离与Pearson相关系数, 计算各网格时间序列曲线与所述标准时间序 列曲线的相似性; S15、 采用Python的Scipy库进行所述马氏距离与所述Pearson相关系数的计算, 作为格 网曲线与小时级标准时序曲线的相关性; S16、 采用工作日日均定位频次和周末日均定位频次的比值, 体现居民地与非居民地在 工作日与周末的人类活动强度差异。 3.根据权利要求2所述的一种融合遥感数据与位置大数据的居民地提取方法, 其特征 在于, 所述马氏距离的计算表达式为: 式中, DM表示距离量 算结果并取其倒数值作为马氏距离; Xi表示离散化的目标时间序列, 其长度为 n; Yi表示离散化的标准时间序列, 其长度为 n; i表示时间序列中各离 散点的序号; S‑1表示目标时间序列和标准时间序列的协方差矩阵。 4.根据权利要求2所述的一种融合遥感数据与位置大数据的居民地提取方法, 其特征 在于, 所述Pearso n相关系数的计算表达式为: 式中, DP表示Pearso n相关系数, 且相关系数DP的绝对值越大, 则相关性越强;权 利 要 求 书 1/3 页 2 CN 115424139 A 2DP=1表示正向的线性关系; DP=‑1表示负向的线性关系; 表示目标时间序列的平均值; 表示标准时间序列的平均值; Xi表示离散化的目标时间序列, 其长度为 n; Yi表示离散化的标准时间序列, 其长度为 n; i表示时间序列中各离 散点的序号。 5.根据权利要求1所述的一种融合遥感数据与位置大数据的居民地提取方法, 其特征 在于, 所述结合多尺度遥感影像与遥感分类产品数据, 采用分层随机取样的方法, 构建 并标 注训练样本和验证样本集 合, 包括以下步骤: S21、 随机 选取0.01 °格网, 基于多个遥感分类产品数据计算该格网内的居民地比例; S22、 基于GEE平台合成的Sentinel ‑2和Landsat ‑8年度影像, 分别计算格网内 Sentinel‑2和Landsat ‑8像元的归一 化建筑指数; S23、 对两类影像的归一化建筑指数值进行平均, 计算得到0.01 °样本格网内各像元的 归一化建筑指数值, 并将正值设定为建筑用地像元, 负值设定为 非建筑用地像元, 统计格网 内的建筑用地像元比例; S24、 将求得的建筑用地像元比例值进行加权求和运 算, 得到建筑用地综合比例; S25、 将建筑用地综合比例大于30 %的格网标注为居民地, 小于30%的格网标注为非居 民地; S26、 基于GEE平台的高分遥感影像, 采用目视判断核对建筑用地综合比例, 并进行样本 的精确标注。 6.根据权利要求1所述的一种融合遥感数据与位置大数据的居民地提取方法, 其特征 在于, 所述以统一评价单元为基础获取遥感与位置大数据的多维特征, 并通过特征重要性 分析结果, 实现低冗余度特 征的筛选, 包括以下步骤: S31、 以统一评价单 元为基础对遥感与位置大 数据提取18个特 征; S32、 计算格网在Lambert圆锥投影下的投影面积, 将每个格网的特征值 除以格网投影 面积, 得到单位 面积下的格网特 征值; S33、 通过特征相关性计算, 剔除相似度高的特 征, 减少冗余度; S34、 通过 特征相异度指标决定 输入特征, 控制决策树的生长; S35、 采用相对重要性指标分析 特征贡献率, 实现提取 结果的评估; S36、 采用Spearman相关系数 逐对计算特 征的相关性; S37、 随机森林分类器采用Gini指数, 增大决策树生长过程中居民地与非居民地的相异 度; S38、 通过度量类别之间的不纯度确定节点的最佳分割特 征。 7.根据权利要求6所述的一种融合遥感数据与位置大数据的居民地提取方法, 其特征 在于, 所述18个特 征包括8个遥感特 征与10个位置特 征。 8.根据权利要求6所述的一种融合遥感数据与位置大数据的居民地提取方法, 其特征 在于, 所述随机森林分类 器采用Gi ni指数的表达式为:权 利 要 求 书 2/3 页 3 CN 115424139 A 3

PDF文档 专利 一种融合遥感数据与位置大数据的居民地提取方法

文档预览
中文文档 22 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种融合遥感数据与位置大数据的居民地提取方法 第 1 页 专利 一种融合遥感数据与位置大数据的居民地提取方法 第 2 页 专利 一种融合遥感数据与位置大数据的居民地提取方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:40:55上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。