(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211119318.2
(22)申请日 2022.09.14
(71)申请人 山东科技大 学
地址 266590 山东省青岛市黄岛区前湾港
路579号
(72)发明人 刘振 刘昊 曾侃 马佑军
吕如茵 孙雪 刘如飞 苏辕
(74)专利代理 机构 青岛智地领创专利代理有限
公司 37252
专利代理师 王鸣鹤
(51)Int.Cl.
G06V 20/13(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06V 10/764(2022.01)G06V 10/82(2022.01)
(54)发明名称
一种基于深度学习的遥感影像养殖区域提
取方法
(57)摘要
本发明涉及遥感影像技术领域, 特别涉及一
种基于深度学习的遥感影像养殖区域提取方法,
包括: 获取若干景高分二号遥感图像数据, 对遥
感图像数据进行遥感图像预处理, 包括地理校
正、 辐射定标、 大气校正和图像裁剪, 针对不同养
殖区域对S2中图像裁剪后的数据进行标注,对 标
注后的数据按照8:2的比例分割成训练集、 验证
集, 基于训练集构建深层神经网络模型, 将验证
集输入S4中训练完的深层神经网络模型中, 得到
分类后的养殖区域结果。 本发明的有益效果是:
鲁棒性强, 抗环境干扰能力强, 兼具底层和高层
特征, 有效提取养殖区域, 具有较强的抗环境干
扰能力, 针对不同地区、 类别的养殖区域适应性
好, 采用像素分类, 识别精确性高。
权利要求书2页 说明书5页 附图6页
CN 115546656 A
2022.12.30
CN 115546656 A
1.一种基于深度学习的遥感影 像养殖区域 提取方法, 其特 征在于, 包括:
S1、 获取若干景高分二 号遥感图像数据;
S2、 对遥感图像数据进行遥感图像预处理, 包括地理校正、 辐射定标、 大气校正和图像
裁剪;
S3、 针对不同养殖 区域对S2中图像裁剪后的数据进行标注,对标注后的数据按照8:2的
比例分割成训练集、 验证集;
S4、 基于训练集构建深层神经网络模型;
S5、 将验证集输入S4中训练完毕的深层神经网络模型中, 得到分类后的养殖区域结果。
2.如权利要求1所述的一种基于深度 学习的遥感影像养殖区域提取方法, 其特征在于,
S3中, 使用多边形标注工具进 行标注, 根据不同养殖区域的特征将养殖区域分为三类, 对于
非目标的其 他像素统一标注为 一类。
3.如权利要求2所述的一种基于深度 学习的遥感影像养殖区域提取方法, 其特征在于,
S4中, 构建深层神经网络结构包括使用残差层增加训练梯度、 使用空洞金字塔池化获取多
尺度信息和导入输出层还原分类结果;
对深层神经网络模型设置超参数, 基于训练集对深层神经网络模型进行训练, 使用随
机梯度下降算法迭代求 解能最小化损失函数的网络参数。
4.如权利要求3所述的一种基于深度 学习的遥感影像养殖区域提取方法, 其特征在于,
S4中, 深层神经网络模型包括残差层、 空洞金字塔和输出层;
480×480×3的图像为输入时, 将图像输入残差层进行四次下采样, 提升图像的通道数
且增加特征数量, 得到60 ×60×2048的第一特征图, 将第一特征图输入空洞金字塔提取并
融合特征, 得到60 ×60×256的第二特征图, 将第二特征图输入到输出层得到60 ×60×num_
class的分类后图像, 再进行二次线性插值得到480 ×480×num_class的图像, 即为对养殖
区域的分类预测结果。
5.如权利要求4所述的一种基于深度 学习的遥感影像养殖区域提取方法, 其特征在于,
S4中, 所述残差层使用残差网络对输入图像进行 特征提取, 分为五层:
在第一层中, 使用0对图像进行3 ×3填充, 然后使用7 ×7的卷积核, 选取步长为2对图像
进行卷积, 使图像下采样到原本尺寸的1/2, 并将通道数扩充至64, 之后对图像进行最大池
化, 进一步将图像下采样至原本尺寸的1/4;
第二层由三个结构相同的残差单元构 成, 该残差单元首先使用1 ×1的卷积核将图像通
道数下降为64, 然后使用3 ×3的卷积核提取图像特征信息, 最后使用1 ×1的卷积核将图像
通道数扩展为25 6, 并计算残差作为输出;
在三个相同的残差单元中重复三 次, 该层中所有卷积均设置步长为1, 输出尺寸仍为原
图像尺寸1/4, 通道数为25 6的图像;
第三层由四个结构相同的残差单元构 成, 该残差单元首先使用1 ×1的卷积核将图像通
道数下降至128, 然后使用3 ×3的卷积提取图像特征, 最后使用1 ×1的卷积核将图像通道数
设置为512, 并计算残差作为输出;
在四个相同的残差单元中重复四次, 其中第一个残差单元中卷积步长设置为2, 输出图
像下采样为原图尺寸的1/8, 通道数为512;
第四层由一个瓶颈层和五个相同的残差单元构 成, 瓶颈层首先使用1 ×1的卷积核将图权 利 要 求 书 1/2 页
2
CN 115546656 A
2像通道数下降至256, 然后使用膨胀系数为1的3 ×3的卷积提取图像特征, 最后使用1 ×1的
卷积核将图像通道数提升为1024, 并计算残差作为输出;
残差单元首先使用1 ×1的卷积核将图像通道数下降至256, 然后使用膨胀系数为2的3
×3的卷积核做膨胀卷积提取更大尺度图像特征, 最后使用1 ×1的卷积核将图像通道数设
置为1024, 并计算残差作为输出, 在五个相同的残差单元中重复五次, 没有进一步下采样,
输出图像为原图尺寸的1/8, 通道数为1024;
第五层由一个瓶颈层和两个相同的残差单元构 成, 瓶颈层首先使用1 ×1的卷积核将图
像通道数下降至512, 然后使用膨胀系数为2的3 ×3的卷积核进 行膨胀卷积进一步提取图像
特征, 最后使用1 ×1的卷积核将图像通道数提升为2048, 并计算残差作为输出;
残差单元首先使用1 ×1的卷积核将图像通道数下降至512, 然后使用膨胀系数为4的3
×3的卷积核做膨胀卷积提取更大尺度图像特征, 最后使用1 ×1的卷积核将图像通道数设
置为2048, 并计算残差作为输出, 在两个相同的残差单元中重复两次, 没有进一步下采样,
输出图像为原图尺寸的1/8, 通道数为2048。
6.如权利要求5所述的一种基于深度 学习的遥感影像养殖区域提取方法, 其特征在于,
S4中, 空洞金字塔包括五个并行的分支:
第一分支由无填充、 膨胀系数为1、 步长为1的1 ×1卷积层构成;
第二分支使用0对图像进行12 ×12填充, 然后使用3 ×3的卷积核, 选取步长为1, 膨胀系
数为12对图像进行膨胀卷积;
第三分支使用0对图像进行24 ×24填充, 然后使用3 ×3的卷积核, 选取步长为1, 膨胀系
数为24对图像进行膨胀卷积;
第四分支使用0对图像进行36 ×36填充, 然后使用3 ×3的卷积核, 选取步长为1, 膨胀系
数为36对图像进行膨胀卷积;
第五分支对输入图像进行全局平均池化提取每个通道上的高层信 息, 之后使用二 次线
性插值将图像尺寸还原。
7.如权利要求6所述的一种基于深度 学习的遥感影像养殖区域提取方法, 其特征在于,
S4中, 输出层首先使用3 ×3的卷积将空洞金字塔输出的五个并行的分支连接成为一个尺 寸
为原图1/8, 通道数为1280的特征图像, 之后使用一个1 ×1卷积, 改变输出通道数为num_
class, 再将num_class张特征图使用二次线性插值的方式将图像上采样八倍得到和输入图
像尺寸一致的分类结果图。
8.如权利要求7所述的一种基于深度 学习的遥感影像养殖区域提取方法, 其特征在于,
所有卷积层均采用relu激活函数。
9.如权利要求8所述的一种基于深度 学习的遥感影像养殖区域提取方法, 其特征在于,
残差的定义为: res=f(x)+x, 其中, res表示残差值, f(x)表示卷积层输出值, x表示卷积层
输入值。权 利 要 求 书 2/2 页
3
CN 115546656 A
3
专利 一种基于深度学习的遥感影像养殖区域提取方法
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:04:49上传分享