(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210734947.X
(22)申请日 2022.06.27
(71)申请人 度小满科技(北京)有限公司
地址 100193 北京市海淀区西北旺东路10
号院西区4 号楼6层6 06室
(72)发明人 张凯昱 杨青
(74)专利代理 机构 北京启坤知识产权代理有限
公司 11655
专利代理师 李琛
(51)Int.Cl.
G06V 10/26(2022.01)
G06V 10/44(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
一种用于图像分割的方法和装置
(57)摘要
本发明的目的是提供一种用 于图像分割的
方法和装置。 所述方法包括: 进行图像分割操作
时, 对于获取到的对应于同一特征层的特征, 使
用不同膨胀率的空洞卷积对这些特征执行第一
融合操作, 以完成相同特征层不同尺 寸的特征的
融合; 对于不同特征层不同尺寸的特征, 采用跳
跃连接的方式对这些特征执行第二融合操作, 以
完成不同特征层不同尺寸的特征融合。 本申请实
施例具有以下优点: 实现了将不同特征层的特征
与不同尺 寸的特征融合进行融合, 解决了现有技
术方案无法对不同特征层上不同尺寸的特征进
行融合的问题, 提升 了算法模型的性能。
权利要求书1页 说明书8页 附图2页
CN 115035301 A
2022.09.09
CN 115035301 A
1.一种用于图像分割的方法, 其中, 所述方法包括:
进行图像分割操作时, 对于获取到的对应于同一特征层的特征, 使用不同膨胀率的空
洞卷积对这些 特征执行第一融合操作, 以完成相同特 征层不同尺寸的特 征的融合;
对于不同特征层不同尺寸的特征, 采用跳跃连接的方式对这些特征执行第二融合操
作, 以完成不同特 征层不同尺寸的特 征融合。
2.根据权利要求1所述的方法, 其中, 所述采用跳跃连接的方式将这些特征进行第 二融
合操作, 采用跳跃 连接的方式将这些 特征进行第二融合操作包括:
对于获取到的不同特征层不同尺寸的特征, 基于U ‑Net结构中跳跃连接的方式, 将每个
特征层不同尺寸的特征与上采样层中该特征层的对称层上的特征进行拼接, 以完成不同特
征层不同尺寸的特 征融合。
3.根据权利要求1所述的方法, 其中, 所述方法包括:
采用神经网络 搜索的方法对下采样层和上采样层的单 元结构进行搜索。
4.根据权利要求3所述的方法, 其中, 所述方法包括:
基于逐层型的方式构建下采样层和上采样层的搜索单 元;
其中, 在下采样层中的搜索单元中使用常规卷积、 逐通道卷积加逐点卷积和池化操作
组成候选算子, 在上采样层的搜索单 元中使用转置卷积和上采样与1x1卷积构成候选算子 。
5.根据权利要求3或4所述的方法, 其中, 所述方法包括:
通过进行网络训练, 得到训练后的下采样层和上采样层搜索单元的算子的权重参数和
网络结构参数。
6.根据权利要求5所述的方法, 其中, 所述网络训练 的过程包括模型搜索阶段和模型微
调阶段, 所述方法包括:
在网络搜索阶段, 使用训练集和验证集交替训练训练下采样层和上采样层搜索单元的
算子的权 重参数和网络结构参数, 直至损失函数收敛;
在模型微调阶段, 选取各个搜索单元中结构参数最大的算子, 使用选取的算子与尺寸
为1、 通道数为类别数的卷积核构成新的网络, 之后对该网络从头训练, 直至模型收敛。
7.一种用于图像分割的装置, 其中, 所述装置包括:
用于进行图像分割操作时, 对于获取到的对应于同一特征层的特征, 使用不同膨胀率
的空洞卷积对这些特征执行第一融合操作, 以完成相同特征层不同尺寸的特征的融合的装
置;
用于对于不同特征层不同尺寸的特征, 采用跳跃连接的方式对这些特征执行第 二融合
操作, 以完成不同特 征层不同尺寸的特 征融合的装置 。
8.根据权利要求7 所述的装置, 其中, 所述装置包括:
用于采用神经网络 搜索的方法对下采样层和上采样层的单 元结构进行搜索的装置 。
9.一种计算机设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计
算机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1至6中任一所述的方
法。
10.一种计算机可读的存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理
器执行时实现如权利要求1至 6中任一项所述的方法。权 利 要 求 书 1/1 页
2
CN 115035301 A
2一种用于图像分割的方 法和装置
技术领域
[0001]本发明涉及计算机技 术领域, 尤其涉及一种用于图像分割的方法和装置 。
背景技术
[0002]处理图像分割任务的算法通过对图像中的每个像素进行分类, 将图像中具有相同
性质的像素进行整合, 以提取图像矩阵中符合任务目标的区域。
[0003]基于现有技术的方案, 主流的图像分割算法一般是通过若干步长大于1的卷积层
级联的方式, 实现图像深层特征拥有较大感受野的目标。 虽然多个卷积层的级联有助于感
受野的提升, 但是图像特征分辨率的逐层 减小会带来有效信息的损失。 另一方面, 级联卷积
层的算法结构丧失了算法本身对各个层级特征 的复用, 进一步降低了此类算法的性能。 并
且, 基于现有技 术的方案的图像分割方法无法实现不同层级、 不同尺寸特 征的融合。
发明内容
[0004]本发明的目的是提供一种用于图像分割的方法和装置 。
[0005]根据本申请的实施例, 提供了一种用于图像分割的方法, 其中, 所述方法包括:
[0006]进行图像分割操作时, 对于获取到 的对应于同一特征层的特征, 使用不 同膨胀率
的空洞卷积对这些 特征执行第一融合操作, 以完成相同特 征层不同尺寸的特 征的融合;
[0007]对于不同特征层不同尺寸的特征, 采用跳跃连接的方式对这些特征执行第二融合
操作, 以完成不同特 征层不同尺寸的特 征融合。
[0008]根据本申请的实施例, 提供了一种用于图像分割的装置, 其中, 所述装置包括:
[0009]用于进行 图像分割操作时, 对于获取到 的对应于同一特征层的特征, 使用不 同膨
胀率的空洞卷积对这些特征执行第一融合操作, 以完成相同特征层不同尺寸的特征的融合
的装置;
[0010]用于对于不同特征层不同尺寸的特征, 采用跳跃连接的方式对这些特征执行第二
融合操作, 以完成不同特 征层不同尺寸的特 征融合的装置 。
[0011]根据本申请的实施例, 提供了一种计算机设备, 包括存储器、 处理器及存储在存储
器上并可在处理器上运行 的计算机程序, 其特征在于, 所述处理器执行所述程序时实现本
申请实施例的方法。
[0012]根据本申请的实施例, 提供了一种计算机可读的存储介质, 其上存储有计算机程
序, 其特征在于, 该程序被处 理器执行时实现本申请实施例的方法。
[0013]与现有技术相比, 本申请实施例 具有以下优点: 根据本申请实施例的方案在进行
图像分割时, 分别基于对应于同一特征层的不同尺寸的特征和对应于不同特征层不同尺寸
的特征进行融合, 从而实现了将不同特征层的特征与不同尺寸的特征进行融合, 解决了现
有技术方案无法对不同特征层上不同尺寸的特征进行融合的问题, 提升了算法模型的性
能; 并且, 根据本申请实施例的方案通过使用神经网络搜索的方法, 扩展了模型的表达能
力。说 明 书 1/8 页
3
CN 115035301 A
3
专利 一种用于图像分割的方法和装置
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:40:53上传分享