(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210910959.3
(22)申请日 2022.07.29
(71)申请人 北京深演智能科技股份有限公司
地址 100020 北京市朝阳区东 三环中路20
号乐成中心 A901
(72)发明人 詹秋泉
(74)专利代理 机构 北京康信知识产权代理有限
责任公司 1 1240
专利代理师 张文华
(51)Int.Cl.
G06Q 30/02(2012.01)
G06K 9/62(2022.01)
(54)发明名称
确定有效样本的方法, 装置及电子设备
(57)摘要
本申请公开了一种确定有效样 本的方法, 装
置及电子设备。 其中, 该方法包括: 根据目标群体
的历史购买记录确定目标产品的第一复购周期;
根据第一复购周期确定有效正样本对应的滑动
时间窗口, 其中, 第一复购周期 越长, 滑动时间窗
口对应的时间长度越长; 获取目标群体对应的历
史正样本 数据, 其中, 历史正样本数据包括: 历史
时段具有复购行为的用户的数据; 根据滑动时间
窗口对历史正样本进行划分, 得到有效正样本。
本申请解决了由于相关技术中样本数据选择不
准确造成的模 型训练结果不佳, 无法精准识别潜
在的客户群 体的技术问题。
权利要求书2页 说明书9页 附图2页
CN 115311008 A
2022.11.08
CN 115311008 A
1.一种确定有效样本的方法, 其特 征在于, 包括:
根据目标群 体的历史购买记录确定目标产品的第一复购周期;
根据所述第一复购周期确定所述有效正样本对应的滑动 时间窗口, 其中, 所述第一复
购周期越长, 所述滑动时间窗口对应的时间长度越长;
获取所述目标群体对应的历史正样本数据, 其中, 所述历史正样本数据包括: 历史时段
具有复购行为的用户的数据;
根据所述滑动时间窗口对历史正样本进行划分, 得到有效正样本 。
2.根据权利要求1所述的方法, 其特征在于, 在根据 所述第一复购周期确定所述有效正
样本对应的滑动时间窗口之后, 所述方法还 包括:
获取滑动时间窗口对应的各个可选参数, 调用各个可选参数对应的预定模型对历史正
样本进行预测, 得到各个可选参数对应的各个预测准确率; 其中, 各个可选参数对应的预定
模型版本不同;
确定所述各个预测准确率中的最大值, 根据 所述最大值对应的目标可选参数调 整所述
滑动时间窗口 的大小。
3.根据权利要求2所述的方法, 其特征在于, 根据 所述最大值对应的目标可选参数调整
所述滑动时间窗口 的大小, 包括:
确定所述滑动时间窗口对应的起始时间;
确定所述目标可选参数与起始时间的乘积, 确定所述乘积为滑动时间窗口调整后的目
标起始时间。
4.根据权利要求2所述的方法, 其特征在于, 根据 所述最大值对应的目标可选参数调整
所述滑动时间窗口 的大小, 包括:
获取所述滑动时间窗口对应的时间长度;
确定所述目标可选参数与时间长度的乘积, 确定所述乘积为滑动时间窗口的最佳时间
长度。
5.根据权利要求1所述的方法, 其特征在于, 在根据 所述滑动时间窗口对历史正样本进
行划分, 得到有效正样本之后, 所述方法还 包括:
确定所述有效正样本与负 样本组成的模型 数据集;
将所述模型数据集划分为训练集与测试集, 基于机器学习 模型对所述训练集与测试集
进行训练得到复购分类识别模型。
6.根据权利要求5所述的方法, 其特征在于, 在基于机器学习模型对所述训练集与测试
集进行训练得到复购分类识别模型之后, 所述方法还 包括:
基于所述复购 分类识别 模型对样本数据进行预测, 得到模型打分结果, 其中, 所述模型
打分结果用于指示 目标对象发生复购行为的概率, 所述样本数据包括: 多个目标对 象的复
购行为特 征信息;
基于所述模型打分结果对所述多个目标对象进行划分, 得到不同复购意向等级的集
合, 其中, 所述打 分结果的分值越高, 所述复购意向等级越高。
7.根据权利要求1所述的方法, 其特征在于, 根据目标群体的历史购买记录确定目标产
品的第一复购周期, 包括:
解析所述目标群体的历史购买记录得到目标群体中各个对象对应的各个第二复购周权 利 要 求 书 1/2 页
2
CN 115311008 A
2期;
确定所述各个第 二复购周期对应的平均值, 确定所述平均值为所述目标产品的第 一复
购周期。
8.一种确定有效样本的装置, 其特 征在于, 包括:
第一确定模块, 用于根据目标群 体的历史购买记录确定目标产品的第一复购周期;
第二确定模块, 用于根据所述第一复购周期确定所述有效正样本对应的滑动时间窗
口, 其中, 所述第一复购周期越长, 所述滑动时间窗口对应的时间长度越长;
获取模块, 用于获取所述目标群体对应的历史正样本数据, 其中, 所述历史正样本数据
包括: 历史时段 具有复购行为的用户的数据;
划分模块, 用于根据所述滑动时间窗口对历史正样本进行划分, 得到有效正样本 。
9.一种非易失性存储介质, 其特征在于, 所述存储介质包括存储的程序, 其中, 在所述
程序运行时控制所述存储介质所在设备执行权利要求1至7中任意一项所述确定有效样本
的方法。
10.一种电子设备, 其特 征在于, 包括:
处理器;
用于存储所述处 理器可执行指令的存 储器;
其中, 所述处理器被配置为执行所述指令, 以实现如权利要求1至7中任一项所述的确
定有效样本的方法。权 利 要 求 书 2/2 页
3
CN 115311008 A
3
专利 确定有效样本的方法,装置及电子设备
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 06:33:29上传分享