1.一种广告精准投放优化方法,其特征在于,包括以下步骤:
实时收集和记录不同数据源在合并过程中的关键参数信息,为后续的异常检测提供基础数据,为确保数据的全面性,记录所有合并过程中的每一步操作;
对规范化处理后的关键参数信息进行异常分析,通过对多维度信息的分析,识别出合并过程中产生的异常数据;
基于异常分析结果,将异常分析处理后的参数信息输入预先训练好的机器学习模型中,通过机器学习模型识别出潜在的异常;
对识别出的不同数据源潜在异常合并进一步综合分析,判断数据合并潜在异常风险等级,针对不同潜在异常风险等级采取不同应对措施。
2.根据权利要求1所述的一种广告精准投放优化方法,其特征在于:不同数据源在合并过程中生成的参数信息包括跨会话持久性信息和平台情境一致性信息,跨会话持久性信息指的是用户在不同会话之间的行为一致性和连贯性,平台情境一致性信息是用于衡量用户在不同平台上的行为模式和兴趣是否一致。
3.根据权利要求2所述的一种广告精准投放优化方法,其特征在于:获取到不同数据源在合并过程中生成的跨会话持久性信息和平台情境一致性信息后,对跨会话持久性信息进行异常分析后生成跨会话持久性指数,对平台情境一致性信息进行异常分析后生成平台情境一致性指数,通过跨会话持久性指数和平台情境一致性指数识别出不同数据源在合并时的产生的异常数据。
4.根据权利要求3所述的一种广告精准投放优化方法,其特征在于:获取到不同数据源在合并过程中生成的跨会话持久性指数和平台情境一致性指数后,将跨会话持久性指数和平台情境一致性指数输入至预先训练好的机器学习模型中,通过机器学习模型生成合并异常系数,通过合并异常系数对不同数据源合并过程进行智能化评估。
5.根据权利要求4所述的一种广告精准投放优化方法,其特征在于:将不同数据源在合并过程中生成的合并异常系数与预先设定的合并异常系数参考阈值进行比对分析,分析结果如下:若合并异常系数大于等于预先设定的合并异常系数参考阈值,则生成异常合并过程信号,表明不同数据源在合并过程中处于异常状态;
若合并异常系数小于预先设定的合并异常系数参考阈值,则生成正常合并过程信号,表明不同数据源在合并过程中处于稳定状态。
6.根据权利要求5所述的一种广告精准投放优化方法,其特征在于:当不同数据合并时生成异常合并过程信号后,持续获取不同数据源在合并过程中生成的若干个合并异常系数建立分析集合,将分析集合内的合并异常系数与第一等级参考阈值和第二等级参考阈值以及合并异常系数参考阈值进行对比,其中,第二等级参考阈值大于第一等级参考阈值,第一等级参考阈值大于合并异常系数参考阈值,将合并异常系数与第二等级参考阈值、第一等级参考阈值以及合并异常系数参考阈值进行对比分析,将小于第一等级参考阈值且大于等于合并异常系数参考阈值的合并异常系数的数量标定为Qa,将小于第二等级参考阈值且大于等于第一等级参考阈值的合并异常系数的数量标定为Qb,将大于等于第二等级参考阈值的合并异常系数的数量标定为Qc;
将Qa、Qb、Qc进行综合分析,生成异常风险指数ARI,依据的公式为:
,
式中,w1、w2、w3分别为Qa、Qb、Qc的权重系数,且w1、w2、w3,均大于0。
7.根据权利要求6所述的一种广告精准投放优化方法,其特征在于:将生成的异常风险指数与预先设定的第一异常风险指数参考阈值和第二异常风险指数参考阈值进行对比分析,判断数据合并潜在异常风险等级,分析结果如下:若异常风险指数小于第一异常风险指数参考阈值,则将数据合并潜在异常风险等级划分为低风险异常;
若异常风险指数大于等于第一异常风险指数小于等于第二异常风险指数,则将数据合并潜在异常风险等级划分为中风险异常;
若异常风险指数大于等于第二异常风险指数,则将数据合并潜在异常风险等级划分为高风险异常。
8.根据权利要求3所述的一种广告精准投放优化方法,其特征在于,对跨会话持久性信息进行异常分析后,生成跨会话持久性指数的逻辑如下:在检测窗口下,采集用户在多个设备或会话中的关键行为数据,关键行为数据包括,设备每个会话的开始时间Ts和结束时间Te、平台来源标识符Pi以及会话IP地址信息IPi,Di表示第i个会话的用户的设备ID,Pi表示第i个会话的平台来源标识符,IPi表示第i个会话IP地址信息;
系统通过获取的关键行为数据建立跨会话的关联关系,并为每个用户行为匹配一个持久性度量,来评估不同设备或会话间行为的匹配度,计算表达式如下:Mij=f(Di,Dj)+g(pi,pj)+h(IPi,IPj),式中,Mij表示会话i和会话j的匹配度,f(Di,Dj)是设备ID的一致性函数,表示第i和第j个会话之间的设备ID的匹配度,g(pi,pj)是平台来源标识符一致性函数,表示第i和第i个会话之间的平台来源标识符的匹配度,h(IPi,IPj)是IP地址信息一致性函数,表示第i和第j个会话之间的会话IP地址信息的匹配度;
系统为每个会话匹配对应用时间权重,时间权重考虑会话的时间跨度和不同会话之间的时间差距,以评估跨时间段行为的一致性,计算表达式如下:式中,Wtime(Ts,Te)表示时间权重,α是时间敏感度参数;
为了识别异常情况,需要计算跨会话的异常系数,计算表达式如下:Aij=1-Wtime(Ts,Te)·Mij,式中,Aij表示第i和第j个会话之间的异常系数;
通过对所有异常系数进行综合处理,生成一个量化的持久性评估值,生成跨会话持久性指数,计算表达式如下:,
式中,CSP表示跨会话持久性指数,n表示会话的总数,ln(1+Mij)是匹配度的对数修正项。
9.根据权利要求3所述的一种广告精准投放优化方法,其特征在于,对平台情境一致性信息进行异常分析后,生成平台情境一致性指数的逻辑如下:在检测窗口下,采集用户在不同平台上的行为数据,包括行为类型Bs和内容分类Cs,其中,Bs={B1、B2、B3、……、Bz},Cs={C1、C2、C3、……、Cz},式中,z表示平台总数,行为类型Bs表示用户在平台s上的行为类型,内容分类Cs表示用户在平台s上互动的内容类别;
基于用户在不同平台的行为数据,计算用户在各平台上的行为一致性偏差系数,行为一致性偏差系数反映了用户在不同平台上行为的差异程度,计算表达式如下:Ds=|u(Bs,Cs)-u(Bt,Ct)|,式中,Ds表示行为一致性偏差系数,Bs和Cs分别表示用户在平台s的行为类型和内容类别,Bt和Ct表示用户在平台t的行为类型和内容类别,u(x)是用于量化行为类型与内容类别的非线性映射函数;
不同平台上的用户行为对一致性的影响权重不同,因此为不同类型的平台设定不同的权重系数,计算调整后的行为一致性偏差系数,计算表达式如下:Ws=Ds×λs,式中,Ws是调整后的行为一致性偏差系数,λs是平台s的权重系数,反映平台上用户行为对一致性的影响权重:考虑到用户在不同平台上的情境差异,引入关联情境系数来调整偏差系数,进一步精确一致性计算,计算表达式如下:As=Ws·γ(Us,Ls),式中,As表示关联情境系数调整后的偏差系数,Us表示平台s的时间情境,Ls表示平台s的地理情境,γ(Us,Ls)表示时间与地理情境函数,反映用户在不同时间段和地点的使用习惯对行为一致性的影响;
通过非线性加权整合多个平台的偏差系数,生成平台情境一致性指数,计算表达式如下:
,
式中,PCC表示平台情境一致性指数,μs表示用户与平台s的交互频率。
10.一种广告精准投放优化系统,用于实现上述权利要求1-9中任意一项所述的一种广告精准投放优化方法,其特征在于,包括数据收集与记录模块、异常分析模块、机器学习异常识别模块以及异常风险评估与应对模块;
数据收集与记录模块,实时收集和记录不同数据源在合并过程中的关键参数信息,为后续的异常检测提供基础数据,为确保数据的全面性,记录所有合并过程中的每一步操作;
异常分析模块,对规范化处理后的关键参数信息进行异常分析,通过对多维度信息的分析,识别出合并过程中产生的异常数据;
机器学习异常识别模块,基于异常分析结果,将异常分析处理后的参数信息输入预先训练好的机器学习模型中,通过机器学习模型识别出潜在的异常;
异常风险评估与应对模块,对识别出的不同数据源潜在异常合并进一步综合分析,判断数据合并潜在异常风险等级,针对不同潜在异常风险等级采取不同应对措施。