1.一种广告投放效果评估方法,其特征在于,包括:实时获取每条投放广告对应的反馈信息;
基于设定规则将所述反馈信息分配至预设的多个局部聚类模块中的其中一个局部聚类模块;
通过所述局部聚类模块对所述反馈信息进行聚类运算,得到第一设定数量的聚类中心;
将预设的各局部聚类模块运算得到的多个聚类中心实时地发送至全局聚类模块;
通过所述全局聚类模块对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心;
根据所述第二设定数量的目标聚类中心以及所述反馈信息对每条投放广告的投放效果进行评估;
其中,所述预设的多个局部聚类模块的数量为至少两个,所述反馈信息包括投放广告的属性信息以及用户对所述投放广告的需求信息;
所述通过所述全局聚类模块对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心之后,所述方法还包括:将所述第二设定数量的目标聚类中心发送至先验知识存储模块,以使所述先验知识存储模块对其存储的先验知识进行更新;
所述通过所述全局聚类模块对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心,包括:
在所述全局聚类模块中采用任务机制;所述任务机制具体指在每一批来自多个所述局部聚类模块的聚类中心到达时新建一个事务来临时存储所述聚类中心、运行聚类算法和记录聚类结果,所述事务执行完成将自动关闭;
在所述通过所述局部聚类模块对所述反馈信息进行聚类运算,得到第一设定数量的聚类中心之前,所述方法还包括:从所述先验知识存储模块中获取先验知识;
基于所述先验知识对所述局部聚类模块进行初始化。
2.根据权利要求1所述的方法,其特征在于,所述基于设定规则将所述反馈信息分配至预设的多个局部聚类模块中的其中一个局部聚类模块,包括:通过反馈信息分发模块基于时间顺序对每条投放广告对应的反馈信息进行时间编号;
将每条所述反馈信息对应的时间编号分别与预设的局部聚类模块的总个数进行取余操作,得到取余结果;
将所述反馈信息分配至序号为所述取余结果的局部聚类模块。
3.根据权利要求1所述的方法,其特征在于,所述通过所述全局聚类模块对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心,包括:通过所述全局聚类模块基于K‑means++聚类算法对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心。
4.根据权利要求1所述的方法,其特征在于,所述根据所述第二设定数量的目标聚类中心以及所述反馈信息对每条投放广告的投放效果进行评估,包括:分别计算各所述目标聚类中心对应的类簇中所述反馈信息的数量;
根据各类簇中所述反馈信息的数据量对每条投放广告的投放效果进行评估。
5.根据权利要求1‑4中任一项所述的方法,其特征在于,还包括:通过特征向量的方式对每个类簇中的元素进行数据压缩处理。
6.根据权利要求5所述的方法,其特征在于,所述通过特征向量的方式对每个类簇中的元素进行数据压缩处理,包括:按照如下公式对每个类簇中的元素进行数据压缩处理:其中, 表示类簇c的特征向量, 表示类簇c中各元素的各维度特征值的平t
方和, 表示类簇c中各元素的各维度特征值的和,CF2表示类簇c中各元素对应的时间t
编号的平方和,CF1表示类簇c中各元素对应的时间编号的和,n为类簇c内元素的数量。
7.根据权利要求6所述的方法,其特征在于,所述通过所述局部聚类模块对所述反馈信息进行聚类运算,得到第一设定数量的聚类中心,包括:分别计算所述反馈信息与所述局部聚类模块中已有的各类簇对应的聚类中心之间的距离;
若所述反馈信息与所述各类簇中的其中一个类簇对应的聚类中心之间的距离小于所述其中一个类簇的邻域半径,则将所述反馈信息融入至所述其中一个类簇中,并基于设定聚类算法对所述局部聚类模块中当前的各类簇进行运算,得到第一设定数量的聚类中心;
若所述反馈信息与所述各类簇对应的聚类中心之间的距离均不小于所述各类簇对应的邻域半径,则对所述局部聚类模块中已有的各类簇进行合并或者删除操作,并以所述反馈信息为元素创建一个新的类簇,并基于设定聚类算法对所述局部聚类模块中当前的各类簇进行运算,得到第一设定数量的聚类中心。
8.根据权利要求7所述的方法,其特征在于,所述各类簇对应的邻域半径为:其中,r(c)表示类簇c对应的邻域半径,other表示距离类簇c最近的类簇,nc表示类簇c中元素的数量,nother表示类簇other中元素的数量, 表示类簇c中元素的均方根值, 表示类簇c中元素的平均值, 表示 与 之间的欧氏距离, 表示类簇other中元素的平均值, 表示与 之间的欧氏距离。
9.根据权利要求7所述的方法,其特征在于,所述对所述局部聚类模块中已有的各类簇进行合并或者删除操作,包括:基于所述局部聚类模块中已有的各类簇中元素的数量以及元素的新旧程度确定各类簇的活跃程度;
若存在活跃程度低于设定值的类簇,则将活跃程度低于设定值的类簇删除;
若不存在活跃程度低于设定值的类簇,则将距离最近的两个类簇合并成一个类簇。
10.根据权利要求9所述的方法,其特征在于,所述基于所述局部聚类模块中已有的各类簇中元素的数量以及元素的新旧程度确定各类簇的活跃程度,包括:统计所述各类簇中最新的设定数量的元素的融入时间;
计算所述各类簇中最新的设定数量的元素的平均融入时间;
将所述各类簇中最新的设定数量的元素的平均融入时间确定为各类簇的活跃程度。
11.根据权利要求9所述的方法,其特征在于,所述将距离最近的两个类簇合并成一个类簇,包括:
将所述距离最近的两个类簇分别对应的特征向量相加;
将相加之后的特征向量作为所述距离最近的两个类簇合并之后的新类簇的特征向量。
12.一种广告投放效果评估装置,其特征在于,所述装置包括:获取模块,用于实时获取每条投放广告对应的反馈信息;
分配模块,用于基于设定规则将所述反馈信息分配至预设的多个局部聚类模块中的其中一个局部聚类模块;
第一聚类模块,用于通过所述局部聚类模块对所述反馈信息进行聚类运算,得到第一设定数量的聚类中心;
发送模块,用于将预设的各局部聚类模块运算得到的多个聚类中心实时地发送至全局聚类模块;
第二聚类模块,用于通过所述全局聚类模块对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心;
评估模块,用于根据所述第二设定数量的目标聚类中心以及所述反馈信息对每条投放广告的投放效果进行评估;
其中,所述预设的多个局部聚类模块的数量为至少两个,所述反馈信息包括投放广告的属性信息以及用户对所述投放广告的需求信息;
所述通过所述全局聚类模块对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心之后,还包括:将所述第二设定数量的目标聚类中心发送至先验知识存储模块,以使所述先验知识存储模块对其存储的先验知识进行更新;
所述通过所述全局聚类模块对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心,包括:
在所述全局聚类模块中采用任务机制;所述任务机制具体指在每一批来自多个所述局部聚类模块的聚类中心到达时新建一个事务来临时存储所述聚类中心、运行聚类算法和记录聚类结果,所述事务执行完成将自动关闭;
在所述通过所述局部聚类模块对所述反馈信息进行聚类运算,得到第一设定数量的聚类中心之前,还包括:
从所述先验知识存储模块中获取先验知识;
基于所述先验知识对所述局部聚类模块进行初始化。
13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1‑11中任一项所述的广告投放效果评估方法。
14.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时实现如权利要求1‑11中任一项所述的广告投放效果评估方法。