1.一种将Wi-Fi信号发射设备定位到地理信息点的方法,其特征在于,所述方法包括:根据预存的各个Wi-Fi信号发射设备的位置信息以及各个地理信息点的位置信息,得到各个地理信息点所对应的候选Wi-Fi信号发射设备集合;
针对每个地理信息点,分别获取所述地理信息点的名称与所述地理信息点所对应的候选Wi-Fi信号发射设备集合中的各个候选Wi-Fi信号发射设备对应的服务集标识的语义相似度;
针对每个地理信息点,将与所述地理信息点的名称的语义相似度最高的服务集标识对应的候选Wi-Fi信号发射设备与所述地理信息点关联保存。
2.根据权利要求1所述的方法,其特征在于,所述根据预存的各个Wi-Fi信号发射设备的位置信息以及各个兴趣点地理信息点的位置信息,得到各个地理信息点所对应的候选Wi-Fi信号发射设备集合,包括:针对每个所述地理信息点,将位置与所述地理信息点的位置之间的距离小于等于预定阈值的Wi-Fi信号发射设备作为所述地理信息点对应的候选Wi-Fi信号发射设备集合中的候选Wi-Fi信号发射设备。
3.根据权利要求1或2所述的方法,其特征在于,在获取所述地理信息点的名称与所述地理信息点所对应的候选Wi-Fi信号发射设备集合中的各个候选Wi-Fi信号发射设备对应的服务集标识的语义相似度之前,所述方法还包括:针对每个地理信息点,将对应的服务集标识为初始词的候选Wi-Fi信号发射设备从所述地理信息点所对应的候选Wi-Fi信号发射设备集合中删除,其中,所述初始词为与所述服务集标识对应的MAC地址相匹配的词。
4.根据权利要求1所述的方法,其特征在于,所述分别获取所述地理信息点的名称与所述地理信息点所对应的候选Wi-Fi信号发射设备集合中的各个候选Wi-Fi信号发射设备对应的服务集标识的语义相似度,包括:将各个所述服务集标识中的无权词去除,并将所述服务集标识中保留的词作为所述服务集标识的有权词,其中,所述无权词包括:预存的服务集标识无权词知识库中的词;
将所述地理信息点的名称中的名称高频词去除,并将所述名称中保留的词作为所述地理信息点对应的有权词,其中,所述名称高频词包括预存的地理信息点名称高频词知识库中的词;
通过TF-IDF算法获取各个所述服务集标识以及所述地理信息点对应的有权词中各个有权词的权重;
根据所述地理信息点对应的有权词、所述地理信息点对应的有权词的权重、各个所述服务集标识的有权词、各个所述服务集标识的有权词的权重,获取所述地理信息点的名称与所述地理信息点所对应的候选Wi-Fi信号发射设备集合中的各个候选Wi-Fi信号发射设备对应的服务集标识的语义相似度。
5.根据权利要求4所述的方法,其特征在于,所述将各个所述服务集标识中的无权词去除,包括:对各个所述服务集标识进行分词;
将各个所述服务集标识中的词逐一与预存的服务集标识无权词知识库中的词进行匹配,得到各个所述服务集标识中的无权词;
将所述无权词从各个所述服务集标识中去除。
6.根据权利要求5所述的方法,其特征在于,所述服务集标识无权词知识库包括服务集标识高频词知识库以及无义词知识库。
7.根据权利要求4所述的方法,其特征在于,所述将所述地理信息点的名称中的高频词去除,包括:对所述地理信息点的名称进行分词;
将所述地理信息点的名称中的词逐一与预存的地理信息点名称高频词知识库中的词进行匹配,得到所述地理信息点的名称中的高频词;
将所述高频词从所述地理信息点的名称中去除。
8.根据权利要求4所述的方法,其特征在于,在获取所述地理信息点的名称与所述地理信息点所对应的候选Wi-Fi信号发射设备集合中的各个候选Wi-Fi信号发射设备对应的服务集标识的语义相似度之前,所述方法还包括:根据所述各个有权词确定所述地理信息点对应的行业;
将所述各个有权词逐一与所述行业对应的行业细化词知识库进行匹配;
提高与所述行业细化词知识库匹配成功的有权词的权重,降低所述各个有权词中的地域类词的权重。
9.根据权利要求4-8任一所述的方法,其特征在于,所述根据所述地理信息点对应的有权词、所述地理信息点对应的有权词的权重、各个所述服务集标识的有权词、各个所述服务集标识的有权词的权重,获取所述地理信息点的名称与所述地理信息点所对应的候选Wi-Fi信号发射设备集合中的各个候选Wi-Fi信号发射设备对应的服务集标识的语义相似度,包括:根据所述地理信息点对应的有权词、所述地理信息点对应的有权词的权重、各个所述服务集标识的有权词、各个所述服务集标识的有权词的权重,通过向量空间模型获取所述地理信息点的名称与所述各个服务集标识的语义相似度。
10.一种将Wi-Fi信号发射设备定位到地理信息点的装置,其特征在于,所述装置包括:候选设备确定单元,用于根据预存的各个Wi-Fi信号发射设备的位置信息以及各个地理信息点的位置信息,得到各个地理信息点所对应的候选Wi-Fi信号发射设备集合;
相似度确定单元,用于针对每个地理信息点,分别获取所述地理信息点的名称与所述地理信息点所对应的候选Wi-Fi信号发射设备集合中的各个候选Wi-Fi信号发射设备对应的服务集标识的语义相似度;
关联单元,用于针对每个地理信息点,将与所述地理信息点的名称的语义相似度最高的服务集标识对应的候选Wi-Fi信号发射设备与所述地理信息点关联保存。
11.根据权利要求10所述的装置,其特征在于,所述候选设备确定单元进一步配置用于针对每个所述地理信息点,将位置与所述地理信息点的位置之间的距离小于等于预定阈值的Wi-Fi信号发射设备作为所述地理信息点对应的候选Wi-Fi信号发射设备集合中的候选Wi-Fi信号发射设备。
12.根据权利要求10或11所述的装置,其特征在于,所述装置还包括:候选设备缩减单元,用于在获取所述地理信息点的名称与所述地理信息点所对应的候选Wi-Fi信号发射设备集合中的各个候选Wi-Fi信号发射设备对应的服务集标识的语义相似度之前,针对每个地理信息点,将对应的服务集标识为初始词的候选Wi-Fi信号发射设备从所述地理信息点所对应的候选Wi-Fi信号发射设备集合中删除,其中,所述初始词为与所述服务集标识对应的MAC地址相匹配的词。
13.根据权利要求10所述的装置,其特征在于,所述相似度确定单元包括:
服务集标识无权词去除子单元,用于将各个所述服务集标识中的无权词去除,并将所述服务集标识中保留的词作为所述服务集标识的有权词,其中,所述无权词包括:预存的服务集标识无权词知识库中的词;
地理信息点高频词去除子单元,用于将所述地理信息点的名称中的名称高频词去除,并将所述名称中保留的词作为所述地理信息点对应的有权词,其中,所述名称高频词包括预存的地理信息点名称高频词知识库中的词;
权重获取子单元,用于通过TF-IDF算法获取各个所述服务集标识以及所述地理信息点对应的有权词中各个有权词的权重;
相似度确定子单元,用于根据所述地理信息点对应的有权词、所述地理信息点对应的有权词的权重、各个所述服务集标识的有权词、各个所述服务集标识的有权词的权重,获取所述地理信息点的名称与所述地理信息点所对应的候选Wi-Fi信号发射设备集合中的各个候选Wi-Fi信号发射设备对应的服务集标识的语义相似度。
14.根据权利要求13所述的装置,其特征在于,所述服务集标识无权词去除子单元包括:第一分词模块,用于对各个所述服务集标识进行分词;
无权词提取模块,用于将各个所述服务集标识中的词逐一与预存的服务集标识无权词知识库中的词进行匹配,得到各个所述服务集标识中的无权词;
无权词去除模块,用于将所述无权词从各个所述服务集标识中去除。
15.根据权利要求14所述的装置,其特征在于,所述服务集标识无权词知识库包括服务集标识高频词知识库以及无义词知识库。
16.根据权利要求13所述的装置,其特征在于,所述地理信息点高频词去除子单元包括:第二分词模块,用于对所述地理信息点的名称进行分词;
高频词提取模块,用于将所述地理信息点的名称中的词逐一与预存的地理信息点名称高频词知识库中的词进行匹配,得到所述地理信息点的名称中的高频词;
高频词去除模块,用于将所述高频词从所述地理信息点的名称中去除。
17.根据权利要求13所述的装置,其特征在于,所述装置还包括:权重调整单元,用于在获取所述地理信息点的名称与所述地理信息点所对应的候选Wi-Fi信号发射设备集合中的各个候选Wi-Fi信号发射设备对应的服务集标识的语义相似度之前,调整所述地理信息点对应的有权词的权重,其中,权重调整单元包括:行业确定子单元,用于根据所述各个有权词确定所述地理信息点对应的行业;
行业细化词确定子单元,用于将所述各个有权词逐一与所述行业对应的行业细化词知识库进行匹配;
权重调整子单元,用于提高与所述行业细化词知识库匹配成功的有权词的权重,降低所述各个有权词中的地域类词的权重。
18.根据权利要求13-17任一所述的装置,其特征在于,所述相似度确定子单元进一步配置用于根据所述地理信息点对应的有权词、所述地理信息点对应的有权词的权重、各个所述服务集标识的有权词、各个所述服务集标识的有权词的权重,通过向量空间模型获取所述地理信息点的名称与所述各个服务集标识的语义相似度。