欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 201911121081X
申请人: 中科院计算技术研究所大数据研究院
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于互联网大数据的服务提供方法,其特征在于,包括以下步骤:

步骤一:互联网数据标准化,包含数据元标准管理、数据模型管理和数据服务等级协议管理;数据元标准管理,对互联网数据标准化定义是根据国标或行标建立起数据元的标准规范;数据模型管理:依据数据元标准规范建业务逻辑标准模型,引用业务逻辑标准模型,进行实例化;数据服务等级协议是通过定义数据服务协议标准,对外提供统一的接口服务;

步骤二:互联网数据采集,根据项目和客户专题需求,明确互联网数据采集目标,抓取各大媒体、网站、微博、微信或论坛上的网页与相关的链接,设置数据采集的周期,对结构化数据创建数据模型,并与采集点进行关联,采集系统对配置的互联网采集点进行数据采集;

步骤三:互联网数据预处理,通过步骤二对互联网采集的数据需要经过多重预处理,然后加载到数据存储层,并为各种业务应用服务,完成数据在组件间及层次间中转、缓冲、转换及调度;数据预处理工作包括异构多源数据汇聚规整,汇聚各个通道采集器采集结果数据,通过数据总线订阅采集结果,为采集器指定数据回传的文件格式,按各通道数据存储标准对各通道采集抽取后的信息进行必要的规整;垃圾过滤是将数据垃圾分为两个级别,页面级和页面内容级,根据统一指定的垃圾过滤规则,使用网页去噪技术,将开源数据垃圾剔除掉;数据去重是通过相关唯一数据标识,通过全局键-值对存储服务进行数据去重;文本字段分词是对标题、摘要和内容的文本字段的分词处理,并保留分词结果字段;实体/关键词抽取是针对垃圾过滤后的数据,从信息标题和内容中提取重要属性元素,包括涉及的人物、组织机构、地点、关键词向量和信息摘要;数据信息分类打标签是针对经垃圾过滤后的数据,根据信息内容和业务分类打标签;实时监控是通过配置监测规则维护监测规则的状态内容对业务系统下发的任务进行实时监测与推送;

步骤四:互联网数据安全处理是对数据进行分类分级、加密和访问控制的处理,使数据脱敏后为其他应用提供服务,分类分级是对数据进行不同类别和密级的划分,根据类别和密级制定不同管理和使用原则,对数据做到有差别和针对性的防护;数据加密包括数据存储加密、加密传输和数据脱敏,实现再存储和传输阶段的数据安全管控;同时还提供身份认证、访问控制、分级授权和安全审计功能,对受控的访问数据和追溯访问轨迹,做到访问中监控,访问后留痕;

步骤五:互联网数据服务提供,服务调用通过OAuth进行管理,向资源所有者请求授权,资源所有者返回凭证,客户端通过授权服务器进行身份验证,并提供授权凭证,请求访问令牌,授权服务器对客户端进行身份验证,客户端向资源服务器请求保护的资源,资源服务器验证访问令牌,返回后保护的资源;配置监控服务时,设定监控服务的当前服务等级,根据设定的当前服务等级,启动监控服务;按照预定的时间间隔周期性地采集与当前服务等级相关联的指标;当采集到与当前服务等级相关联的指标时,计算当前服务等级的服务指数;

判断当前服务等级的服务指数是否大于预定的第一综合阈值;若当前服务等级的服务指数大于预定的第一综合阈值,提高监控服务的当前服务等级,然后执行按照预定的时间间隔周期性地采集与当前服务等级相关联的指标的步骤。

2.根据权利要求1所述的基于互联网大数据的服务提供方法,其特征在于,步骤五中互联网数据服务提供的数据服务有以下分类:

(1)数据订阅/发布服务:将所有类型的主数据注册到企业数据总线平台上,各目标系统提供接收各类主数据的接口,到企业数据总线平台自主订阅相应的主数据,所有目标系统通过企业数据总线平台订阅规范完成数据的订阅服务;

(2)数据调用API服务:指定数据类型,通过关键字查询数据详细信息;基于接口层面的点对点的方式的查询服务;

(3)数据资源服务:通过相关工具将源系统的数据抽取到大数据平台,经过整合、清洗和归并后形成各种主题数据,对外提供不同的数据服务,将源系统大数据集中在数据资源中心,通过大数据技术工具,提供各类数据自助式服务;

(4)数据即时服务:基于搜索服务器,面向所有业务系统提供快速查询检索的服务;将不同类型的全量主数据同步到搜索服务器的存储中,然后业务通过搜索服务器提供的API接口进行查询,解决了大数据量查询时,查询效率比较低的问题,提供了数据的及时服务。

3.根据权利要求1所述的基于互联网大数据的服务提供方法,其特征在于,步骤四中,互联网数据安全处理过程还包括角色授权:在数据分级和分类后,了解数据在被谁访问,这些访问者如何使用和访问数据,针对不同角色制定不同安全政策。

4.根据权利要求1所述的基于互联网大数据的服务提供方法,其特征在于,步骤四中,互联网数据安全处理过程还包括场景化安全:针对不同角色在不同场景下,研究数据使用需求;满足数据被正常使用的目标下,完成相应安全要求和安全工具选择。

5.根据权利要求1所述的基于互联网大数据的服务提供方法,其特征在于,还包括数据运行期监控监控,监控过程中需要从技术、业务和管理三个方面分析要监控的目标,监控的数据,并且明确数据背后的含义以及如何进行预警;整合数据标准执行合规和互联网数据处理的完整性情况,数据服务运行情况监控三个维度进行实施运维监控,通过监控各个环节的基础数据和服务,对存在的风险发出预报与警示,第一时间通知到所有人,通过调用链关系快速定位出了问题的环节。

6.根据权利要求5所述的基于互联网大数据的服务提供方法,其特征在于,步骤一中标准数据元管理:数据监控时,在数据标准执行合规情况方面,应实时关注数据元、数据物理模型和数据模型参考完整性对象的更新情况,对变更后的情况与数据元标准和数据逻辑模型进行比对,并将对比报告通过EMAIL通知到相关人员,驱动后续的数据元变更流程;数据监控时,在互数据处理的完整情况,一方面,应实时监控互联网数据源的更新情况,通过设定采集频率,及时得将数据采集到本地;另一方面,应在数据抽取和数据入库量进行数据的对账分析比对,在数据进行预处理的调度过程冲,每个环节的任务执行情况都按照数据守恒原理进行数据量的统计监控;数据监控时,对数据服务运行情况监控,包括服务调用链关系展示和服务工作状态监测,采用微服务方式进行数据服务提供,运行在容器化服务平台上,采用jaeger来实现调用服务链的追踪和grafana实现工作状态的监控展现,并通过设置数据服务的等级,对不满足服务等级协议的接口服务进行预告警。

7.根据权利要求1所述的基于互联网大数据的服务提供方法,其特征在于,步骤一中所述的标准数据元管理:标准数据元是元数据管理的重要输入,标准数据元管理将数据标准定义映射到元数据信息上;标准数据元是数据质量检测规则的制定依据,数据标准也为数据采集、加工、存储、应用和安全管理提供依据,通过标准化的方式对数据元的属性进行定义。

8.根据权利要求1所述的基于互联网大数据的服务提供方法,其特征在于,步骤一中所述的数据模型管理:创建逻辑数据模型,引用数据元标准中的字段,通过设定字段是否为空、是否为主键和是否是分区字段的方式对数据架构进行定义,形成了全局统一的数据字段描述;创建物理模型,引用逻辑数据模型,设置外键、调整主键、调整分区字段和调整是否为空的属性,自动在目标数据库建物理模型;通过数据模型使用稽核,进行一致性检查,发现差异时,不直接修改数据元标准中的数据,系统给出各类元数据的差异报告,结合数据元标准的变更流程,利用数据源标准工具进行数据元更新,实现数据模型的闭环管理。

9.根据权利要求1所述的基于互联网大数据的服务提供方法,其特征在于,步骤一中所述的数据服务协议:是服务提供方和客户之间就服务提供中关键的服务目标及双方的责任的有关细节问题而签订的协议,定义以下3个工作步骤:(1)确定服务目录,梳理服务内容;

(2)确定服务级别协议,确定是所提供的服务的范围和质量,明确IT服务商与客户的职责与服务内容;

(3)组织服务团队,根据服务级别和成本配置相关资源,组建服务团队,按照SLA的要求,采用多种技术和解决方案去监控和管理网络性能及流量,以满足 SLA 中的相关需求,并产生对应的客户结果报告。

10.根据权利要求1所述的基于互联网大数据的服务提供方法,其特征在于,还包括互联网数据存储,互联网数据包括结构化数据、半结构化数据和非结构化数据,其中,结构化数据管包括全系统的配置类数据和分析结果数据;半结构化数据包括网页数据和图结构数据;非结构化数据管理模块管理多媒体数据和附件数据;同时,进行数据生命周期管理,根据数据对企业的价值进行分类分级,形成数据资产目录,然后制定相应的策略,确定最优服务水平和最低成本,将数据转移到相应的存储介质上,争取以最低的成本提供适当级别的保护、复制和恢复。