网站排名数据处理方法和装置与流程

文档序号:11063549阅读:来源:国知局

技术特征:

1.一种网站排名数据处理方法,其特征在于,包括:

利用搜索引擎对目标关键词进行搜索,得到所述目标关键词的搜索信息,其中,所述搜索信息包含与所述目标关键词关联的目标网站;

根据所述搜索信息,确定策略选择指令,其中,所述策略选择指令为:第一爬取策略,用于爬取所述搜索信息中排名在所述目标网站以前的数据,或者,第二爬取策略,用于爬取所述搜索信息中包含有所述目标网站的预设数量的数据;

响应于所述策略选择指令,对所述搜索信息中所述策略选择指令所指示的数据进行爬取,以得到所述目标关键词的数据爬取结果;

根据所述数据爬取结果,确定与所述目标关键词关联的目标网站的排名。

2.根据权利要求1所述的方法,其特征在于,根据所述数据爬取结果,确定与所述目标关键词关联的目标网站的排名包括:

获取所述目标网站的统一资源定位符;

按照所述搜索信息中网站的排名先后顺序,将所述目标网站的统一资源定位符与所述搜索信息中网站的统一资源定位符进行匹配,记录匹配到的统一资源定位符的排名序号,作为所述目标网站在搜索信息中的排名序号。

3.根据权利要求2所述的方法,其特征在于,所述策略选择指令为所述第一爬取策略,对所述搜索信息中所述策略选择指令所指示的数据进行爬取,以得到所述目标关键词的数据爬取结果包括:

按照所述搜索信息中网站的排名先后顺序依次爬取网页数据,直到所述目标网站的统一资源定位符第一次匹配到所述搜索信息中网站的统一资源定位符。

4.根据权利要求2所述的方法,其特征在于,所述策略选择指令为所述第二爬取策略,

对所述搜索信息中所述策略选择指令所指示的数据进行爬取,以得到所述目标关键词的数据爬取结果包括:从所述搜索信息中爬取所述预设数量的数据;

其中,按照所述搜索信息中网站的排名先后顺序,将所述目标网站的统一资源定位符与所述搜索信息中网站的统一资源定位符进行匹配,记录匹配到的统一资源定位符的排名序号包括:按照所述搜索信息中网站的排名先后顺序,将所述 目标网站的统一资源定位符与爬取的所述预设数量的数据中网站的统一资源定位符进行匹配,记录匹配到的统一资源定位符的排名序号。

5.根据权利要求2所述的方法,其特征在于,在记录匹配到的统一资源定位符的排名序号,作为所述目标网站在搜索信息中的排名序号之后,所述方法还包括:

将所述数据爬取结果以及所述目标网站的排名序号输出展示。

6.一种网站排名数据处理装置,其特征在于,包括:

搜索单元,用于利用搜索引擎对目标关键词进行搜索,得到所述目标关键词的搜索信息,其中,所述搜索信息包含与所述目标关键词关联的目标网站;

第一确定单元,用于根据所述搜索信息,确定策略选择指令,其中,所述策略选择指令为:第一爬取策略用于爬取所述搜索信息中排名在所述目标网站以前的数据,或者,第二爬取策略用于爬取所述搜索信息中包含有所述目标网站的预设数量的数据;

爬取单元,用于响应于所述策略选择指令,对所述搜索信息中所述策略选择指令所指示的数据进行爬取,以得到所述目标关键词的数据爬取结果;以及

第二确定单元,用于根据所述数据爬取结果,确定与所述目标关键词关联的目标网站的排名。

7.根据权利要求6所述的装置,其特征在于,所述第二确定单元包括:

获取模块,用于获取所述目标网站的统一资源定位符;

匹配模块,用于按照所述搜索信息中网站的排名先后顺序,将所述目标网站的统一资源定位符与所述搜索信息中网站的统一资源定位符进行匹配,记录匹配到的统一资源定位符的排名序号,作为所述目标网站在搜索信息中的排名序号。

8.根据权利要求7所述的装置,其特征在于,所述策略选择指令为所述第一爬取策略,所述爬取单元包括:

第一爬取模块,用于按照所述搜索信息中网站的排名先后顺序依次爬取网页数据,直到所述目标网站的统一资源定位符第一次匹配到所述搜索信息中网站的统一资源定位符。

9.根据权利要求7所述的装置,其特征在于,当所述策略选择指令为所述第二爬取策略时,

所述爬取单元包括:第二爬取模块,用于从所述搜索信息中爬取所述预设数量的数据;

其中,所述匹配模块包括:匹配子模块,用于按照所述搜索信息中网站的排名先后顺序,将所述目标网站的统一资源定位符与爬取的所述预设数量的数据中网站的统一资源定位符进行匹配,记录匹配到的统一资源定位符的排名序号。

10.根据权利要求7所述的装置,其特征在于,所述装置还包括:

显示单元,用于在记录匹配到的统一资源定位符的排名序号,作为所述目标网站在搜索信息中的排名序号之后,将所述数据爬取结果以及所述目标网站的排名序号输出展示。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1