一种网站分类字典的构建方法及装置与流程

文档序号:11155311阅读:来源:国知局
技术总结
本发明实施例公开了一种网站分类字典的构建方法及装置,该方法包括:获取预设的N个初始网站类别中的每个初始网站类别对应的至少一个样本网站的网页内容,其中,N为正整数;根据所获取的网页内容,确定每个初始网站类别对应的有效词语,并为每个有效词语配置初始权重值;统计每个有效词语对应的初始网站类别的个数;将统计得到的个数大于1的有效词语的初始权重值调小,确定每个有效词语的最终权重值;对于每个初始网站类别,将对应的每个有效词语和最终权重值对应存储至该初始网站类别的网站分类字典中,进而根据该网站分类字典对网站进行分类。应用本发明实施例,使得权重值设置更加合理,提高了网站分类的准确度。

技术研发人员:张惊申;梁力文
受保护的技术使用者:新华三技术有限公司
文档号码:201610993453
技术研发日:2016.11.10
技术公布日:2017.05.10

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1