第二届挑战赛B2-面向网络舆情的关联度分析

发布时间:2014-08-27 作者:BdRaces 浏览量:1624

随着互联网的迅速发展,网络舆情对政治秩序秩序与社会稳定有着非比寻常的作用,因此挖掘网络用户信息与网络舆情信息的关联度的过程意义重大。编制java语言,在关键词词频统计的基础上,给予用户信息中的关键词赋予比重不同的权重,实现在网络舆情资料库中对web信息提取与关键词提取的功能。将用户信息中的关键词转化为向量A,向量的分量为对应的关键词的权重,同时使用二值法将网络舆情信息库中的网页转为向量B,向量的分量为对应关键词的出现与否,将向量B中的各分量分别乘于相应的权重值,得向量C。求向量A与向量C的余弦值并由此构建关键词加权评分系统,完成对相关网页的评分高低排序并归档。

阅读全文