原文服务方: 微电子学与计算机       
摘要:
微博中水军发表的评论内容具有重复或者相似性,提出了基于文本相似度的微博网络水军发现算法。评论内容可以用特征码来表示。特征码再通过高效的B-T ree来索引,使整个系统具有极高的处理效率。根据水军发帖的重复性或者相似性很高的特点,通过对多个相同或相似的评论内容进行统计分析找出出现次数频繁的用户,初步定义为水军。再对这些用户的评论内容进行分析,发现他们的评论内容基本上都是具有重复性。试验表明,该方法能够准确、有效地找出水军账户。
推荐文章
基于向量空间模型结合语义的文本相似度算法
文本相似度
向量空间模型
语义
词频
召回率
特征项
内容相似度微博社区发现方法研究
微博
社区发现
意见领袖
AP算法
模块度优化算法
基于中文分词的文本相似度动态规划算法
文本相似度
动态规划
最长公共子序列
中文分词
基于《知网》的文本相似度研究
知网
语义相似度
VSM
文本相似度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于文本相似度的微博网络水军发现算法
来源期刊 微电子学与计算机 学科
关键词 特征码 索引 文本相似度 最长子序列
年,卷(期) 2014,(3) 所属期刊栏目
研究方向 页码范围 82-85
页数 4页 分类号 TP391
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨长春 常州大学信息科学与工程学院 52 366 10.0 17.0
2 叶施仁 常州大学信息科学与工程学院 25 214 6.0 14.0
3 徐小松 常州大学信息科学与工程学院 2 38 2.0 2.0
4 周猛 常州大学信息科学与工程学院 2 38 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (13)
共引文献  (32)
参考文献  (9)
节点文献
引证文献  (14)
同被引文献  (36)
二级引证文献  (42)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(1)
  • 二级参考文献(0)
1982(2)
  • 参考文献(1)
  • 二级参考文献(1)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(5)
  • 引证文献(4)
  • 二级引证文献(1)
2017(10)
  • 引证文献(6)
  • 二级引证文献(4)
2018(14)
  • 引证文献(2)
  • 二级引证文献(12)
2019(17)
  • 引证文献(1)
  • 二级引证文献(16)
2020(9)
  • 引证文献(0)
  • 二级引证文献(9)
研究主题发展历程
节点文献
特征码
索引
文本相似度
最长子序列
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
微电子学与计算机
月刊
1000-7180
61-1123/TN
大16开
1972-01-01
chi
出版文献量(篇)
9826
总下载数(次)
0
总被引数(次)
59060
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导