原文服务方: 计算机应用研究       
摘要:
针对话题追踪静态阈值的缺点和虚假相关报道问题,提出一种基于动态阈值和命名实体双重过滤的话题追踪方法.该方法中,研究了KL距离计算初始阈值,并筛选出候选报道;然后,根据报道时间特点研究了动态阈值方法;最后,抽取追踪话题和测试报道中命名实体,计算命名实体间的相似度以及命名实体相同的个数来选出相关报道,完成话题追踪.通过实验证明该方法的可行性,实验结果表明基于动态阈值和命名实体双重过滤方法能有效地改善话题追踪的性能,并有效降低了话题追踪的误报率和漏报率.
推荐文章
基于位置敏感Embedding的中文命名实体识别
命名实体识别
表示学习
Embedding
多尺度聚类
条件随机场
命名实体的网络话题K-means动态检测方法
命名实体
网络话题
动态检测
K-means聚类
自相似度
话题向量
命名实体识别和指代消解在文摘系统中的应用
自动文摘
命名实体识别
指代消解
一种基于命名实体识别的需求跟踪方法
需求跟踪
命名实体识别
语义聚类
自然语言处理
权重计算
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于动态阈值和命名实体的双重过滤话题追踪
来源期刊 计算机应用研究 学科
关键词 动态阈值 命名实体 双重过滤 KL距离 话题追踪
年,卷(期) 2015,(4) 所属期刊栏目 算法研究探讨
研究方向 页码范围 982-985
页数 4页 分类号 TP391.4
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2015.04.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张艳辉 山东师范大学信息科学与工程学院 4 48 4.0 4.0
5 鲁燃 山东师范大学信息科学与工程学院 9 79 5.0 8.0
7 魏景璇 山东师范大学信息科学与工程学院 1 10 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (48)
共引文献  (310)
参考文献  (13)
节点文献
引证文献  (10)
同被引文献  (26)
二级引证文献  (46)
1968(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(5)
  • 参考文献(0)
  • 二级参考文献(5)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(6)
  • 参考文献(1)
  • 二级参考文献(5)
2004(6)
  • 参考文献(2)
  • 二级参考文献(4)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(9)
  • 参考文献(2)
  • 二级参考文献(7)
2007(4)
  • 参考文献(1)
  • 二级参考文献(3)
2008(6)
  • 参考文献(2)
  • 二级参考文献(4)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(5)
  • 参考文献(2)
  • 二级参考文献(3)
2011(3)
  • 参考文献(2)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(4)
  • 引证文献(3)
  • 二级引证文献(1)
2017(7)
  • 引证文献(3)
  • 二级引证文献(4)
2018(18)
  • 引证文献(1)
  • 二级引证文献(17)
2019(16)
  • 引证文献(0)
  • 二级引证文献(16)
2020(9)
  • 引证文献(1)
  • 二级引证文献(8)
研究主题发展历程
节点文献
动态阈值
命名实体
双重过滤
KL距离
话题追踪
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
论文1v1指导