基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为解决禁毒情报分析中缺乏对文本信息处理和利用的有效手段的问题,提供一种基于禁毒情报相似度计算的中文文本算法.结合禁毒领域的业务需求,对禁毒情报相似度进行计算分析;对统计分词方法进行改进,首先分词后进行停用词处理,然后用户可以自定义词典的同时自定义词性,最后通过正则表达式提取案发时间等信息.还手动扩充了用户词典,加入了物品库,地址库等,分词的结果有了很高的提升;用涉毒案件作为实例计算相似度,证明了本算法的可用性,符合预期的效果,这为禁毒情报线索、警情及案事件等各类线索的碰撞、多点聚焦以便及时发现有价值的涉毒线索从而达到提前预警的目的建立了基础.
推荐文章
一种PST_LDA中文文本相似度计算方法
词性标注
LDA模型
PST_LDA模型
文本相似度计算
基于类别特征向量表示的中文文本分类算法
中文文本分类
向量空间模型
评价函数
特征提取
中文文本分类研究
文本分类
k 近邻
支持向量机
最大熵
基于AdaBoost-Bayes算法的中文文本分类系统
中文分词
文本分类
AdaBoost
Bayes
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于禁毒情报相似度计算的中文文本分析算法
来源期刊 中国人民公安大学学报(自然科学版) 学科 工学
关键词 中文文本分析 文本分类 禁毒情报 相似度计算
年,卷(期) 2018,(1) 所属期刊栏目 警务信息技术
研究方向 页码范围 57-62
页数 6页 分类号 TP312.8
字数 5441字 语种 中文
DOI 10.3969/j.issn.1007-1784.2018.01.011
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郭欣 3 2 1.0 1.0
2 张丽坤 2 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (38)
共引文献  (97)
参考文献  (6)
节点文献
引证文献  (2)
同被引文献  (7)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(7)
  • 参考文献(0)
  • 二级参考文献(7)
2000(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(5)
  • 参考文献(0)
  • 二级参考文献(5)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(3)
  • 参考文献(2)
  • 二级参考文献(1)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(4)
  • 参考文献(0)
  • 二级参考文献(4)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中文文本分析
文本分类
禁毒情报
相似度计算
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国人民公安大学学报(自然科学版)
季刊
1007-1784
11-3933/N
16开
北京市西城区木樨地南里
1996
chi
出版文献量(篇)
1994
总下载数(次)
6
总被引数(次)
8979
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导