基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
近年来,垃圾短消息呈现出包含大量拆分字和形近字的现象,这种短消息可以绕过监控系统的关键词审查.由于拆分字和形近字数量众多,变化灵活,将其全部加入关键词库将令关键词库变得冗余.对此,本文提出了一种基于汉字笔顺特征的关键词变体匹配方法.基于汉字笔顺特征,首先合并垃圾短消息中的拆分字;然后通过建立索引表,快速查找出短消息中包含的疑似关键词;最后提出了"金字塔匹配法"匹配关键词.本文提出的方法有效降低了关键词库的冗余度,提高了关键词匹配效率.
推荐文章
基于主题特征的关键词抽取
关键词抽取
主题特征
主题模型
装袋决策树
一种基于P2P的关键词搜索新方法
P2P
关键词
搜索
top-k
算法
一种基于LTP特征的图像匹配方法
图像匹配
局部三值模式
局部二值模式
尺度不变特征变换
基于词向量与TextRank的关键词提取方法
抽取
语义差异性
TextRank
词向量
隐含主题分布
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于汉字笔顺特征的关键词变体匹配方法
来源期刊 电信工程技术与标准化 学科 工学
关键词 变体匹配 合并拆分字 金字塔匹配法
年,卷(期) 2020,(12) 所属期刊栏目 中国移动网络与信息安全专题
研究方向 页码范围 14-18
页数 5页 分类号 TN918
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杜雪涛 36 79 4.0 7.0
2 张晨 18 44 4.0 6.0
3 杜刚 9 0 0.0 0.0
4 朱艳云 12 22 3.0 4.0
5 王红雨 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
变体匹配
合并拆分字
金字塔匹配法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电信工程技术与标准化
月刊
1008-5599
11-4017/TN
大16开
北京海淀区丹棱街甲16号302室
82-942
1988
chi
出版文献量(篇)
5257
总下载数(次)
21
总被引数(次)
15733
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导