基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着网络技术的发展,网络空间出现了各种各样的文本交流类网络应用,如聊天室、BBS 等。为维护网络环境的文明,这些网络应用中会将用户发表的“脏话”词汇进行过滤。有些恶意用户为了避免所发信息被系统过滤,经常会将“脏话”词汇进行变形处理,如何识别这些变形后的“脏话”词汇,是一个重要的问题。通过计算变异敏感词汇相似度,来对变形词汇进行识别。该方法具有如下特点:(1)计算结果接近于人脑识别的结果;(2)计算所用的时间复杂度较低;(3)对变体识别率较高。根据计算的相似度值,来决定是否对该疑似敏感词进行过滤。实验数据表明,所提出的相似度计算方法好于现有的算法。
推荐文章
基于关键词相似度的短文本分类方法研究
词向量
特征选择
短文本分类
特征权重
结合统计和词间关系的文本关键词计算方法
文本特征
相似计算
互信息
SimHash
特征提取
文本去重
结合关键词微变和LD算法的文本相似性研究
聚类
LD算法
文本相似度矩阵
向量空间模型
文本相似性
基于词汇语义信息的文本相似度计算
文本相似度
词向量
词频—逆文档频率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 不良文本变体关键词识别的词汇串相似度计算
来源期刊 计算机应用与软件 学科 工学
关键词 变体 字符串相似度 算法 编辑距离 内容过滤
年,卷(期) 2015,(3) 所属期刊栏目 人工智能与识别
研究方向 页码范围 151-157
页数 7页 分类号 TP301.6
字数 7085字 语种 中文
DOI 10.3969/j.issn.1000-386x.2015.03.036
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴承荣 复旦大学计算机科学技术学院 32 279 7.0 16.0
2 钟亦平 复旦大学计算机科学技术学院 70 1621 14.0 39.0
3 曾剑平 复旦大学计算机科学技术学院 17 145 5.0 12.0
4 李少卿 复旦大学计算机科学技术学院 1 7 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (20)
共引文献  (33)
参考文献  (4)
节点文献
引证文献  (7)
同被引文献  (17)
二级引证文献  (9)
1971(1)
  • 参考文献(1)
  • 二级参考文献(0)
1974(1)
  • 参考文献(1)
  • 二级参考文献(0)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(4)
  • 参考文献(1)
  • 二级参考文献(3)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(3)
  • 引证文献(3)
  • 二级引证文献(0)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(3)
  • 引证文献(2)
  • 二级引证文献(1)
2019(6)
  • 引证文献(2)
  • 二级引证文献(4)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
变体
字符串相似度
算法
编辑距离
内容过滤
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导