基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
现有文本复制检测技术均基于相似度计算,针对其模型特征表示高维稀疏、算法设计复杂低效等问题,本文提出了一种新的基于汉字部件直方图的文本复制检测算法.其基本原理是根据汉字的数学表达式理论将文本中的所有汉字进行部件拆分,对部件频率进行统计,构造文本汉字部件直方图,以其作为文本的特征表示并将其间的相似度距离值作为复制检测评估依据.通过实验确定了巴氏距离为直方图相似度距离的计算公式.对比实验结果表明本算法查准率、召回率、F1值方面具有可取性.
推荐文章
汉字部件的无失真缩放变换方法研究
汉字部件
笔画操作
部件变换序列
无失真缩放
汉字组字
字库自动生成
基于RGB直方图的运动目标检测算法
背景减除
背景构建
背景更新
RGB直方图
运动目标检测
基于SIFT的区域复制窜改检测算法
区域复制窜改
SIFT算法
窜改检测
关键点
几何变换
分域直方图镜头突变检测算法研究
分域直方图
突变检测
权重
阈值核TK
视觉因子
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于汉字部件直方图的文本复制检测算法
来源期刊 网络安全技术与应用 学科 工学
关键词 复制检测 汉字部件 相似度距离 直方图
年,卷(期) 2015,(3) 所属期刊栏目 技术·应用
研究方向 页码范围 58-59
页数 2页 分类号 TP201
字数 2030字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄华军 中南林业科技大学计算机与信息工程学院 12 160 6.0 12.0
2 姜丽清 中南林业科技大学计算机与信息工程学院 3 54 2.0 3.0
3 谢黎黎 中南林业科技大学计算机与信息工程学院 2 9 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (21)
共引文献  (78)
参考文献  (3)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(4)
  • 参考文献(0)
  • 二级参考文献(4)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(3)
  • 参考文献(0)
  • 二级参考文献(3)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
复制检测
汉字部件
相似度距离
直方图
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
网络安全技术与应用
月刊
1009-6833
11-4522/TP
大16开
北京市
2-741
2001
chi
出版文献量(篇)
13340
总下载数(次)
61
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导