基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着科学技术的发展和互联网的普及,网络给人们带来便利的同时,也给抄袭剽窃提供了机会,现在抄袭检测已经成为一个重要的研究课题.本文分析了传统抄袭检测系统源检索模块的优缺点,结合分布式系统的特点,提出基于索引分片的源检索体系结构,在大规模数据集上进行抄袭检测研究,以便快速的检测出可疑文档的备选文集.通过实验证明,基于索引分片的源检索结构能够应对大规模数据集的处理要求,有效的提高了源检索阶段的时间性能,同时也保证了抄袭检测系统的可靠性.
推荐文章
一种基于AST的代码抄袭检测方法
抽象语法树
抄袭检测
开源语法分析器
相似度
Hadoop平台下基于内容的医学图像检索
Hadoop平台
分布式存储
并行处理
医学图像检索
基于SVM的抄袭检测方法研究
抄袭检测
支持向量机
信息检索
特征提取
Hadoop分布式的海量图像检索
Hadoop分布式
海量图像
SURF特征
K?Means聚类
检索
数据挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hadoop的抄袭检测的源检索方法研究
来源期刊 应用科技 学科 工学
关键词 抄袭 抄袭检测 大规模数据集 源检索 Hadoop
年,卷(期) 2015,(6) 所属期刊栏目 计算机技术与应用
研究方向 页码范围 67-71
页数 5页 分类号 TP311
字数 4416字 语种 中文
DOI 10.11991/yykj.201503030
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 宁慧 哈尔滨工程大学计算机科学与技术学院 28 118 7.0 9.0
2 徐丽 哈尔滨工程大学计算机科学与技术学院 20 358 6.0 18.0
3 王素红 哈尔滨工程大学计算机科学与技术学院 4 12 1.0 3.0
4 王明星 哈尔滨工程大学计算机科学与技术学院 2 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (11)
参考文献  (5)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
抄袭
抄袭检测
大规模数据集
源检索
Hadoop
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
应用科技
双月刊
1009-671X
23-1191/U
大16开
哈尔滨市南通大街145号1号楼
14-160
1974
chi
出版文献量(篇)
4861
总下载数(次)
7
总被引数(次)
21528
论文1v1指导