基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在Web文本挖掘过程中,挖掘对象数据量大,且多是半结构化或无结构化的数据。采用了XQuery语言与经典的Apriori算法相结合的方法进行研究,引入了XQuery语言中的函数,实现了对多个Web文档的挖掘,通过具体的实例进行验证,该算法能够提高Web文本挖掘的时间效率。
推荐文章
信息系统中非结构化文本数据的输入技术研究
信息系统
非结构化数据
输入技术
键词
半结构化数据OEM图应用
对象交换模型(OEM)
TSL
查询重写
算法
半结构化数据
基于证券行业半结构化数据的抽取技术
数据抽取
半结构化
数据挖掘
证券投资
面向政务文本数据的事件级时空模型研究
时空信息模型
政务文本挖掘
非结构化数据
事件信息抽取
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 半结构化多Web文本数据挖掘的研究
来源期刊 齐齐哈尔大学学报(自然科学版) 学科 工学
关键词 Web文本挖掘 Apriori算法 XQuery语言 时间效率
年,卷(期) 2015,(2) 所属期刊栏目
研究方向 页码范围 75-78
页数 4页 分类号 TP311.135.9
字数 2561字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 朱洪浩 蚌埠学院计算机科学与技术系 25 56 4.0 6.0
2 戚晓明 蚌埠学院计算机科学与技术系 53 204 8.0 11.0
3 郭有强 蚌埠学院计算机科学与技术系 42 134 7.0 9.0
4 谢娜 蚌埠学院计算机科学与技术系 5 13 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (22)
共引文献  (34)
参考文献  (6)
节点文献
引证文献  (5)
同被引文献  (14)
二级引证文献  (12)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(5)
  • 参考文献(0)
  • 二级参考文献(5)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(3)
  • 参考文献(1)
  • 二级参考文献(2)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(3)
  • 参考文献(1)
  • 二级参考文献(2)
2013(3)
  • 参考文献(3)
  • 二级参考文献(0)
2015(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(4)
  • 引证文献(2)
  • 二级引证文献(2)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(6)
  • 引证文献(0)
  • 二级引证文献(6)
2019(4)
  • 引证文献(1)
  • 二级引证文献(3)
研究主题发展历程
节点文献
Web文本挖掘
Apriori算法
XQuery语言
时间效率
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
齐齐哈尔大学学报(自然科学版)
双月刊
1007-984X
23-1419/N
大16开
齐齐哈尔市文化大街42号
14-103
1979
chi
出版文献量(篇)
3573
总下载数(次)
8
总被引数(次)
8631
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导