基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着数据挖掘应用的深入,非结构化和半结构化数据的挖掘,将成为下一个数据挖掘应用的热点.文本挖掘是一种典型的非结构化数据挖掘,而Web挖掘则是典型的半结构化数据挖掘.所以将信息处理技术中的汉语分词、信息抽取、语义分析等技术应用到Web挖掘研究技术是必然的发展趋势.本文根据Web挖掘的特点,运用数据抽取进行数据结构转换并把语义分析技术应用到数据抽取的过程中的思想,以便使数据提取更加准确.
推荐文章
基于Web的文本挖掘研究
文本挖掘
文本分类
文本聚类
特征提取
基于危险理论的web文本挖掘研究
危险理论
人工免疫
web挖掘
中文Web文本挖掘系统WebTextMiner开发
Web文本挖掘
支持向量机
k-最近邻
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于HTML结构的Web文本主题挖掘研究
来源期刊 电脑与电信 学科 工学
关键词 数据挖掘 Web 自动分词 数据提取 语义分析
年,卷(期) 2007,(1) 所属期刊栏目 算法研究
研究方向 页码范围 47-51
页数 5页 分类号 TP3
字数 3953字 语种 中文
DOI 10.3969/j.issn.1008-6609.2007.01.014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李瑞芳 沈阳化工学院计算机学院 18 39 5.0 5.0
2 徐承韬 沈阳化工学院计算机学院 18 49 4.0 6.0
3 隋丽萍 沈阳化工学院计算机学院 6 13 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (37)
参考文献  (3)
节点文献
引证文献  (5)
同被引文献  (6)
二级引证文献  (1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
数据挖掘
Web
自动分词
数据提取
语义分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电脑与电信
月刊
1008-6609
44-1606/TN
大16开
广州市连新路171号国际科技中心B108室
1995
chi
出版文献量(篇)
8962
总下载数(次)
13
总被引数(次)
9565
论文1v1指导