基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对网页信息内容丰富且结构复杂,难以准确挖掘的问题,采用中心聚类和语义特征相互融合的方法.利用中心聚类算法确定样本最终的聚类中心,根据每个词在网页中出现的频率和词的上下文语义,构造一个网页-词语的权重映射矩阵,并将语义特征作为中心聚类相似性的判断依据,完成网页文本信息的挖掘.实验结果表明:利用该方法对网页文本进行挖掘,在时间增加不多的情况下,可以获得更高的召回率和准确率.
推荐文章
融合LSI和支持向量聚类的网页文本分类算法
特征提取
潜在语义索引
网页文本
语义聚类
支持向量聚类
基于多语义因子分层聚类的文本特征提取方法
语义
文本特征
分层聚类
词向量
利用本体集成和特征聚类的网页分类研究
文本分类
本体集成
支持向量机
维数约简
聚类
基于关联挖掘和语义聚类的Deep Web复杂匹配方法
Deep Web
矩阵关联挖掘
语义聚类
复杂匹配
语义网
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 中心聚类和语义特征融合的网页信息文本挖掘方法
来源期刊 辽宁工程技术大学学报(自然科学版) 学科 工学
关键词 中心聚类 语义特征 矩阵 网页信息 文本挖掘
年,卷(期) 2016,(1) 所属期刊栏目
研究方向 页码范围 85-88
页数 4页 分类号 TP311.13
字数 语种 中文
DOI 10.11956/j.issn.1008-0562.2016.01.017
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张爱科 35 119 6.0 9.0
2 符保龙 40 171 8.0 11.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (68)
共引文献  (45)
参考文献  (11)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(10)
  • 参考文献(1)
  • 二级参考文献(9)
2009(16)
  • 参考文献(1)
  • 二级参考文献(15)
2010(8)
  • 参考文献(1)
  • 二级参考文献(7)
2011(9)
  • 参考文献(3)
  • 二级参考文献(6)
2012(5)
  • 参考文献(1)
  • 二级参考文献(4)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(3)
  • 参考文献(3)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中心聚类
语义特征
矩阵
网页信息
文本挖掘
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
辽宁工程技术大学学报(自然科学版)
月刊
1008-0562
21-1379/N
大16开
辽宁省阜新市
1979
chi
出版文献量(篇)
6319
总下载数(次)
12
总被引数(次)
52708
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导