基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文档聚类随着网上文本数量的激增以及实际应用中的需求,引起了人们广泛的关注.针对目前文档聚类的主要缺陷,提出了一种新的基于本体的抽象度可调文档聚类(Adjustable Text Clustering using Abstract Degree of Concept,ATCADC).该方法采用Wordnet对VSM特征词进行概念映射和消歧处理,利用生成的特征概念实现文档语义层面上的矢量描述,并在二次特征选择的基础上,完成合成聚类(AHC).方法能够依据用户设定的概念抽象度,借助专门设计的语义中心矢量调节聚类,还可利用关键特征概念对聚类簇进行解释.实验结果证明,聚类精度高,聚类簇可解释,调节效果有效,能够满足用户不同概念抽象度层次上的聚类.
推荐文章
一种快速有效的Web文档聚类方法
Web挖掘
文档聚类
矢量空间模型VSM
关联规则
一种基于SOM和K-means的文档聚类算法
自组织特征映射
K-means
聚类
组合方法
文档聚类
基于本体及相似度的文本聚类研究
本体
相似度
文本聚类
语义
利用本体技术的文本聚类模型
本体
文本聚类
概念主题
WordNet
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于本体的抽象度可调文档聚类
来源期刊 计算机工程与应用 学科 工学
关键词 本体 文档聚类 概念 消歧 抽象度
年,卷(期) 2007,(29) 所属期刊栏目 数据库与信息处理
研究方向 页码范围 172-175
页数 4页 分类号 TP18|TP312
字数 5678字 语种 中文
DOI 10.3321/j.issn:1002-8331.2007.29.050
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王晓东 西北工业大学自动化学院 39 523 9.0 22.0
2 郭雷 西北工业大学自动化学院 262 2986 27.0 40.0
3 邓涛 西北工业大学自动化学院 8 35 3.0 5.0
4 方俊 西北工业大学自动化学院 17 171 6.0 13.0
5 杨宁 西北工业大学自动化学院 36 209 9.0 12.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (101)
参考文献  (3)
节点文献
引证文献  (6)
同被引文献  (19)
二级引证文献  (29)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(2)
  • 引证文献(1)
  • 二级引证文献(1)
2017(10)
  • 引证文献(2)
  • 二级引证文献(8)
2018(8)
  • 引证文献(0)
  • 二级引证文献(8)
2019(11)
  • 引证文献(2)
  • 二级引证文献(9)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
本体
文档聚类
概念
消歧
抽象度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导