基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
介绍了一种综合各层级分类类目和对应关键词来构造概念体系并用于改进信息检索系统效果的方法.为了改进文本聚类的效果,提出了将领域知识本体和文本关键词词频相结合的基于余弦向量的文本相似性测度方法.该本体面向特定领域,将关键词以不同权值对应于各分类类目,通过其语义知识来改进文本相似性测度以及信息检索系统的效果.进一步给出了对基于本体的相似性测度方法进行效果评价的2种策略以及该方法与经典余弦向量测度方法的比较结果.
推荐文章
本体的相似性网络推理框架
本体
相似网络推理
图代数
集成框架
基于谱聚类的文本相似性研究
语义相似性
语义结构
潜在语义分析
谱聚类
语义空间
基于分类词典的文本相似性度量方法
文本挖掘
语义分析
分类词典
关键词提取
词语编码
相似性度量
聚类
分类
基于本体及相似度的文本聚类研究
本体
相似度
文本聚类
语义
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 文本聚类中基于本体的相似性测度
来源期刊 东南大学学报(英文版) 学科 工学
关键词 相似性测度 文本聚类 本体 信息检索系统
年,卷(期) 2006,(3) 所属期刊栏目
研究方向 页码范围 389-393
页数 5页 分类号 TP3
字数 711字 语种 英文
DOI 10.3969/j.issn.1003-7985.2006.03.022
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 成晓 南京理工大学信息管理系 5 41 4.0 5.0
2 颜端武 南京理工大学信息管理系 49 585 13.0 23.0
3 王磊 南京理工大学信息管理系 11 43 4.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (4)
同被引文献  (19)
二级引证文献  (10)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2007(1)
  • 引证文献(1)
  • 二级引证文献(0)
2008(2)
  • 引证文献(2)
  • 二级引证文献(0)
2010(1)
  • 引证文献(0)
  • 二级引证文献(1)
2011(1)
  • 引证文献(0)
  • 二级引证文献(1)
2012(1)
  • 引证文献(0)
  • 二级引证文献(1)
2013(1)
  • 引证文献(0)
  • 二级引证文献(1)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
2019(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
相似性测度
文本聚类
本体
信息检索系统
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
东南大学学报(英文版)
季刊
1003-7985
32-1325/N
大16开
南京四牌楼2号
1984
eng
出版文献量(篇)
2004
总下载数(次)
1
总被引数(次)
8843
论文1v1指导