基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着信息产业的迅猛发展,聚类的无监督特性使其成为一种极为有效的分析工具。而为获得良好的聚类结果,有效及准确的相似度计算方法是其必备的前提条件。事实上,在描述数据相似度时,不同的特征显然具有不同的作用,因此有必要借助一些先验知识,例如用户提供的限制数据,来衡量特征的重要性,并将其应用于相似度计算中以获取更加准确的计算结果。传统的特征权值量化方法均忽视了两点问题:(1)限制数据在特征空间中极有可能为非均匀分布;(2)限制数据可能包含不一致性。上述问题的存在使得传统的权值量化方法无法获得准确的结果甚至无法运行。基于此,文中提出了一种新颖的特征权值量化方法用以处理上述两点问题:(1)将限制数据划分为若干个等价类,进而通过计算参数“分布系数”来均匀化数据的分布;(2)将限制数据连接为无向图,进而通过计算参数“置信度”来衡量及弱化限制数据的不一致性。之后将这两个参数结合到特征权值量化函数中以获得准确的相似度计算结果。实验结果显示:该特征权值量化方法能够结合限制数据来获取不同特征对相似度计算的贡献能力,并能应用于任何聚类算法中以提高聚类的准确度。
推荐文章
一种基于隶属函数的相似度计算方法及其应用
隶属函数
相似度
权重
实例检索
基于知网的词汇语义相似度计算方法研究
知网
描述语言结构
词汇相似度
补充义原
基于综合语义的XML文档相似度计算方法
可扩展标记语言
相似度计算
构件向量
综合语义
一种基于概念层次的文本特征权重计算方法
概念空间
特征权重
概念层次
特征支持度
类别强度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于特征权重量化的相似度计算方法
来源期刊 计算机学报 学科 工学
关键词 限制数据 特征权重量化 分布系数 置信度
年,卷(期) 2015,(7) 所属期刊栏目 数据挖掘
研究方向 页码范围 1420-1433
页数 14页 分类号 TP18
字数 12685字 语种 中文
DOI 10.11897/SP.J.1016.2015.01420
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 孙承杰 哈尔滨工业大学计算机科学与技术学院 21 456 8.0 21.0
2 吴冲 哈尔滨工业大学管理学院 104 1364 19.0 31.0
3 刘铭 哈尔滨工业大学管理学院 19 155 8.0 12.0
7 刘远超 哈尔滨工业大学计算机科学与技术学院 21 519 11.0 21.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (51)
参考文献  (15)
节点文献
引证文献  (15)
同被引文献  (34)
二级引证文献  (30)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2006(2)
  • 参考文献(2)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(5)
  • 引证文献(5)
  • 二级引证文献(0)
2018(12)
  • 引证文献(3)
  • 二级引证文献(9)
2019(19)
  • 引证文献(4)
  • 二级引证文献(15)
2020(6)
  • 引证文献(0)
  • 二级引证文献(6)
研究主题发展历程
节点文献
限制数据
特征权重量化
分布系数
置信度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
相关基金
高等学校博士学科点专项科研基金
英文译名:
官方网址:http://std.nankai.edu.cn/kyjh-bsd/1.htm
项目类型:面上课题
学科类型:
论文1v1指导