基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于类内距离参数估计的文本聚类评价方法是在类内距离近似服从正态分布的基础上,运用极大似然估计方法对类内距离分布函数的参数进行估计,然后基于估计的结果确定类内距离的合理取值范围,对超过范围的文本向量依据类内距离大小依次进行调整,并利用聚类评价指标来验证最终调整结果.在实验部分文章通过使用基于类内距离参数估计的文本聚类评价方法对K-means算法生成的聚类结果进行调整,一方面验证了在聚类类别数过小或与真实类别数相同时,该方法的可行性;另一方面减弱了初始类中心的选取对K-means算法的影响,提高了聚类结果的准确性.
推荐文章
基于类间距离参数估计的文本聚类评价方法
聚类分析
文本聚类
聚类评价
极大似然估计
基于主题概念聚类的中文文本聚类
中文文本聚类
HowNet
主题概念
Chmeleon算法
基于第二类统计量的K分布参数估计
K分布
Mellin变换
第二类统计量
对数累积量估计
Monte Carlo仿真
基于LSTM自动编码机的短文本聚类方法
自然语言处理
短文本
聚类
长短期记忆网络
自动编码机
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于类内距离参数估计的文本聚类评价方法
来源期刊 山西大学学报(自然科学版) 学科 数学
关键词 类内距离 极大似然估计 聚类评价 K-means算法 聚类调整
年,卷(期) 2018,(2) 所属期刊栏目 基础数学与应用数学
研究方向 页码范围 256-266
页数 11页 分类号 C8|O213
字数 9154字 语种 中文
DOI 10.13451/j.cnki.shanxi.univ(nat.sci.).2018.02.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 牛奉高 山西大学数学科学学院 22 109 6.0 10.0
2 张荣杰 山西大学数学科学学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (44)
共引文献  (335)
参考文献  (17)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1967(2)
  • 参考文献(0)
  • 二级参考文献(2)
1971(1)
  • 参考文献(0)
  • 二级参考文献(1)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1974(2)
  • 参考文献(0)
  • 二级参考文献(2)
1984(1)
  • 参考文献(1)
  • 二级参考文献(0)
1987(1)
  • 参考文献(1)
  • 二级参考文献(0)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(4)
  • 参考文献(1)
  • 二级参考文献(3)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(5)
  • 参考文献(1)
  • 二级参考文献(4)
2006(5)
  • 参考文献(1)
  • 二级参考文献(4)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(4)
  • 参考文献(2)
  • 二级参考文献(2)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(3)
  • 参考文献(1)
  • 二级参考文献(2)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
类内距离
极大似然估计
聚类评价
K-means算法
聚类调整
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
山西大学学报(自然科学版)
季刊
0253-2395
14-1105/N
大16开
太原市坞城路92号
22-42
1960
chi
出版文献量(篇)
2646
总下载数(次)
7
总被引数(次)
12039
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导