基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
维吾尔语文本聚类中特征选择对聚类的效率和效果都有直接影响.根据维吾尔语构词法规律,在原有基于文档频率特征选择算法基础上,提出新的维吾尔语文本聚类的特征提取算法.新方法将词干作为文本的特征项,在原算法上融合了基于特征贡献度的选择方法,并使用Java语言实现了一个维吾尔语文本聚类系统.使用该系统在人工分类的文本集上进行实验,结果表明:新的特征提取算法有效地降低了文本向量空间维度,在准确率、召回率和F-Measure等指标方面均有不同程度提高.
推荐文章
基于混合方法的维吾尔语词干提取方法研究
维吾尔语
形态变化
词干
词缀
规则方法
词典方法
混合方法
Lovin算法
字符序列标注的维吾尔语词干提取方法
词干提取
序列标注
条件随机场
特征提取
模型训练
预测结果
混合策略的维吾尔语名词词干提取系统
维吾尔语
黏着语
有限状态自动机
噪声信道
词干提取
基于类别分布差异和特征熵的维吾尔语文本特征选择
特征选择
文本分类
特征熵
支持向量机
维吾尔语
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于词干的混合策略维吾尔语文本聚类特征选择方法研究
来源期刊 计算机应用与软件 学科 工学
关键词 文本聚类 维吾尔语 特征选择
年,卷(期) 2012,(12) 所属期刊栏目 基金项目论文
研究方向 页码范围 30-32,50
页数 4页 分类号 TP391
字数 4592字 语种 中文
DOI 10.3969/j.issn.1000-386x.2012.12.009
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 阿力木江·艾沙 新疆大学现代教育技术中心 28 113 6.0 9.0
2 张亚军 昌吉学院计算机工程系 23 50 4.0 5.0
3 吐尔根·依布拉音 新疆大学信息科学与工程学院 116 771 14.0 22.0
4 刘源 新疆大学信息科学与工程学院 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (4)
同被引文献  (9)
二级引证文献  (0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本聚类
维吾尔语
特征选择
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导