作者:
原文服务方: 现代电子技术       
摘要:
文本信息挖掘有利于提高文本信息的查找和利用效率,针对传统方法存在的问题,提出文本信息挖掘方法.首先提取文本信息术语,估计信息内容与文本类别间的余弦距离,结合模糊规则推理和余弦距离得到隶属度,然后根据均值密度的中心估计方法得到文本数据集合的平均密度,确定文本信息聚类中心,删除远离文本信息聚类中心的奇异数据点,实现大数据环境下文本信息挖掘.实验结果表明,该方法能够有效提高文本信息挖掘的查准率,而且具有较强的可扩展性.
推荐文章
大数据环境下文本信息挖掘系统设计
大数据环境
文本信息
关联密度
Aprioirt计算方法
挖掘系统
云计算环境下的大数据特征挖掘技术研究
云计算
梯度采样
大数据
存储体系
特征挖掘
能量开销
大数据环境下文本信息挖掘系统设计
大数据环境
文本信息
关联密度
Aprioirt计算方法
挖掘系统
基于大数据挖掘技术的文本分类研究
大规模文本数据
高维特征
大数据挖掘技术
文本分类器
分类精度
分类时间
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 大数据环境下的文本信息挖掘方法
来源期刊 现代电子技术 学科
关键词 大数据 文本信息 信息挖掘 查准率
年,卷(期) 2017,(23) 所属期刊栏目 自动化技术
研究方向 页码范围 123-126
页数 4页 分类号 TN911.1-34|TP391
字数 语种 中文
DOI 10.16652/j.issn.1004-373x.2017.23.030
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 彭梅 29 19 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (130)
共引文献  (64)
参考文献  (11)
节点文献
引证文献  (1)
同被引文献  (8)
二级引证文献  (0)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(5)
  • 参考文献(0)
  • 二级参考文献(5)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(12)
  • 参考文献(0)
  • 二级参考文献(12)
2013(17)
  • 参考文献(0)
  • 二级参考文献(17)
2014(28)
  • 参考文献(0)
  • 二级参考文献(28)
2015(27)
  • 参考文献(3)
  • 二级参考文献(24)
2016(9)
  • 参考文献(8)
  • 二级参考文献(1)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
大数据
文本信息
信息挖掘
查准率
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
现代电子技术
半月刊
1004-373X
61-1224/TN
大16开
1977-01-01
chi
出版文献量(篇)
23937
总下载数(次)
0
总被引数(次)
135074
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导