基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
该文提出了基于维基百科类别体系的文本特征表示方法,方法是将文本中的词映射到维基百科的类别体系中,使用类别作为特征来对文本进行表示.基于维基类别的文本特征表示方法可以增强文本特征表示能力,降低文本特征空间维数.针对维基百科条目在语料中覆盖度不足的问题,该文提出了一种基于全局信息自学习维基百科类别的方法.该文构造基于维基百科类别为文本表示的分类系统,实验结果证明,基于维基百科类别作为文本表示特征,相对于词袋模型,具有明显的降维效果,在当特征数量较少时(如:<700),分类的F1值提高了5.14%.
推荐文章
维基百科链接网络实证分析
维基百科
无标度网络
bow-tie模型
基于维基百科的领域实体发现研究
领域实体
维基百科
隶属度
自动发现
一种基于维基百科的文本表示方法
维基百科
隐含狄利克雷分布
文本表示
文本分类
基于维基百科的语义知识库及其构建方法研究
维基百科
语义挖掘
知识库
文本挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于维基百科类别的文本特征表示
来源期刊 中文信息学报 学科 工学
关键词 文本分类 维基百科类别 文本表示
年,卷(期) 2011,(2) 所属期刊栏目
研究方向 页码范围 27-31
页数 分类号 TP391
字数 5047字 语种 中文
DOI 10.3969/j.issn.1003-0077.2011.02.005
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (15)
参考文献  (3)
节点文献
引证文献  (30)
同被引文献  (83)
二级引证文献  (79)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(3)
  • 参考文献(3)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(8)
  • 引证文献(8)
  • 二级引证文献(0)
2013(9)
  • 引证文献(6)
  • 二级引证文献(3)
2014(3)
  • 引证文献(1)
  • 二级引证文献(2)
2015(15)
  • 引证文献(7)
  • 二级引证文献(8)
2016(7)
  • 引证文献(3)
  • 二级引证文献(4)
2017(26)
  • 引证文献(2)
  • 二级引证文献(24)
2018(15)
  • 引证文献(2)
  • 二级引证文献(13)
2019(23)
  • 引证文献(1)
  • 二级引证文献(22)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
文本分类
维基百科类别
文本表示
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
论文1v1指导