基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文本表示是自然语言处理中的基础任务,通常的文本表示模型都是基于训练数据充分的情况下进行。而在训练数据缺乏时,无法完成自然语言处理任务。提出了一种基于维基百科的文本表示方法,引入维基百科词条之间的关系,通过PageRank传播模型,能够一定程度上解决训练数据缺乏时文本表示的问题。通过实验论证了基于维基百科的文本表示能够增强分类方法的准确率、召回率和F1-测度。
推荐文章
基于维基百科的领域实体发现研究
领域实体
维基百科
隶属度
自动发现
维基百科链接网络实证分析
维基百科
无标度网络
bow-tie模型
基于维基百科的领域概念语义知识库的自动构建方法
维基百科
语义知识库
关键词抽取
语义相似度计算
随机游走
基于中文维基百科的命名实体消歧方法
命名实体消歧
词义消歧
中文维基百科
中文信息处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于维基百科的文本表示方法
来源期刊 计算机工程与应用 学科 工学
关键词 维基百科 隐含狄利克雷分布 文本表示 文本分类
年,卷(期) 2015,(14) 所属期刊栏目 数据库、数据挖掘、机器学习
研究方向 页码范围 127-130
页数 4页 分类号 TP391.1
字数 4365字 语种 中文
DOI 10.3778/j.issn.1002-8331.1406-0071
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王胜清 北京大学现代教育技术中心 18 88 6.0 9.0
2 黄浩军 北京大学软件与微电子学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
维基百科
隐含狄利克雷分布
文本表示
文本分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导