基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
将文本分类技术引入唐诗研究.首先将唐诗按照题材分为爱情婚姻、边塞战争、交游送别、羁旅思乡、山水田园、咏史怀古和其他7类,并据此提出唐诗题材自动分类模型.所选500首诗歌样本以《唐诗三百首》为基础,并有所补充.采用向量空间模型(VSM)将唐诗文本转换为向量,通过卡方检验进行词语特征选择,最后基于朴素贝叶斯和支持向量机算法构造文本分类器,取得较好的题材分类效果.此外,还验证了作者关于题目、体制、作者等变量对题材分类产生影响的假设,为相关诗歌本体研究提供了科学依据.
推荐文章
关汉卿散曲题材分类初探
关汉卿
散曲
题材
分类
自动分类模型及算法研究
文档分类
向量空间模型
相关性计算
面向程序自动修复的缺陷分类方法研究
软件缺陷
程序自动修复
缺陷分类
技术集成
小学语文唐诗朗读教学策略
唐诗
朗读
小学语文
教学
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 唐诗题材自动分类研究
来源期刊 北京大学学报(自然科学版) 学科 文学
关键词 唐诗 题材 文本分类 卡方检验 朴素贝叶斯 支持向量机
年,卷(期) 2015,(2) 所属期刊栏目 研究论文
研究方向 页码范围 262-268
页数 7页 分类号 H087
字数 6460字 语种 中文
DOI 10.13209/j.0479-8023.2015.039
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 诸雨辰 北京师范大学文学院 19 17 2.0 3.0
2 胡韧奋 北京师范大学中文信息处理研究所 13 42 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (97)
参考文献  (9)
节点文献
引证文献  (7)
同被引文献  (18)
二级引证文献  (0)
1972(1)
  • 参考文献(1)
  • 二级参考文献(0)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1988(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(5)
  • 参考文献(0)
  • 二级参考文献(5)
2001(3)
  • 参考文献(1)
  • 二级参考文献(2)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
2020(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
唐诗
题材
文本分类
卡方检验
朴素贝叶斯
支持向量机
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
北京大学学报(自然科学版)
双月刊
0479-8023
11-2442/N
16开
北京海淀北京大学校内
2-89
1955
chi
出版文献量(篇)
3152
总下载数(次)
8
总被引数(次)
52842
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导