基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
如何快捷、准确、全面地检索互联网信息是互联网时代的重要问题。网络新闻比传统纸质媒体新闻速度更快、内容更丰富、形式更灵活生动,正逐渐取代传统新闻媒体成为很多人获取新闻信息的主要途径。然而,面对快速更新的大量新闻信息,传统的手工分类方式无法满足用户的需求。新闻的主要内容一般都是以文本的方式呈现,因此,利用文本自动分类技术对网络新闻进行自动分类是解决手工新闻分类问题的一个有效途径。由于网络新闻信息形式多样,很多新闻内容完全是由图片或者视频组成,不包含文本内容。本文提出通过新闻标题对网络新闻进行分类的方法,比通过内容进行分类的方法分类速度更快,并且有更强的适应性,可对无文本内容的新闻(如图片新闻、标题新闻等)进行分类。本文创建了基于标题的文本分类模型;从网络上获取新闻语料,验证模型的工作情况;并通过与基于内容的文本分类方法比较,验证基于标题的文本分类模型的优劣。本文构建了基于标题的两步分类系统,所提出的类别唯一特征,对于可分样本可以实现高分类准确率。
推荐文章
基于"中文新闻信息分类与代码"文本分类
文本分类
中文新闻信息分类与代码
新闻文本
基于深度神经网络的中文新闻文本分类方法
深度神经网络
文本分类
中文新闻
自然语言处理
基于集成学习的标题分类算法研究
自然语言处理
标题分类
集成学习
改进随机森林
OOB二维权重分布
基于层级类别信息的标题自动分类研究
标题分类
特征选择
层级结构分类体系
同现分析
向量空间
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于标题的中文新闻分类研究
来源期刊 数据挖掘 学科 教育
关键词 文本分类 标题分类 新闻分类 语义相似度
年,卷(期) 2013,(3) 所属期刊栏目
研究方向 页码范围 33-39
页数 7页 分类号 G6
字数 语种
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2002(2)
  • 参考文献(2)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本分类
标题分类
新闻分类
语义相似度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数据挖掘
季刊
2163-145X
武汉市江夏区汤逊湖北路38号光谷总部空间
出版文献量(篇)
140
总下载数(次)
1
总被引数(次)
0
论文1v1指导