基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文章提出了一种针对中文新闻网站的新闻内容抽取方法,该方法使用特征向量抽取和决策树学习算法来建立新闻网页节点分类模型,并把模型根据不同的网站进行分类,构建一个模型库.当输入一个新闻网页url时,先通过url判断是哪个新闻网站,再从模型库中选择相应的节点分类模型,如果没有对应的模型就使用通用的节点分类模型对其进行抽取,实验证明这种方法可以达到很好的效果.
推荐文章
一种并行决策树学习方法研究
决策树
并行学习
故障诊断
分裂属性
一种基于混合决策树的调度知识获取算法
调度知识
特征选取
遗传算法
模拟退火算法
决策树
一种改进的基于决策树的英文韵律短语边界预测方法
语音合成
韵律短语
边界预测
决策树
位置分布
一种改进的决策树算法及其应用
铝电解
决策树
加权信息增益
加权ID3
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于决策树的新闻内容抽取方法
来源期刊 合肥工业大学学报(自然科学版) 学科 工学
关键词 机器学习 特征抽取 决策树 新闻内容抽取
年,卷(期) 2009,(6) 所属期刊栏目 计算机与信息工程
研究方向 页码范围 774-777
页数 4页 分类号 TP181
字数 3594字 语种 中文
DOI 10.3969/j.issn.1003-5060.2009.06.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王浩 合肥工业大学计算机与信息学院 193 1473 20.0 29.0
2 杨静 合肥工业大学计算机与信息学院 26 163 7.0 11.0
3 胡俊坤 合肥工业大学计算机与信息学院 1 6 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (9)
共引文献  (214)
参考文献  (6)
节点文献
引证文献  (6)
同被引文献  (8)
二级引证文献  (10)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(2)
  • 引证文献(2)
  • 二级引证文献(0)
2015(3)
  • 引证文献(1)
  • 二级引证文献(2)
2016(4)
  • 引证文献(0)
  • 二级引证文献(4)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
2018(4)
  • 引证文献(2)
  • 二级引证文献(2)
研究主题发展历程
节点文献
机器学习
特征抽取
决策树
新闻内容抽取
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
合肥工业大学学报(自然科学版)
月刊
1003-5060
34-1083/N
大16开
合肥市屯溪路193号
26-61
1956
chi
出版文献量(篇)
7881
总下载数(次)
18
总被引数(次)
57827
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
安徽省自然科学基金
英文译名:Anhui Provincial Natural Science Foundation
官方网址:http://www.ahinfo.gov.cn/zrkxjj/index.htm
项目类型:安徽省优秀青年科技基金
学科类型:
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导