基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了改善从Web上获取的新闻信息的使用价值,针对Web网站存在大量非科技相关新闻的现状,以互联网上政府新闻网站、凤凰网等新闻为研究背景,选取TF-IDF文本加权方法,设计了科技新闻多层次二分类模型,实现了基于TF-IDF的科技新闻文本分类抽取系统,在20万新闻文档和4000多种分类上,实验取得了科技新闻85.3%的识别准确率和非科技新闻82.9%的识别率,为Web科技新闻分类抽取提供有实用价值的参考模型.
推荐文章
浅议如何写好科技新闻
科技新闻
文采
原则
如何凸显科技新闻社会功能
科技新闻
社会功能
关于"科技新闻易读性"的研究综述
易读性
科技新闻
研究综述
论科技新闻的几种写作方法
新闻
传播
科技
读者
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Web 科技新闻分类抽取算法
来源期刊 淮阴工学院学报 学科 工学
关键词 科技新闻 文本分类 TF-IDF 抽取算法
年,卷(期) 2015,(5) 所属期刊栏目 数学·计算机应用
研究方向 页码范围 18-24
页数 7页 分类号 TP181
字数 5814字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 朱全银 淮阴工学院计算机与软件工程学院 70 328 8.0 16.0
2 刘金岭 淮阴工学院计算机与软件工程学院 63 355 10.0 15.0
3 张永军 淮阴工学院计算机与软件工程学院 18 60 5.0 6.0
4 李翔 淮阴工学院计算机与软件工程学院 32 153 6.0 12.0
5 潘禄 淮阴工学院计算机与软件工程学院 1 3 1.0 1.0
6 刘文儒 淮阴工学院计算机与软件工程学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (88)
共引文献  (103)
参考文献  (16)
节点文献
引证文献  (3)
同被引文献  (9)
二级引证文献  (1)
1936(1)
  • 参考文献(0)
  • 二级参考文献(1)
1968(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(6)
  • 参考文献(0)
  • 二级参考文献(6)
2009(9)
  • 参考文献(0)
  • 二级参考文献(9)
2010(14)
  • 参考文献(1)
  • 二级参考文献(13)
2011(8)
  • 参考文献(1)
  • 二级参考文献(7)
2012(13)
  • 参考文献(2)
  • 二级参考文献(11)
2013(16)
  • 参考文献(2)
  • 二级参考文献(14)
2014(7)
  • 参考文献(4)
  • 二级参考文献(3)
2015(6)
  • 参考文献(6)
  • 二级参考文献(0)
2015(6)
  • 参考文献(6)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
科技新闻
文本分类
TF-IDF
抽取算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
淮阴工学院学报
双月刊
1009-7961
32-1605/T
大16开
淮安市枚乘东路1号
1988
chi
出版文献量(篇)
2741
总下载数(次)
3
总被引数(次)
7697
相关基金
国家星火计划
英文译名:
官方网址:http://www.cnsp.org.cn/
项目类型:
学科类型:
论文1v1指导