基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统领域信息抽取方法多依赖领域词典实现文本特征的发现,既不便于实验复现,也不易于其在多领域环境中移植与推广,严重制约了模型的应用范围.针对上述不足,提出一种适用于e-Science环境的多领域Web文本特征抽取模型(简称e-WTDE).该模型将无词典分词技术引入多领域文本特征发现过程,摆脱了对于领域词典的依赖;借助对领域主题及其具体事件中共性与个性特征的抽取与分类,模型动态追踪领域事件发生及其发展变化,并最终形成多个区域性数据中心;通过对各数据中心中领域知识的协同调度,有力提高了领域信息在全局范围内的利用效率.验证实验中分别对多领域特征抽取、主题特征动态追踪以及领域知识协同调度予以有效性验证,并进一步证明了模型的实用效果.
推荐文章
适宜环境与生态研究的e-science探讨
环境与生态
e-science
数据平台
模型与建模平台
协同工作平台
基于领域模型的Web数据抽取与集成
Web数据模型
Web数据模式
领域数据模型
数据抽取与集成
一种面向机械领域文本分类器的设计
机械领域
灰色关联分析
贝叶斯分类器
特征选择
一种基于PCA和RS的文本特征抽取方法
PCA
RS
特征抽取
特征约简
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种面向e-Science环境的多领域Web文本特征抽取模型
来源期刊 小型微型计算机系统 学科 工学
关键词 e-science环境 特征发现 多领域数据模型 Web文本挖掘
年,卷(期) 2011,(1) 所属期刊栏目 软件与数据库技术
研究方向 页码范围 17-23
页数 分类号 TP311
字数 8524字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 胡长军 北京科技大学信息工程学院 64 555 10.0 21.0
2 翁彧 北京科技大学信息工程学院 4 12 2.0 3.0
6 席强 北京科技大学信息工程学院 1 1 1.0 1.0
7 张学春 北京科技大学信息工程学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (8)
共引文献  (24)
参考文献  (2)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
e-science环境
特征发现
多领域数据模型
Web文本挖掘
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
小型微型计算机系统
月刊
1000-1220
21-1106/TP
大16开
辽宁省沈阳市东陵区南屏东路16号
8-108
1980
chi
出版文献量(篇)
11026
总下载数(次)
17
总被引数(次)
83133
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导