基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随机噪音会引起半结构化数据结构和语义的变化,从而造成半结构化数据提取或向结构化自动转换障碍,为此本文在分析噪声对半结构化文本数据带来的影响基础下,提出了一种基于语法模板结构知识的自动化分词处理思路和方法,可以提高带噪音的半结构化文本数据自动分词准确性,可为类似问题提供参考。
推荐文章
信息系统中非结构化文本数据的输入技术研究
信息系统
非结构化数据
输入技术
键词
面向文本数字化的自动纠错方法
自动纠错
文本数字化
频率统计树
切分信息
表形码
高维数据集中局部离散文本数据挖掘方法研究
高维数据
数据特征聚类
数据挖掘
关联规则
面向政务文本数据的事件级时空模型研究
时空信息模型
政务文本挖掘
非结构化数据
事件信息抽取
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于模板知识的带噪音半结构文本数据自动分词方法
来源期刊 微型机与应用 学科 工学
关键词 半结构数据 分词 模板 噪音
年,卷(期) 2015,(17) 所属期刊栏目
研究方向 页码范围 89-91,95
页数 4页 分类号 TP317
字数 3308字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 金鑫 青海大学计算机技术与应用系 10 13 2.0 2.0
2 王晓英 青海大学计算机技术与应用系 37 235 9.0 14.0
3 解辉 青海大学计算机技术与应用系 13 12 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (31)
共引文献  (40)
参考文献  (7)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(3)
  • 参考文献(3)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
半结构数据
分词
模板
噪音
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息技术与网络安全
月刊
2096-5133
10-1543/TP
大16开
北京市海淀区清华东路25号(北京927信箱)
82-417
1982
chi
出版文献量(篇)
10909
总下载数(次)
33
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导