原文服务方: 计算机应用研究       
摘要:
针对数据清洗时数据的标准化问题提出采用基于特征的马尔可夫模型来解决这一问题.在学习模型的过程中,通过最大熵方法提高样本学习的泛化能力.这种方法能够充分利用数据的重叠特征来辨识数据项对应的状态,结合了统计模型和规则模型的优点.理论分析和实验表明,该方法可以有效地实现数据清洗时的数据规格化.
推荐文章
图像规格化的一种新方法
图像规格化
仿射变换
协方差矩阵
主轴
基于颜色规格化的交通标志识别
道路交通标志识别(TSR)
颜色规格化
神经网络
图像检测
分类器
机器识别
数据规格化在燃气负荷预测的应用
燃气负荷预测
神经网络
规格化
基于XML的体育数据规格化存储技术研究
运动训练学
XML
规格化存储技术
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于特征的数据规格化方法
来源期刊 计算机应用研究 学科
关键词 数据清洗 最大熵 马尔可夫模型 重叠特征
年,卷(期) 2008,(9) 所属期刊栏目 算法研究探讨
研究方向 页码范围 2679-2683
页数 5页 分类号 TP311.13
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2008.09.032
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨科华 东南大学计算机科学与工程系 11 124 6.0 11.0
2 董逸生 东南大学计算机科学与工程系 118 3003 29.0 49.0
3 韩京宇 南京邮电大学计算机学院 21 87 6.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1972(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据清洗
最大熵
马尔可夫模型
重叠特征
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导