作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的:针对中医方剂数据挖掘需要提出一套以数据清洗为主的数据预处理方法,使数据规范、准确和有序,利于后续处理。方法通过检索技术,在方剂数据库中获取文本数据源,将非规范化的数据通过辅助词群行处理、正则表达式替换、异名处理等步骤进行清洗,改进数据质量。结果在中国方剂数据库共检索到1758条记录,在方剂现代应用数据库共检索到91条记录。源文本数据经预处理后共得到有效记录6913味药,可成功导入相关信息挖掘系统进行方剂名称和中药名词的信息抽取。结论本方法适用于基于中医方剂数据库的文本挖掘和知识发现,可成功对源文本数据实施清洗,得到标准统一、无噪声的数据,实现所需方药信息的有效抽取,可为中医方剂文本型数据信息分析与挖掘研究提供有益的借鉴。
推荐文章
数据库读写策略在文本挖掘中的优化研究
文本挖掘
海量数据
数据库读写策略
优化研究
基于文本分类技术计算中医方剂相似度
中医方剂
文本分类
相似度
基于数据挖掘技术分析心力衰竭中医方剂的用药规律
心力衰竭
中医传承辅助平台
数据挖掘
文献研究
中医方剂
用药规律
关联规则
心衰病
数据挖掘中数据预处理的研究与实现
数据预处理
数据分析
KDD(Knowledge Discover in Database)
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 中医方剂数据库文本挖掘数据预处理的尝试
来源期刊 中国中医药图书情报杂志 学科
关键词 中医方剂 方剂数据库 文本挖掘 数据预处理 数据清洗
年,卷(期) 2015,(3) 所属期刊栏目 中医药信息研究
研究方向 页码范围 8-11
页数 4页 分类号
字数 2831字 语种 中文
DOI 10.3969/j.issn.2095-5707.2015.03.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴磊 辽宁中医药大学信息工程学院 15 67 6.0 8.0
2 李舒 中国医科大学医学信息学系 12 52 5.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (15)
共引文献  (318)
参考文献  (3)
节点文献
引证文献  (7)
同被引文献  (52)
二级引证文献  (6)
1958(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(3)
  • 参考文献(1)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(4)
  • 引证文献(2)
  • 二级引证文献(2)
2019(5)
  • 引证文献(1)
  • 二级引证文献(4)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中医方剂
方剂数据库
文本挖掘
数据预处理
数据清洗
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国中医药图书情报杂志
双月刊
2095-5707
10-1113/R
16开
北京市东直门内南小街16号
2-633
1960
chi
出版文献量(篇)
956
总下载数(次)
1
论文1v1指导