基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的:探索机器学习方法在中医学派文本分类中的应用.方法:将数字化纯文本中医文献分为伤寒、外科、儿科、女科4类,选择Bigram作为特征分词方法、TF-IDF为特征提取方法、Chi-square为特征降维方法,基于LibSVM和LibLinear两种分类模型将待分类文献放入模型进行分类预测.结果:训练得到LibSVM模型正确率为0.9375,Liblinear模型正确率为0.9231,编号1-5的文献分类结果符合预期.结论:机器学习对中医文献识别分类具有普适性良好、正确率高、测试速度快的优点,适合中医学派文献资料的文本分类研究.
推荐文章
基于SVM主动学习技术的 PU 文本分类
支持向量机
主动学习
PU
文本分类
Rocchio
基于机器学习的文本分类技术的研究
文本分类
向量空间模型
特征提取
机器学习
中文文本分类研究
文本分类
k 近邻
支持向量机
最大熵
基于文本分类技术计算中医方剂相似度
中医方剂
文本分类
相似度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于机器学习的中医学派文本分类研究
来源期刊 中华医学图书情报杂志 学科 医学
关键词 机器学习 文本分类 中医学派 中医信息化 大数据
年,卷(期) 2018,(12) 所属期刊栏目 研究与探讨
研究方向 页码范围 7-11
页数 5页 分类号 TP183|R2-03
字数 4062字 语种 中文
DOI 10.3969/j.issn.1671-3982.2018.12.002
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王志国 中国中医科学院中医临床基础医学研究所 54 533 12.0 21.0
2 赵汉青 中国中医科学院中医临床基础医学研究所 10 18 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (41)
共引文献  (82)
参考文献  (19)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1931(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(2)
  • 参考文献(2)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(4)
  • 参考文献(1)
  • 二级参考文献(3)
2003(5)
  • 参考文献(1)
  • 二级参考文献(4)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(4)
  • 参考文献(2)
  • 二级参考文献(2)
2008(3)
  • 参考文献(2)
  • 二级参考文献(1)
2009(9)
  • 参考文献(0)
  • 二级参考文献(9)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(8)
  • 参考文献(2)
  • 二级参考文献(6)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(4)
  • 参考文献(1)
  • 二级参考文献(3)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
机器学习
文本分类
中医学派
中医信息化
大数据
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中华医学图书情报杂志
月刊
1671-3982
11-4745/R
大16开
北京市海淀区西四环中路59号
2-714
1991
chi
出版文献量(篇)
5113
总下载数(次)
5
总被引数(次)
21058
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导