基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于信息量(information content,IC)的医疗文本脱敏方法以互联网中医疗数据的稀疏性作为评判术语敏感与否的标准,而互联网中医疗数据的稀疏性受阶段性流行病与社会舆论指向的影响较大.针对此问题,本文提出一种基于医学术语系统命名法-临床术语(systematized nomenclature of medicine-clinical terms,SNOMED-CT)的语义相似度计算方法.该方法综合考虑了SNOMED-CT中概念之间的"继承"关系("IS_A"关系,纵向关系)和"概念模型属性"关系(横向关系)两方面的因素来计算医疗术语之间的语义相似度.将该方法用于从维基百科(Wikipedia)选取的6类共42篇医疗文本脱敏的过程,实验结果表明,与基于信息量的脱敏方法相比,本文提出的方法在脱敏精度和实用度方面分别提高了4.97%和5.65%,能有效地用于医疗文本语义脱敏过程.
推荐文章
基于树状结构的语义相似度计算方法分析
语义相似度
语义关系
语义距离
树状结构
基于语义信息内容的FCA概念相似度计算方法
FCA概念相似度
信息内容
概率
语义
层次结构
一个基于语义元的相似度计算方法研究
语义
本体
相似性度量
概念
关系
基于综合语义的XML文档相似度计算方法
可扩展标记语言
相似度计算
构件向量
综合语义
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于SNOMED-CT的医疗术语语义相似度计算方法
来源期刊 天津理工大学学报 学科 工学
关键词 隐私保护 文本脱敏 医疗数据 医学术语系统命名法-临床术语 语义相似度
年,卷(期) 2021,(6) 所属期刊栏目
研究方向 页码范围 27-30,52
页数 5页 分类号 TP391.0
字数 语种 中文
DOI 10.3969/j.issn.1673-095X.2021.06.006
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
隐私保护
文本脱敏
医疗数据
医学术语系统命名法-临床术语
语义相似度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
天津理工大学学报
双月刊
1673-095X
12-1374/N
大16开
天津市西青区宾水西道391号
1984
chi
出版文献量(篇)
2405
总下载数(次)
4
总被引数(次)
13943
论文1v1指导