基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目前,基于远监督的蛋白质交互关系抽取方法通过将知识库中的实体对与文本中的实体进行匹配来产生大规模的训练数据,有效地解决了标注数据不足的问题.然而,通过远监督产生的训练数据存在大量的噪音,因此文中提出了一种交叉预测的方法来清除训练数据中的噪音.首先将训练数据随机分为k组,取1组数据作为预测集,其余k-1组数据作为训练集,依次轮换训练集和预测集k次,每组数据都利用其余k-1组数据训练得到的模型来预测并去噪;然后将去噪后的数据重新组合得到新的训练数据,并用去噪前和去噪后的训练数据分别进行训练得到模型;最后用人工标注的语料分别对这两个模型进行测试.实验结果证明,交叉预测的方法可以有效识别出训练数据中的噪音,从而提高蛋白质交互关系的识别效果.
推荐文章
一种基于蛋白质交互网络链接预测的新方法
蛋白质交互网络
链接预测
权值网络
相关节点集
剪枝
蛋白质结构的预测及其应用
蛋白质结构
比较建模
折叠识别
从头计算
蛋白质结构预测综述
蛋白质结构预测
深度学习
同源建模
自由建模
综述
蛋白质亚细胞定位预测研究综述
蛋白质亚细胞定位预测
特征表示
算法设计
算法测试
Web服务器
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于交叉预测的蛋白质交互识别
来源期刊 计算机技术与发展 学科 工学
关键词 蛋白质交互 远监督 交叉预测 去噪
年,卷(期) 2018,(4) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 17-20
页数 4页 分类号 TP301
字数 2568字 语种 中文
DOI 10.3969/j.issn.1673-629X.2018.04.004
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 蔡松成 南京航空航天大学计算机科学与技术学院 3 0 0.0 0.0
2 闵庆凯 南京航空航天大学计算机科学与技术学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (49)
共引文献  (15)
参考文献  (13)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(6)
  • 参考文献(1)
  • 二级参考文献(5)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(7)
  • 参考文献(1)
  • 二级参考文献(6)
2004(6)
  • 参考文献(1)
  • 二级参考文献(5)
2006(7)
  • 参考文献(2)
  • 二级参考文献(5)
2007(5)
  • 参考文献(1)
  • 二级参考文献(4)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(7)
  • 参考文献(1)
  • 二级参考文献(6)
2010(6)
  • 参考文献(2)
  • 二级参考文献(4)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
蛋白质交互
远监督
交叉预测
去噪
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导