目的:构建了一种从科研文献提取关键信息建立化学知识库的流程.方法:使用名称转化技术和光学结构识别软件提取化合物结构,使用文献管理软件EndNote X8获取文献题录信息,使用机器学习工具ChemDataExtractor和人工注释方法提取文献内信息,使用计算模拟平台Pipeline Pilot 7.5获取可预测属性,关联开源数据库ChEMBL获取已知生物活性.结果:成功建立起一种合理、高效的化学知识库构建策略,并采用该策略构建了北京大学海洋天然产物库PKU-MNPD.结论:提出了一种化学知识库的数据汇聚策略,提高了化学知识库构建效率,并且基于原始文献使得构建的数据库内容准确、全面、易于检索.