原文服务方: 计算机应用研究       
摘要:
针对用户使用网站效率低和网站质量差的问题,提出了利用形式概念分析(FCA)来构建网页语义概念树的方法。该方法首先利用信息抽取、自然语言处理等技术对网页集进行文本抽取、分词,提取出描述文本语义的特征词;再以主题词表为参照,设计基于搜索引擎的词语相似度算法,将抽取的特征词全部转换成主题词表中主题词,对将抽取的语义信息转换成形式背景,利用规则、聚类等技术对形式背景进行约简。最后通过设计的建格算法构建概念格,实现概念树构建。实验结果表明,利用该方法构建的概念树可以作为网站本体模型的基础,对语义评估具有积极的意义,具有一定的应用价值和借鉴意义。
推荐文章
利用本体和主题词表的集成构造RDF模式
本体
主题词表
域模型
元数据模式
资源描述框架模式
主题词自动构建技术研究
主题词表
自动构建
术语选取
关联度
《中国中医药学主题词表》药用动植物学类主题词修订选词研究
中医药学主题词表
药用动植物学
修订
选词
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于主题词表和 FCA的网页语义概念树构建研究
来源期刊 计算机应用研究 学科
关键词 本体 语义概念树 形式概念分析 词语相似度
年,卷(期) 2014,(11) 所属期刊栏目
研究方向 页码范围 3308-3315
页数 8页 分类号 TP393
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2014.11.025
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨小平 中国人民大学信息学院 84 967 15.0 30.0
2 孙亚琳 中国人民大学信息学院 2 7 2.0 2.0
3 赵林林 中国地质调查局发展研究中心信息工程室 6 30 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (25)
共引文献  (76)
参考文献  (8)
节点文献
引证文献  (4)
同被引文献  (8)
二级引证文献  (6)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(8)
  • 参考文献(1)
  • 二级参考文献(7)
2007(4)
  • 参考文献(3)
  • 二级参考文献(1)
2008(3)
  • 参考文献(3)
  • 二级参考文献(0)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(4)
  • 引证文献(1)
  • 二级引证文献(3)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
本体
语义概念树
形式概念分析
词语相似度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导