基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
互联网主题分析中经常采用概率主题模型对主题进行描述,但存在对于一般用户难以理解的问题,提出一种概率主题模型的自动语义标注方法.首先通过基于语义分类的关联规则挖掘关联主题词并建立候选标签集合,然后以关联词在数据集中的概率分布来设计相关性判别函数,计算候选标签和主题模型的相关度,最后根据最大边缘相关选择高语义覆盖度和区分度的标签.在食品安全和旅游领域主题模型标注的实验表明,与最大概率主题词标记方法相比,提出的方法能够明显提高标注的准确性,并且解决了多标签标记中语义类别单一的问题,能够以较少数量的标签表达更为丰富的语义,这有助于进一步实现更为准确的主题跟踪和主题信息检索.
推荐文章
基于语义相似度的关联词柔性簇模型
搜索引擎
智能信息检索
概念检索
语义相似度
知识库
联想
关联词搭配的自动发现
语料库
关联词
搭配
自动发现
文本挖掘中同义与关联词集的构造算法研究
文本挖掘
潜在语义分析
关联规则挖掘
算法
基于语义相似度的关联词柔性簇模型
搜索引擎
智能信息检索
概念检索
语义相似度
知识库
联想
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于关联词的主题模型语义标注
来源期刊 智能系统学报 学科 工学
关键词 主题分析 语义标注 生成模型 关联词 关联规则
年,卷(期) 2012,(4) 所属期刊栏目
研究方向 页码范围 327-332
页数 6页 分类号 TP391
字数 6377字 语种 中文
DOI 10.3969/j.issn.1673-4785.201204017
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杜军平 北京邮电大学智能通信软件与多媒体北京市重点实验室 44 347 10.0 16.0
2 周亦鹏 北京工商大学计算机与信息工程学院 24 68 5.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (37)
共引文献  (178)
参考文献  (8)
节点文献
引证文献  (5)
同被引文献  (7)
二级引证文献  (1)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(4)
  • 参考文献(1)
  • 二级参考文献(3)
2003(7)
  • 参考文献(1)
  • 二级参考文献(6)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(7)
  • 参考文献(2)
  • 二级参考文献(5)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(2)
  • 引证文献(2)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(2)
  • 引证文献(1)
  • 二级引证文献(1)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
主题分析
语义标注
生成模型
关联词
关联规则
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能系统学报
双月刊
1673-4785
23-1538/TP
大16开
哈尔滨市南岗区南通大街145-1号楼
2006
chi
出版文献量(篇)
2770
总下载数(次)
11
总被引数(次)
12401
论文1v1指导