基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
互联网上的用户生成内容UGC( User Generated Content)中蕴含的用户主观观点信息对分析用户行为、用户需求等工作有着重要的价值.设计一套基于自然语言理解的互联网UGC文本主观观点分析系统WSAM,该系统能挖掘出用户主观观点所蕴含的关注对象和主观成分.分析了互联网UGC现象和生成原因,总结出UGC中用户主观观点中的四种主要类型.挖掘用户主观观点过程中,将用户主观观点的挖掘转化为句子中主观观点关注对象的识别和主观成分的判断.算法结合基于词语类、结构类等相关特征,采用最大熵分类器挖掘用户主观观点.实验验证,WSAM 系统所采用的算法性能较好,且还能够灵活扩充出情感分析(Opinion Mining)等相关应用,同样也能达到较好的结果.
推荐文章
Web文本挖掘在互联网信息统计中的研究与设计
互联网
信息统计
Web挖掘
文本挖掘
文本分类
模式匹配
基于Hadoop的互联网隐式文本感知技术
Hadoop
互联网隐式文本
感知技术
信息吞吐量
分布式框架
图像特征向量
观点挖掘综述
观点挖掘
情感分类
评论
观点搜索
观点作弊
基于关注关系的互联网云数据挖掘方法实现
互联网
云数据
关注关系
数据挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 WSAM:互联网 UGC 文本主观观点挖掘系统
来源期刊 计算机应用与软件 学科 工学
关键词 用户生成内容 UGC 自然语言处理 情感分析
年,卷(期) 2012,(5) 所属期刊栏目 基金项目论文
研究方向 页码范围 90-94
页数 分类号 TP391.1
字数 6534字 语种 中文
DOI 10.3969/j.issn.1000-386X.2012.05.025
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 魏芳 10 62 4.0 7.0
5 朱鲲鹏 5 36 3.0 5.0
9 费仲超 3 8 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (22)
共引文献  (371)
参考文献  (4)
节点文献
引证文献  (5)
同被引文献  (30)
二级引证文献  (1)
1960(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
用户生成内容
UGC
自然语言处理
情感分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导