作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
鉴于已有信息提取方法的可改进之处,结合对HTML网页性质的统计和分析,针对社会媒体中的用户生成数据,提出一种网页主题信息提取算法。算法依据DOM的树型结构特点,充分考虑节点中非链接文字总数和超链接总数这些语义信息,对其进行基于HTML标签的过滤和基于语义的剪枝,能够准确地提取出网页HTML文档的主题信息。实验证明,提取到的主题信息具有较高的准确性和完整性。
推荐文章
旅游企业社会责任研究
企业社会责任
旅游
可持续
责任旅游
高管激励对企业社会责任影响研究
高管激励
显性激励
隐性激励
企业社会责任
经济"新常态"对农业企业社会责任会计信息披露的影响
新常态
农业企业
社会责任会计信息披露
我国企业社会责任信息披露现状研究
企业社会责任报告
企业社会责任信息披露
第三方审计
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 企业社会媒体主题信息提取算法研究
来源期刊 学科 工学
关键词 社会媒体 网页主题信息 DOM树
年,卷(期) 2014,(1) 所属期刊栏目 问题探讨
研究方向 页码范围 72-76
页数 5页 分类号 TP393
字数 5457字 语种 中文
DOI 10.3969/j.issn.1005-2798.2014.01.031
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (17)
共引文献  (137)
参考文献  (6)
节点文献
引证文献  (1)
同被引文献  (4)
二级引证文献  (0)
1965(1)
  • 参考文献(0)
  • 二级参考文献(1)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(6)
  • 参考文献(1)
  • 二级参考文献(5)
2005(3)
  • 参考文献(1)
  • 二级参考文献(2)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
社会媒体
网页主题信息
DOM树
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
月刊
1005-2798
14-1171/TD
大16开
山西省襄垣县侯堡镇
22-114
1992
chi
出版文献量(篇)
7851
总下载数(次)
15
论文1v1指导