原文服务方: 中国传媒科技       
摘要:
【目的】论述Web信息抽取技术在新闻舆情分析中的应用,为舆情虚假信息甄别、舆论引导提供新方法,从而避免对大众的思维、想法等造成不良影响。【方法】研究提出了基于行块分布函数和基于统计与网页结构两种不同的新闻正文信息抽取方法,使得在对Web新闻数据采集和存储的基础上,正文信息抽取更加高效和准确。【结果】两种Web信息抽取技术可以广泛应用于海量新闻数据分析、舆情监测等应用场景。【结论】通过基于行块分布函数的抽取方法和基于统计信息与网页结构的抽取方法,能够分别对轻量网页和大流量网页抽取信息时表现更优。
推荐文章
热度分析技术在舆情吹哨系统中的应用
舆情
吹哨系统
热度
关联热度
相关度
Web信息抽取技术综述
Web信息抽取
网页噪声
URL聚类
DSE算法
RoadRunner系统
MDR
视觉特征
模板
基于DOM的Web信息抽取
DOM
包装器
抽取规则
信息抽取
基于XML的WEB信息抽取模型设计
XML
信息抽取
web
规则
信息集成
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Web 信息抽取技术在吹哨系统中的研究与应用
来源期刊 中国传媒科技 学科
关键词 信息抽取 舆情 数据采集 分布函数 网页结构
年,卷(期) 2023,(4) 所属期刊栏目 传媒技术
研究方向 页码范围 154-158
页数 5页 分类号
字数 语种 中文
DOI 10.19483/j.cnki.11-4653/n.2023.04.032
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2023(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
信息抽取
舆情
数据采集
分布函数
网页结构
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国传媒科技
出版文献量(篇)
0
总下载数(次)
0
总被引数(次)
0
论文1v1指导