作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对目前资本市场上快速挖掘某种主题概念股票的需求,提出了一种新思路,该思路以上市公司的核心题材、主营收入和资本运作3项数据为基础,进行主题概念相关指数的分析和计算,最终以此指数作为标准推荐主题概念相关股票,并开发了一套数据抓取程序和Web应用程序.数据抓取程序利用定时组件Quartz从各大财经网站抓取全体上市公司已公开的各类基本信息,存入分布式文件系统HDFS中;Web应用程序接收用户输入的查询关键字组合,系统利用抓取的数据集从公司收入、投资和核心概念3方面分析和计算出公司与用户需要查询的关键字组合的相关指数,最后汇总为总相关指数,总相关指数越高的公司,其相关度越高,相关度越高的公司越有可能就是用户想要查找的相关主题概念公司.通过这3方面的结合,在公司的过去和未来,在定性和定量等多个方面都进行了相关度的挖掘,从而计算出来的相关性将更加可靠、准确.
推荐文章
基于子主题概念的Web主题挖掘
Web内容挖掘
定义挖掘
子主题
大数据分类挖掘算法及其概念漂移应用研究
大数据
数据挖掘
分类算法
概念漂移
基于Hadoop云平台的水利普查数据挖掘系统的设计和实现
Hadoop
数据挖掘
关联规则算法
水利普查
基于hadoop平台的分布式数据挖掘系统的设计探讨
Hadoop平台
数据挖掘
系统设计
K-means
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hadoop平台的主题概念股票挖掘系统应用研究
来源期刊 西昌学院学报(自然科学版) 学科
关键词 数据抓取 Hadoop 主题概念 股票挖掘 相关指数
年,卷(期) 2021,(2) 所属期刊栏目 自动控制与信息技术
研究方向 页码范围 82-88
页数 7页 分类号 TP311.13|F831.51
字数 语种 中文
DOI 10.16104/j.issn.1673-1891.2021.02.015
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (43)
共引文献  (11)
参考文献  (15)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(4)
  • 参考文献(0)
  • 二级参考文献(4)
2014(9)
  • 参考文献(1)
  • 二级参考文献(8)
2015(6)
  • 参考文献(1)
  • 二级参考文献(5)
2016(15)
  • 参考文献(2)
  • 二级参考文献(13)
2017(9)
  • 参考文献(2)
  • 二级参考文献(7)
2018(9)
  • 参考文献(5)
  • 二级参考文献(4)
2019(3)
  • 参考文献(3)
  • 二级参考文献(0)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据抓取
Hadoop
主题概念
股票挖掘
相关指数
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西昌学院学报(自然科学版)
季刊
1673-1891
51-1689/N
四川省西昌市马坪坝
1986
chi
出版文献量(篇)
2767
总下载数(次)
7
总被引数(次)
6696
论文1v1指导