基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
对高校官网校情简介数据进行挖掘分析,提出基于短语树形结构与CilinSimHash算法相结合的短语相似度计算方法.首先将短语转换成以数字为根节点的树形结构来计算相似度,接着将同义词词林与SimHash算法相结合实现基于CilinSimHash算法的相似度计算,最后将基于短语结构的相似度方法与基于CilinSimHash算法的相似度方法加权,来实现短语相似度的计算.将该算法应用到高校官网数据分析过程中,进而对高校官网数据进行聚类分析,得出高校官网数据与高校评价指标之间的关系;获取高校官网数据中的结构化数据,通过聚类算法来对相关指标数据进行分析,表明高校的发展在不同办学层次下仍然是不平衡的.
推荐文章
基于大数据分析技术的高校毕业就业状况分析
高校毕业
就业分析
大数据分析
数据采集
关联性分析
云计算
基于OLAP的高校数据分析与决策支持系统研究
OLAP
数据分析
决策支持
联机分析
多维引擎
数据仓库
基于大数据分析的运动风险评估方法研究
大数据分析
运动风险评估
风险因子
多层次叠加运算
多因素调解方差
运动场地
基于大数据分析技术的高校毕业就业状况分析
高校毕业
就业分析
大数据分析
数据采集
关联性分析
云计算
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于高校官网的校情简介数据分析方法
来源期刊 计算机与现代化 学科 工学
关键词 高校官网 短语相似度 SimHash 高校评价指标
年,卷(期) 2018,(8) 所属期刊栏目 数据库与数据挖掘
研究方向 页码范围 66-72
页数 7页 分类号 TP301
字数 7663字 语种 中文
DOI 10.3969/j.issn.1006-2475.2018.08.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 高伟勋 上海师范大学信息与机电工程学院 8 41 3.0 6.0
2 王松松 上海师范大学信息与机电工程学院 2 5 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (148)
共引文献  (60)
参考文献  (12)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1965(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(4)
  • 参考文献(0)
  • 二级参考文献(4)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(6)
  • 参考文献(0)
  • 二级参考文献(6)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(5)
  • 参考文献(0)
  • 二级参考文献(5)
2010(15)
  • 参考文献(1)
  • 二级参考文献(14)
2011(10)
  • 参考文献(0)
  • 二级参考文献(10)
2012(8)
  • 参考文献(0)
  • 二级参考文献(8)
2013(16)
  • 参考文献(0)
  • 二级参考文献(16)
2014(22)
  • 参考文献(0)
  • 二级参考文献(22)
2015(25)
  • 参考文献(2)
  • 二级参考文献(23)
2016(14)
  • 参考文献(4)
  • 二级参考文献(10)
2017(10)
  • 参考文献(5)
  • 二级参考文献(5)
2018(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
高校官网
短语相似度
SimHash
高校评价指标
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与现代化
月刊
1006-2475
36-1137/TP
大16开
南昌市井冈山大道1416号
44-121
1985
chi
出版文献量(篇)
9036
总下载数(次)
25
总被引数(次)
56782
论文1v1指导