原文服务方: 计算机应用研究       
摘要:
针对传统网页排序算法Okapi BM25通常会出现网页与查询关键词领域无关的领域漂移现象,以及改进算法需要人工建立领域向量的问题,提出了一种基于BM25和softmax回归分类模型的网页搜索排序算法.方法 对网页文本进行数据预处理并利用词袋模型进行网页文本的向量表示,之后通过少量的网页数据训练Softmax回归分类模型,来预测测试网页数据的类别分数,并与BM25信息检索的分数结合在一起,得到最终的网页排序结果.实验结果显示该检索算法无须人工建立领域向量,即可达到很好的网页排序结果.
推荐文章
一种基于协同推荐的网页排序算法
个性化
排序算法
协同推荐
用户模型
结合PCM聚类算法的网页排序
排序算法
RWM
SSD
PCM聚类算法
一种基于用户角色的综合网页排序算法
网页排序
PageRank算法
综合网页排序算法
点击量分析算法
基于社区搜索模块排序算法的网页设计教学质量评估系统
网页设计
教学质量评估
数据采集
数据评估
多因素排序
实验分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种自动分类的网页搜索排序算法
来源期刊 计算机应用研究 学科
关键词 领域向量 BM25 softmax回归分类 网页排序
年,卷(期) 2019,(1) 所属期刊栏目 算法研究探讨
研究方向 页码范围 87-90
页数 4页 分类号 TP391.1|TP301.6
字数 语种 中文
DOI 10.19734/j.issn.1001-3695.2017.07.0700
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 胡骏 合肥工业大学计算机与信息学院 4 36 2.0 4.0
2 刘学亮 合肥工业大学计算机与信息学院 10 9 2.0 2.0
3 刘铭瑀 合肥工业大学计算机与信息学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (13)
共引文献  (2)
参考文献  (4)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1988(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
领域向量
BM25
softmax回归分类
网页排序
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导