基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对深度强化学习方法在酒店收益管理上的应用问题,本文基于深度强化学习,构建了收益管理决策过程的模型与方法,通过对收益管理问题的马尔可夫性质进行了界定,描述了其模型和参数的统计学性质.同时,编写程序,实现基于深度强化学习的收益管理方法,并通过实验,将本文方法与某供应商采用的传统方法进行对比分析.分析结果表明,强化学习方法与人工收益管理方法相比,总收益提升了约15%,与传统收益管理系统相比,总收益提升了约5%,说明传统的收益管理方法成本较高,监督学习模型过于强调全局泛化性,而增大了对最优结果的估计方差,且计算量过大,而本文提出的方法能够更快地梯度下降到最优位置.该研究为企业在数据驱动下的精准定价和营销决策提供了理论基础.
推荐文章
一种基于强化学习的多指手位置控制方法
多指手
非线性
强化学习
自适应评价算法
基于深度强化学习的航路点飞行冲突解脱
飞行冲突
深度强化学习
深度Q网络
航空器分离
一种强化学习行动策略ε-greedy的改进方法
强化学习
ε-greedy策略
探索与利用
一种基于强化学习的微电网能量管理算法
强化学习
能量管理
能量储存
电力系统
联合优化
马尔可夫决策
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于深度强化学习的酒店收益管理模型与方法
来源期刊 青岛大学学报(工程技术版) 学科 工学
关键词 深度学习 强化学习 酒店管理 收益管理
年,卷(期) 2022,(2) 所属期刊栏目 计算机技术|COMPUTER TECHNOLOGY
研究方向 页码范围 47-54
页数 8页 分类号 TP181|F719.2
字数 语种 中文
DOI 10.13306/j.1006-9798.2022.02.008
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
深度学习
强化学习
酒店管理
收益管理
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
青岛大学学报(工程技术版)
季刊
1006-9798
37-1268/TS
大16开
青岛市宁夏路308号
1986
chi
出版文献量(篇)
1972
总下载数(次)
2
论文1v1指导