基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
应用动态规划向后归纳法和贝叶斯方法,研究了一类特殊单臂Bandit报酬过程的最优决策问题.在这个模型中,未知Bandit过程是抽样时间间隔服从负指数分布,抽样值服从Erlang(2)分布,允许在任意时刻跳转的Bandit报酬过程.讨论了这类Bandit报酬过程Gittins指数的单调性质,并在此基础上将包含这类过程的单臂Bandit报酬过程的最优决策问题简化为一个最优停止问题,构造了计算过程最优停止时间的算法.
推荐文章
Bandit过程及其应用
Bandit过程
动态规划
马氏决策过程
最优决策
"乘胜"决策
近视决策
考虑运行时间的传动系统翻修间隔期计算方法
运行时间
翻修间隔期
计算方法
特殊时间间隔的测量
相位重合检测
锁相环PLL
比较器
短时间间隔
一类具有宽下限相依结构的索赔时间间隔分布的更新风险过程
重尾分布
宽下限相依
负相依随机变量
有限时间破产概率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 考虑抽样时间间隔的特殊单臂Bandit报酬过程
来源期刊 铁道科学与工程学报 学科 数学
关键词 贝叶斯方法 特殊单臂Bandit报酬过程 Gittins指数 Erlang(2)分布
年,卷(期) 2006,(6) 所属期刊栏目
研究方向 页码范围 87-90
页数 4页 分类号 O211.64
字数 3787字 语种 中文
DOI 10.3969/j.issn.1672-7029.2006.06.018
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 邹捷中 中南大学数学科学与计算技术学院 67 529 14.0 19.0
2 梁友 中南大学数学科学与计算技术学院 2 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(4)
  • 参考文献(3)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
贝叶斯方法
特殊单臂Bandit报酬过程
Gittins指数
Erlang(2)分布
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
铁道科学与工程学报
月刊
1672-7029
43-1423/U
大16开
长沙市韶山南路22号
42-59
1979
chi
出版文献量(篇)
4239
总下载数(次)
13
总被引数(次)
26874
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导