结合先验知识的深度Q神经网络算法研究 |
您所在的位置:网站首页 › a*算法流程 › 结合先验知识的深度Q神经网络算法研究 |
结合先验知识的深度 Q 神经网络算法研究
褚伟 ; 茹琦 ; 任明仑
【摘
要】 深度 Q 神经网络 (deep Q-network,DQN) 算法在训练初期 , 由于动作选 择随机性强 , 导致算法的训练时间过长 . 针对该问题 , 文章提出一种结合先验知识的深 度 Q 神经网络 (priori knowledge-DQN,PK-DQN) 算法 , 将先验知识定义为特征状 态与最优动作的映射 , 根据先验知识对动作选择过程的影响程度 , 将先验知识引入 DQN 算法 , 优化 DQN 算法的动作选择规则 , 降低其在探索过程中的动作选择随机 性 , 并使用赛车游戏对算法进行训练 . 实验结果表明 ,PK-DQN 算法能够更快收敛 , 有 较高的学习效率 , 算法训练时长明显缩短 .
【期刊名称】 《合肥工业大学学报(自然科学版)》
【年 ( 卷 ), 期】 2019(042)007
【总页数】 6 页 (P901-905,958)
【关键词】 深度学习 ; 强化学习 ; 深度 Q 神经网络 (DQN); 先验知识
【作
者】 褚伟 ; 茹琦 ; 任明仑
【作者单位】 合肥工业大学
过程优化与智能决策教育部重点实验室 , 安徽
合肥
230009; 合肥工业大学
管理学院 , 安徽
合肥 230009; 合肥工业大学
管理学院 , 安徽
合肥 230009; 合肥工业大学
管理学院 , 安徽
合肥 230009
【正文语种】 中
文
【中图分类】 TP183
|
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |