结合先验知识的深度Q神经网络算法研究

您所在的位置:网站首页 a*算法流程 结合先验知识的深度Q神经网络算法研究

结合先验知识的深度Q神经网络算法研究

2023-05-25 05:52| 来源: 网络整理| 查看: 265

结合先验知识的深度

Q

神经网络算法研究

 

褚伟

;

茹琦

;

任明仑

 

【摘

 

要】

深度

Q

神经网络

(deep Q-network,DQN)

算法在训练初期

,

由于动作选

择随机性强

,

导致算法的训练时间过长

.

针对该问题

,

文章提出一种结合先验知识的深

Q

神经网络

(priori knowledge-DQN,PK-DQN)

算法

,

将先验知识定义为特征状

态与最优动作的映射

,

根据先验知识对动作选择过程的影响程度

,

将先验知识引入

DQN

算法

,

优化

DQN

算法的动作选择规则

,

降低其在探索过程中的动作选择随机

,

并使用赛车游戏对算法进行训练

.

实验结果表明

,PK-DQN

算法能够更快收敛

,

较高的学习效率

,

算法训练时长明显缩短

.

 

【期刊名称】

《合肥工业大学学报(自然科学版)》

 

【年

(

),

期】

2019(042)007

 

【总页数】

6

(P901-905,958)

 

【关键词】

深度学习

;

强化学习

;

深度

Q

神经网络

(DQN);

先验知识

 

【作

 

者】

褚伟

;

茹琦

;

任明仑

 

【作者单位】

合肥工业大学

 

过程优化与智能决策教育部重点实验室

,

安徽

 

合肥

 

230009;

合肥工业大学

 

管理学院

,

安徽

 

合肥

 230009;

合肥工业大学

 

管理学院

,

安徽

 

合肥

 230009;

合肥工业大学

 

管理学院

,

安徽

 

合肥

 230009

 

【正文语种】

 

 

【中图分类】

TP183

 



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3