设为首页收藏本站

开启辅助访问

结合先验知识的深度Q神经网络算法研究

您所在的位置：网站首页 › a*算法流程 › 结合先验知识的深度Q神经网络算法研究

结合先验知识的深度Q神经网络算法研究

2023-05-25 05:52| 来源: 网络整理| 查看: 265

结合先验知识的深度

Q

神经网络算法研究

褚伟

;

茹琦

;

任明仑

【摘

要】

深度

Q

神经网络

(deep Q-network,DQN)

算法在训练初期

,

由于动作选

择随机性强

,

导致算法的训练时间过长

.

针对该问题

,

文章提出一种结合先验知识的深

度

Q

神经网络

(priori knowledge-DQN,PK-DQN)

算法

,

将先验知识定义为特征状

态与最优动作的映射

,

根据先验知识对动作选择过程的影响程度

,

将先验知识引入

DQN

算法

,

优化

DQN

算法的动作选择规则

,

降低其在探索过程中的动作选择随机

性

,

并使用赛车游戏对算法进行训练

.

实验结果表明

,PK-DQN

算法能够更快收敛

,

有

较高的学习效率

,

算法训练时长明显缩短

.

【期刊名称】

《合肥工业大学学报（自然科学版）》

【年

(

卷

),

期】

2019(042)007

【总页数】

6

页

(P901-905,958)

【关键词】

深度学习

;

强化学习

;

深度

Q

神经网络

(DQN);

先验知识

【作

者】

褚伟

;

茹琦

;

任明仑

【作者单位】

合肥工业大学

过程优化与智能决策教育部重点实验室

,

安徽

合肥

230009;

合肥工业大学

管理学院

,

安徽

合肥

230009;

合肥工业大学

管理学院

,

安徽

合肥

230009;

合肥工业大学

管理学院

,

安徽

合肥

230009

【正文语种】

中

文

【中图分类】

TP183

【本文地址】

CopyRight 2018-2019 办公设备维修网版权所有豫ICP备15022753号-3