WORD BOOK
頻出ワードを暗記する単語帳


回答は●●●をクリックしてください

強化学習において、ディープQネットワーク(DQN)の改良版で、Q値の過大評価を防ぐ手法です。ダブルDQNは、二つのネットワークを使用してQ値を更新し、より安定した学習を実現します。この手法を●●●●●●●と言います。