WORD BOOK
頻出ワードを暗記する単語帳


回答は●●●をクリックしてください

自然言語処理において、複数の注意機構を並行して使用する手法で、特にトランスフォーマーモデルで有効です。Multi-Head Attentionは、異なる部分に焦点を当てて情報を統合します。この手法を●●●●●●●と言います。