PPO强化学习的多智能体对话策略学习方法

魏鹏飞,曾碧,廖文雄

小型微型计算机系统 ›› 2022, Vol. 43 ›› Issue (7) : 1370-1377.

PDF(1153 KB)
PDF(1153 KB)
小型微型计算机系统 ›› 2022, Vol. 43 ›› Issue (7) : 1370-1377.

PPO强化学习的多智能体对话策略学习方法

    {{javascript:window.custom_author_cn_index=0;}}
  • {{article.zuoZhe_CN}}
作者信息 +

PPO Reinforcement Learning Based Multi-agent Dialogue Policy Learning Method

    {{javascript:window.custom_author_en_index=0;}}
  • {{article.zuoZhe_EN}}
Author information +
文章历史 +

本文亮点

{{article.keyPoints_cn}}

HeighLight

{{article.keyPoints_en}}

摘要

{{article.zhaiyao_cn}}

Abstract

{{article.zhaiyao_en}}

关键词

Key words

本文二维码

引用本文

导出引用
{{article.zuoZheCn_L}}. {{article.title_cn}}. {{journal.qiKanMingCheng_CN}}. 2022, 43(7): 1370-1377
{{article.zuoZheEn_L}}. {{article.title_en}}. {{journal.qiKanMingCheng_EN}}. 2022, 43(7): 1370-1377
中图分类号:

参考文献

参考文献

{{article.reference}}

基金

版权

{{article.copyrightStatement_cn}}
{{article.copyrightLicense_cn}}
PDF(1153 KB)

Accesses

Citation

Detail

段落导航
相关文章

/