首页   |   期刊介绍   |   编 委 会   |   投稿指南   |   学术活动   |   期刊订阅   |   检索与收录   |   联系我们   |   专栏投稿 
小型微型计算机系统  2022, Vol. 43 Issue (7): 1370-1377    DOI:
最新目录| 下期目录| 过刊浏览| 高级检索 |
PPO强化学习的多智能体对话策略学习方法
魏鹏飞,曾碧,廖文雄
(广东工业大学 计算机学院,广州510006)
PPO Reinforcement Learning Based Multi-agent Dialogue Policy Learning Method
WEI Peng-fei,ZENG Bi,LIAO Wen-xiong
(School of Computer Science,Guangdong University of Technology, Guangzhou 510006,China)


版权所有 © 《小型微型计算机系统》编辑部
主办单位:中国科学院沈阳计算技术研究所 主编:郭锐锋
国内邮发代号:8-108 国外发行代号:M349 通信地址:沈阳市浑南区南屏东路16号 邮编:110168
联系电话:(024)24696120 E-mail: xwjxt@sict.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发  技术支持:support@magtech.com.cn