针对群智能体任务完成过程中,不同智能体的知识和经验有利于提升单智能体性能和群智能体整体智能,UPDeT算法将迁移学习的技术与思想运用于物联网和移动互联网背景下的群智能体系统,以适用于现有的群智能体学习方法。该模型使群智能体任务决策过程更加易于解释,能够提升单任务场景的最终性能且能够同时处理多任务场景,通过采用迁移学习使多任务场景的性能和训练速度得到提升。
UPDeT算法基于Python3.6+环境下的numpy、torch、pysc2、sklearn、tensorboard-logger等依赖库开发。算法输入为己方智能体个数和敌方智能体个数,输出则为胜利或失败。该算法支持在StarData数据集上进行群智能体协作的高效学习。此外在代码的实现过程中,参考了Qtran、Zhou等、David等第三方开源资源。
算法名称 | 基于知识迁移的群智能体协作高效学习方法 (Efficient learning method of swarm agent cooperation based on knowledge
transfer, UPDeT) |
算法接口 | python3 UPDeT.py |
输入 | 己方智能体个数和敌方智能体个数 |
输出 | 胜利或失败 |
支持数据集 | StarData |
依赖库 | Python 3.6、numpy、torch、pysc2、sklearn、tensorboard-logger |
参考资源 | Qtran、Zhou等、David等 |
gitlab链接:UPDeT· GitLab (crowdhmt.com)
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!