群智能体知识迁移 - 推荐的文章

Linux系统搭建Atari强化学习环境【Mujoco200 + Mujoco-py2.0.2.13 + gym0.15.3 + DeepMind Lab + dmc2gym】

Atari是最经典最常用的离散动作空间强化学习环境，常作为离散动作空间强化学习算法的基准测试环境。Atari可以方便地更改颜色、替换背景、增加干扰物，从而考验强化学习算法的环境适应能力。因此...

0
1
小方
发布于 2023-01-26 13:14
阅读 ( 3561 )

real2sim方法总结

对现有的real2sim的一些方法进行总结介绍。

0
1
郝肇铁
发布于 2022-07-26 09:35
阅读 ( 3275 )

基于知识迁移的群智能体协作高效学习方法（UPDeT）

0
1
mingze
发布于 2021-07-10 22:32
阅读 ( 2968 )

事件元知识迁移的社交网络假消息检测算法（MetaDetector）

0
1
mingze
发布于 2021-07-10 22:23
阅读 ( 2660 )

论文分享——零样本知识蒸馏用于联邦类增量学习

论文链接：https://arxiv.org/abs/2303.06937 发表会议：ICCV 2023 TARGET: Federated Class-Continual Learning via Exemplar-Free Distillation 1.摘要现有的很多联邦学习方法都是应用在...

0
0
李瑶
发布于 2024-01-23 00:09
阅读 ( 4016 )

联邦迁移学习分享（二）

典型的联邦迁移学习定义在纵向联邦学习背景下，但目前在横向联邦学习框架下，应用迁移学习的研究工作也很多。现有的联邦学习方法已经在保护各参与方数据隐私性的同时保证了较好的模型训练效果...

0
0
张周阳子
发布于 2023-02-13 16:21
阅读 ( 2865 )

强化学习论文分享--整合的层级化强化学习

Intelligent problem-solving as integrated hierarchical reinforcement learning 论文链接：https://arxiv.org/pdf/2208.08731 发表会议：Nature Machine Intelligence, 2022 摘要认知心...

0
0
李梦媛
发布于 2023-02-13 16:15
阅读 ( 2364 )

强化学习论文分享--SimPLe

Model Based Reinforcement Learning for Atari 论文链接：https://arxiv.org/pdf/1903.00374 代码链接：https://github.com/tensorflow/tensor2tensor/tree/master/tensor2tensor/rl 发表会...

0
0
李梦媛
发布于 2023-02-13 15:48
阅读 ( 2066 )

强化学习论文分享--UPDeT

## UPDeT: Universal multi-agent reinforcement learning via policy decoupling with transformers 论文链接：https://arxiv.org/pdf/2101.08001 代码链接：[Theohhhu/UPDeT: Official...