real2sim是指从现实到模拟之间的转换,一般意义上的real2sim指利用现实数据的反馈来不断优化模拟环境的训练过程,也有更笼统的定义指将现实世界的模型在仿真世界精确建模。后者不是我们要讨论的范围,我们对前者的一些主流思路进行划分,有:基于视觉信息的real2sim、基于参数辨识的real2sim、基于最优参数搜索的real2sim。
基于视觉信息的real2sim:目前大多数利用以cycleGAN为基础而发展出来的各式方法,它们旨在将模拟器中智能体的观测输入更加符合真实世界风格观测到的,即进行一种图像风格的转换,以缩小reality-gap,典型的文章如Bi-Directional Domain Adaptation for Sim2Real Transfer of Embodied Navigation Agents、CycleGAN-Reinforcement Learning Aware Simulation-To-Real等;也有利用语义信息作为指导的,如Real–Sim–Real Transfer for Real-World Robot Control Policy Learning with Deep Reinforcement Learning。
基于参数辨识的real2sim:它们旨在通过现实世界观测到的一些轨迹信息来推断智能体本身的物理信息(质量、力矩等),典型的文章如:Closing the Sim-to-Real Loop: Adapting Simulation Randomization with Real World Experience、Sim2Real2Sim Bridging the Gap Between Simulation and Real-World in Flexible Object Manipulation等。
基于最优参数搜索的real2sim:它们将RL问题定义为给定策略的参数优化,旨在寻找最优参数,一篇综述可以借鉴:A Survey on Policy Search Algorithms for Learning Robot Controllers in a Handful of Trials。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!