多智能体系统场景下的分层内在奖励机制

本文主要针对部分可观测、奖励稀疏的多智能体系统场景,解决多智能体强化学习算法收敛困难,智能体策略水平低下(lazy agent)的问题:设计了一种分层的内在奖励机制(HIRM),核心在于基于分层机制实现智能体内在奖励的平衡

  • 0
  • 1
  • LH
  • 发布于 2022-05-22 09:48
  • 阅读 ( 1394 )

基于真实场景的Turtlebot3 SLAM建图

本文主要介绍基于真实场景的Turtlebot3 SLAM建图方法步骤

  • 0
  • 0
  • LH
  • 发布于 2022-05-22 09:39
  • 阅读 ( 1171 )

基于边缘特征的朴素视频关键帧提取算法

    在实时视频流中往往存在大量的无效帧,如画面长期静止、画面运动过于强烈导致严重模糊等。针对该问题,提出了该方法。 

基于边端情境自适应的潜藏情境挖掘和语义分割算法

针对边端情境复杂多样,潜藏情境难挖掘的问题,拟提出人机共融和数据潜藏情境挖掘技术

基于FPGA的手写数字识别算法

    使用Verilog语言设计一个CNN网络来测量模型在可编程器件上的性能表现,并在Vivado 2018版本打包成ip核

异构物联终端协同深度计算任务分割方法

针对物联终端协同问题提出一种聚合多个物联网设备的计算能力以完成单个设备无法执行任务的深度神经网络划分方法。通过将深度模型以层为粒度进行划分,选择有效的模型分割点,将复杂的深度模型部署到分布式协同环境,综合多个异构设备算力解决高消耗模型的部署问题

  • 0
  • 0
  • LH
  • 发布于 2022-05-16 14:45
  • 阅读 ( 633 )

基于深度强化学习的目标跟踪sim-to-real迁移策略

一种基于零和博弈的奖励函数用以加快目标跟踪算法收敛,做到策略自适应不同场景

  • 0
  • 0
  • LH
  • 发布于 2022-05-15 12:54
  • 阅读 ( 1210 )

面向微控制器平台的自适应压缩框架

        微控制器(或单片机,MCU)以其小体积、低成本、低能耗和高集成度等优势成为未来边缘智能应用关键的部署平台之一。

  • 0
  • 0
  • hcshen
  • 发布于 2021-07-12 13:40
  • 阅读 ( 1406 )

上下文感知的自适应量化框架(CAQ)

面对不断变化的动态情境,深度学习模型既不能接受人工操作的统一量化方法带来的再训练成本,也不能接受从庞大设计空间重新搜索混合精度量化策略的巨大时间开销。上下文感知的自适应量化框架(Co...

  • 0
  • 0
  • hcshen
  • 发布于 2021-07-12 13:34
  • 阅读 ( 1788 )

跨资源受限边端平台的深度计算模型分割方法

在深度模型分割相关研究中,时延预测直接决定了搜索到的模型分割方案的效果。然而,现有深度模型分割研究中多以实际测量的方式来获取,普适性较低且耗时耗力、实用性不强。

  • 0
  • 3
  • hcshen
  • 发布于 2021-07-12 11:49
  • 阅读 ( 790 )

边端融合增强的模型压缩算法(X-ADMM)

为保证深度学习模型的预测精度,通常不能对其进行十分彻底的压缩,这导致压缩后的模型可能仍然不能顺利部署在嵌入式设备上。X-ADMM方法融合了模型剪枝和分割的优势,首先采用结构剪枝的方式并基...

  • 0
  • 1
  • hcshen
  • 发布于 2021-07-12 11:44
  • 阅读 ( 925 )

基于pytorch框架的模型资源预测器(PFLOPS)

平台相关的资源预测对边端协同深度计算中的模分区与资源分配十分重要,而实际测量将耗能耗时,不利于高效、快速的边端协同计算过程。

  • 0
  • 2
  • hcshen
  • 发布于 2021-07-12 11:35
  • 阅读 ( 1355 )

基于知识迁移的群智能体协作高效学习方法(UPDeT)

基于知识迁移的群智能体协作高效学习方法(UPDeT)

  • 0
  • 1
  • mingze
  • 发布于 2021-07-10 22:32
  • 阅读 ( 1677 )

基于迁移学习的少样本表面缺陷检测方法(TL-SDD)

基于迁移学习的少样本表面缺陷检测方法(TL-SDD)

  • 0
  • 0
  • mingze
  • 发布于 2021-07-10 22:29
  • 阅读 ( 1471 )

基于元迁移学习的社交媒体假消息检测算法(MDN)

基于元迁移学习的社交媒体假消息检测算法(MDN)

  • 0
  • 0
  • mingze
  • 发布于 2021-07-10 22:26
  • 阅读 ( 1348 )

事件元知识迁移的社交网络假消息检测算法(MetaDetector)

事件元知识迁移的社交网络假消息检测算法(MetaDetector)

  • 0
  • 1
  • mingze
  • 发布于 2021-07-10 22:23
  • 阅读 ( 1378 )

基于用户和群体的多行为交互的问题推荐方法(AskMe)

基于用户和群体的多行为交互的问题推荐方法(AskMe)

  • 0
  • 0
  • mingze
  • 发布于 2021-07-10 22:20
  • 阅读 ( 1633 )

基于元学习方法的多城市知识融合商业选址推荐方法(MetaStore)

基于元学习方法的多城市知识融合商业选址推荐方法(MetaStore)

  • 0
  • 0
  • mingze
  • 发布于 2021-07-10 22:18
  • 阅读 ( 791 )

基于多维图神经网络的跨场景推荐算法(MGNN)

基于多维图神经网络的跨场景推荐算法(MGNN)

  • 0
  • 0
  • mingze
  • 发布于 2021-07-10 22:14
  • 阅读 ( 1685 )

群智协同增强机理算法

群智协同增强机理算法

  • 0
  • 1
  • mingze
  • 发布于 2021-07-10 22:08
  • 阅读 ( 1556 )