TinyAgent: Function Calling at the Edge 摘要: 近期的大语言模型(LLMs)使得可以开发出能够通过调用功能来整合各种工具和API,以完成用户查询的高级智能体系统。然而,这些LLMs在边缘的...
在资源有限的环境中部署深度神经网络(DNN)并获得令人满意的性能是一项挑战。尤其是在微控制器上,因为其空间和计算能力非常有限。TREC 是最近为在 DNN 中实现计算重用而提出的一种优化方法,本文的重点是如何在微控制器上实现空间和时间的节约。该解决方案在保持 DNN 精度稳定的同时,最大限度地提高了性能。实验表明,该解决方案消除了 DNN 中 96% 以上的计算,使其能够很好地融入微控制器,在仅有微小精度损失的情况下提高了 3.4-5x速度。
DeepSwarm——一种新型边缘群体智能感知-计算耦合框架(通过数据采集和计算的双向优化实现群体深度学习) Organization:Northwestern Polytechnical University Author:Sicong Liu, Bin Guo, Zi...
Deep Learning Inference on Heterogeneous Mobile Processors: Potentials and Pitfalls - 论文分享
# 文章引用Liu S, Li X, Zhou Z, et al. AdaEnlight: Energy-aware low-light video stream enhancement on mobile devices[J]. Proceedings of the ACM on Interactive, Mobile, Wearable and...
# EchoPFL: Asynchronous Personalized Federated Learning on Mobile Devices with On-Demand Staleness Control# 文章引用Li X, Liu S, Zhou Z, et al. EchoPFL: Asynchronous Personalized F...
深度学习驱动的移动应用通过模型压缩在资源有限的设备上本地部署,以实现稳健且私密的环境感知。然而,现有的DNN压缩技术要么手工设计以优化模型性能,要么按需压缩以优化硬件指标,但都无法在线运行且未考虑动态部署环境。为此,我们提出了AdaSpring,一个上下文自适应、自进化的DNN压缩框架,实现本地在线的自适应压缩。
随着深度学习在物联网智能基础设施中的广泛应用,各种AIoT(人工智能物联网)应用成为可能。然而,基础设备有限的资源限制了深度计算任务的执行效率。如何提高这些任务的部署效率,成为一个涉及多层优化的问题,包括上层模型结构、底层系统调度,以及它们之间的相互影响。为扩展物联网中深度学习部署和优化的研究范围,我们深入调研了现有的优化技术,涵盖了本地和分布式计算中的深度学习模型、计算图、运算符、内存调度和硬件指令。
以思维导图的方式制作了一份学习笔记,主要内容是各部分工作的目的、主要解决方案、以及部分方法的主要思想以及优缺点 正文附上两张内容预览以及思维导图APP下载链接
鉴于LLMs在模仿人类认知能力方面的潜力,一个自然的问题是:我们是否已经制造出了能够像人类一样思考的机器?这个问题触及了认知科学的核心,即评估和理解人工智能代理是否能够模拟人类的思维过...
以思维导图的方式制作了一份学习笔记,主要内容是各部分工作的目的、主要解决方案、以及部分方法的主要思想以及优缺点 正文附上两张内容预览以及思维导图APP下载链接
大模型驱动的多智能体综述,2024年1月发布于ArXiv,专知推文报道。
How do our minds get so much from so little? 丰富的因果推理、强大的泛化能力、高度抽象的认知输出与稀疏、噪声、模糊的信息输入不匹配2岁孩子可以通过看几个例子学习如何使用一个新词——如...
研究背景?扩展卷积神经网络模型随着数据集和任务复杂性的增加,卷积神经网络模型需要更多的参数来提升表示能力单一模型与集成模型的选择 设计CNN时,需要在扩展单个网络模型和增加网络数量以形...
# [Mobicom'24]Mobile Foundation Model as Firmware *代码是否开源:是 [https://github.com/UbiquitousLearning/MobileFM]* ##文章摘要 >在当前的人工智能时代,智能手机等移动...
在MLP中,每层都进行线性变换后跟非线性操作。这种层级结构允许模型学习数据的多层次特征表示。随着层数的增加,模型的表示能力也随之增强 为什么要用MLP? •普适近似理论:...
1.相关工作 在探索多智能体系统(MAS)的研究领域中,强化学习(RL)技术的应用已经取得了显著的进展。现有的多智能体强化学习方法主要集中在如何通过交互学习来协调智能体的行为,以实现共...
研究背景第一视角视频通常是由头戴设备或身体装备的摄像机拍摄,提供从佩戴者视角出发的视觉信息。这种视频与传统第三人称视角视频相比,具有更高的个人化和动态性,但同时也由于视角的限制和信...
Tree of Thoughts: Deliberate Problem Solving with Large Language Models 论文链接:Tree of Thoughts: Deliberate Problem Solving with Large Language Models 发表会议:NeurlPS 2023...
本文提出了一种新的技术,通过与计算方法之间的重叠通信来有效地减少其数据通信开销。利用该技术,将一个识别出的原始通信群与依赖的计算操作一起分解为一系列细粒度的操作序列。通过创造更多重叠的机会和执行新创建的、更细粒度的通信和并行计算操作,有效地隐藏了数据传输延迟,实现了更好的系统利用率。