中科院于海斌等 | 基于多智能体深度强化学习的工业无线网络端边协同资源分配-金沙1005

中科院于海斌等 | 基于多智能体深度强化学习的工业无线网络端边协同资源分配

来源:搜狐网 | 作者:上市资管网 | 发布时间: 2022-02-18 | 215 次浏览 | 分享到:

边缘人工智能通过协同利用设备侧和边缘侧有限的网络、计算资源，赋能工业无线网络以支持复杂和动态工业任务。面向资源受限的工业无线网络，我们提出一种基于多智能体深度强化学习的资源分配（madrl-ra）算法，实现了端边协同资源分配，支持计算密集型、时延敏感型工业应用。首先，建立了端边协同的工业无线网络系统模型，将具有感知能力的工业设备作为自学习的智能代理。然后，采用马尔可夫决策过程对端边资源分配问题进行形式化描述，建立关于时延和能耗联合优化的最小系统开销问题。接着，利用多智能体深度强化学习克服状态空间维灾，同时学习关于计算决策、算力分配和传输功率的有效资源分配策略。为了打破训练数据的时间相关性，同时加速madrl-ra学习过程，设计了一种带经验权重的经验回放方法，对经验进行分类存储和采样。在此基础上，提出步进的 ε -贪婪方法来平衡智能代理对经验的利用与探索。最后，通过大量对比实验，验证了madrl-ra算法相较于多种基线算法的有效性。实验结果表明，madrl-ra收敛速度快，能够学习到有效资源分配策略以实现最小系统开销。

上一篇：深圳市宇顺电子股份有......

科创家之新传播投融资事件

2024-07-21

韩国风险投资公司

2022-05-26
海丽凯资本

2022-05-18
欧洲投资银行(eib)

2022-05-11
持续资本

2022-05-06
韩国国民年金基金(npf)

2022-04-29
新西兰成长资本合伙公司(nzgcp)

2022-04-22
科勒资本

2022-04-15
ardian

2022-04-08