边缘人工智能通过协同利用设备侧和边缘侧有限的网络、计算资源,赋能工业无线网络以支持复杂和动态工业任务。面向资源受限的工业无线网络,我们提出一种基于多智能体深度强化学习的资源分配(madrl-ra)算法,实现了端边协同资源分配,支持计算密集型、时延敏感型工业应用。首先,建立了端边协同的工业无线网络系统模型,将具有感知能力的工业设备作为自学习的智能代理。然后,采用马尔可夫决策过程对端边资源分配问题进行形式化描述,建立关于时延和能耗联合优化的最小系统开销问题。接着,利用多智能体深度强化学习克服状态空间维灾,同时学习关于计算决策、算力分配和传输功率的有效资源分配策略。为了打破训练数据的时间相关性,同时加速madrl-ra学习过程,设计了一种带经验权重的经验回放方法,对经验进行分类存储和采样。在此基础上,提出步进的 ε -贪婪方法来平衡智能代理对经验的利用与探索。最后,通过大量对比实验,验证了madrl-ra算法相较于多种基线算法的有效性。实验结果表明,madrl-ra收敛速度快,能够学习到有效资源分配策略以实现最小系统开销。
2024-07-21
2024-09-08
2024-09-08
2024-09-08
2024-09-08
2024-07-21
2023-01-13
2023-01-13
2023-01-13
2023-01-13
2023-01-06
2023-01-06
2023-01-06
2023-01-06
2023-01-06
2022-12-30
2022-12-30
2022-12-30
2022-12-30
2022-12-23
2022-12-23
2022-12-23
2022-12-23
2022-12-16
2022-12-16
2022-12-16
2022-12-16
2022-12-08
2022-12-08
2022-12-08
2022-12-08
2022-05-26
2022-05-18
2022-05-11
2022-05-06
2022-04-29
2022-04-22
2022-04-15
2022-04-08