中科院于海斌等 | 基于多智能体深度强化学习的工业无线网络端边协同资源分配-金沙1005

 
中科院于海斌等 | 基于多智能体深度强化学习的工业无线网络端边协同资源分配
来源:搜狐网 | 作者:上市资管网 | 发布时间: 2022-02-18 | 215 次浏览 | 分享到:

边缘人工智能通过协同利用设备侧和边缘侧有限的网络、计算资源,赋能工业无线网络以支持复杂和动态工业任务。面向资源受限的工业无线网络,我们提出一种基于多智能体深度强化学习的资源分配(madrl-ra)算法,实现了端边协同资源分配,支持计算密集型、时延敏感型工业应用。首先,建立了端边协同的工业无线网络系统模型,将具有感知能力的工业设备作为自学习的智能代理。然后,采用马尔可夫决策过程对端边资源分配问题进行形式化描述,建立关于时延和能耗联合优化的最小系统开销问题。接着,利用多智能体深度强化学习克服状态空间维灾,同时学习关于计算决策、算力分配和传输功率的有效资源分配策略。为了打破训练数据的时间相关性,同时加速madrl-ra学习过程,设计了一种带经验权重的经验回放方法,对经验进行分类存储和采样。在此基础上,提出步进的 ε -贪婪方法来平衡智能代理对经验的利用与探索。最后,通过大量对比实验,验证了madrl-ra算法相较于多种基线算法的有效性。实验结果表明,madrl-ra收敛速度快,能够学习到有效资源分配策略以实现最小系统开销。


网站地图