论文阅读:QECO-移动边缘计算(MCE)中基于DRL的面向QoE的计算卸载算法
摘要
在移动边缘计算(MEC)领域,高效的计算任务卸载对于确保用户的体验质量(QoE)至关重要。挑战:处理动态和不确定的移动环境。本文深入探讨了MEC系统中的计算卸载问题,其中严格的任务处理截止时间和能源限制可能会对系统性能产生不利影响。本文将计算任务卸载问题表述为一个马尔可夫决策过程(MDP),以最大化每个用户的长期QoE。我们提出了一种基于深度强化学习的分布式QoE导向的计算卸载(QECO)算法,该算法使移动设备能够在不需要了解其他设备所做的决策的情况下做出卸载决策。本文结果:能够完成14%更多的任务,并将任务延迟和能源消耗分别减少9%和6%;将平均QoE提高了37%。
简介
本文说,移动设备(MDs)技术虽然不断进步,但其有限的计算能力和电池容量可能导致任务丢失、处理延迟和整体较差的用户体验。通过将密集任务卸载到附近的边缘节点(ENs),可以增强计算能力、减少延迟和能源消耗,提高了用户的QoE。主要挑战在于:确定最优的卸载策略、调度任务、选择最适合的EN进行任务卸载、对延迟敏感等等。
而近期一些研究里,DRL被证明很有用,可以通过捕捉环境的动态性和学习实现长期目标的策略来确定最优的决策策略。作者先是列举了一些工作,然后说:QoE是一个随时间变化的性能度量,反映用户满意度,不仅受延迟影响,还受能源消耗的影响。作者指出,本文工作特点在于:尽管一些现有工作已经研究了延迟和能源消耗之间的权衡,但它们未能妥善解决用户需求和满足QoE要求,需要一种更全面的方法来解决实时场景中多个MDs和ENs的个体用户的动态需求。
故而,本文提出了一种基于DRL的分布式算法,深入研究了MEC系统中的计算任务卸载问题,其中严格的任务处理截止时间和能源限制可能会对系统性能产生不利影响。我们提出了一种分布式QoE导向的计算卸载(QECO)算法,利用DRL高效处理ENs处不确定负载下的任务卸载。该算法使MDs能够利用仅本地观察到的信息(如任务大小、队列详细信息、电池状态和ENs处的历史工作负载)做出卸载决策。
系统模型
定义MDs集合为

定义
通信模型
设
计算模型
计算任务可以本地执行也可以EN上执行,所以要分两种情况。
1.本地执行。这里的定义和上面基本差不多,先定义任务被处理完毕或者drop的时间
状态空间
上述的单独拎出来的公式都代表着状态。此外还有一些状态。首先是一个表示历史数据的矩阵
动作空间
动作是MD的动作。包括两部分:一个是是否卸载,一个是卸载到哪个EN。
QoE函数
定义为:
这样,最优策略就可以表达为:
