2021年度  第8期


标题:基于DPPO的自适应码率控制算法
作者:汤佳斌1;高伟2;滕国伟1
作者单位:1 上海大学通信与信息工程学院,上海 200444;2 上海文广科技(集团)有限公司,上海 200233
关键字:自适应码率控制;强化学习;视频流媒体
摘要:与传统的视频点播服务相比,实时视频流对用户质量体验(Quality of Experience,QoE)要求更高。现在已有的自适应传输控制算法,多数基于吞吐量或者缓存区等特定的规则,无法适应复杂的网络环境。因此提出了基于DPPO(Distributed Proximal Policy Optimization)的码率自适应方法,利用强化学习使模型在大量的网络轨迹中自我学习,选择出当前网络环境的最优比特率,能够最大化提升用户质量体验,并且不局限于固定规则。还发现有些视频在低码率下,其质量分数并不低,因此可以把视频质量分数作为QoE的一个指标,希望在不损失视频质量的情况下,减少发送的比特率。将该算法与QARC(Quality Aware Rate Control)进行仿真比较,在同样的环境下,延迟可降低13%~25%,发送的比特率能降低2.4%~9.4%,而视频质量可提升3.4%~3.6%,达到较佳的控制效果。