近日,我院王鹏伟老师课题组在边缘计算与数据放置方面的研究工作被CCF A类期刊IEEE TPDS接收,这也是该课题组在云计算与边缘计算领域取得的系列重要进展之一。
受限于环境、成本等多重因素的影响,云数据中心的位置往往远离用户,导致应用和用户从云端获取数据时往往会有较高的延迟。广泛分布的边缘设备可以弥补云中心的这一缺点,通过将数据放置在更靠近用户的边缘,可以大大降低其请求延迟。同时,请求在边缘进行处理也大大缓解了云数据中心的带宽压力,降低了对应的成本。但边缘设备的资源往往是有限的,我们需要对数据进行合理的选择和放置来最大化资源的利用率。本研究受PageRank算法思想的启发,提出了一种基于区域价值的边缘数据放置策略。
首先,现有研究一般基于用户对数据的访问频率等属性来进行数据放置,这通常被描述为“受欢迎程度”。我们注意到用户对数据的请求具有明显的时间和空间特征,这对数据放置策略具有很大的影响。例如,不同文化背景的区域对在线视频内容的偏好差异可能会很大。同样的数据内容在不同的地区会表现出不同的受欢迎程度,在一个地区内,其受欢迎程度也会随着时间的变化而波动。为了更好地表示数据在时空两维上的变化,我们提出了“数据温度”的概念,并结合数据的不同属性给出了其计算方法。
其次,边缘服务器往往不是独立存在的,当用户无法在自身区域内的边缘服务器获取到数据时,也可以到临近的其它边缘服务器上获取。因此,在确定数据放置的方案时,我们需要综合考虑数据在不同区域之间的关联性,这在很大程度上影响了边缘存储资源的利用率。团队借鉴PageRank的算法思想,提出了区域价值的概念,并结合数据温度给出了相应的计算模型。在此基础上,团队设计了一种启发式的区域价值算法,综合考虑了数据的时空特征和区域间的相关性,以更少的副本数目实现了更好的放置效果。
实验结果表明,与现有的数据放置策略相比,本研究方法在成本、延迟、缓存命中率等方面均展现出显著优势。
IEEE Transactions on Parallel and Distributed Systems(TPDS)属于中国计算机学会CCF A类期刊,是计算机系统领域最权威的国际学术期刊之一,专注于并行和分布式系统领域的研究。