基于Spark的异构集群调度策略研究 Adaptive Scheduling Strategy for Heterogeneous Spark Cluster

doi:10.12677/CSA.2016.611084

Computer Science and Application
Vol.06 No.11(2016), Article ID:19027,13 pages
10.12677/CSA.2016.611084

Adaptive Scheduling Strategy for Heterogeneous Spark Cluster

Jiajun Xu, Gongshen Liu, Bo Su, Kui Meng

Shanghai Jiao Tong University, Shanghai

Received: Nov. 3^rd, 2016; accepted: Nov. 21^st, 2016; published: Nov. 24^th, 2016

This work is licensed under the Creative Commons Attribution International License (CC BY).

http://creativecommons.org/licenses/by/4.0/

ABSTRACT

The scheduling strategy of Spark assumes that cluster is homogenized. However, as the change or update of hardware in cluster, it becomes more and more heterogeneous. Thus, the original scheduling strategy cannot meet the performance requirement anymore and short board effect gradually emerges. The paper proposes a new strategy to solve this problem. The new strategy refers the idea of hierarchical scheduling. It combines the task complexity, worker performance and worker CPU usage as its scheduling factors to improve the scheduling performance. And experiments show that the new strategy is absolutely effective.

Keywords:Spark, Heterogeneous Cluster, Scheduling Strategy

基于Spark的异构集群调度策略研究

徐佳俊，刘功申，苏波，孟魁

上海交通大学，上海

收稿日期：2016年11月3日；录用日期：2016年11月21日；发布日期：2016年11月24日

摘要

Spark的原生调度策略建立在集群同质化的基本假设上。然而随着硬件的更迭以及高性能硬件的引入，集群异质化现象日趋显著。因此现有的调度策略在异构集群环境下并不高效，短板效应严重。针对这个问题，本文提出了一种新的调度策略以优化Spark在异构集群下的表现。新策略引入了分层调度的思想，调度时综合考量了任务复杂度、节点性能及节点资源使用情况等因素，实现了更加高效公平的任务调度算法。通过仿真和真机实验，证明了新策略的效果相对于原策略有明显提升。

关键词 :Spark，异构集群，调度策略

1. 引言

随着大数据时代的到来，几乎所有行业都开始面临着大数据处理带来的挑战，海量数据的分析处理已经无法继续在单一节点的机器上完成，即便计算机性能按照摩尔定律已经越来越高，但依然无法满足需求。因此如何构建大数据的分布式计算平台成为了基础但也极具挑战性的工作。

为摆脱单一节点的瓶颈限制，一般采用分布式并行的计算框架搭建集群。其中MapReduce [1] 是目前最广为采纳的一种，基于该框架，Apache于2005年实现了Hadoop [2] 系统，并通过Hive和HDFS提高了分布式数据库和文件系统访问效率。由于Hadoop的实现基于文件读写，所以在处理迭代性强、I/O密集型的任务时，存在致命的瓶颈，而且主要通过冗余实现容错，效率较低。因此在2009年，Spark [3] 系统在加州大学伯克利分校AMP实验室应运而生，首创的RDD [4] 存储结构实现了被处理数据的内存直接访问，极大提高了访问效率也避免了频繁的文件I/O交互，同时也采用Lineage机制，保证了系统的容错性。另外还对Hive、HDFS兼容，并且提供了RDD数据的用户级处理接口，极大提高了系统的灵活性。因此，Spark已经成为当下主流的分布式计算系统。

然而，无论是Hadoop还是Spark，都基于一个理想化假设，即集群节点同构性的存在。然而实际集群环境下，由于数据中心硬件资源的更迭、GPU等高性能计算组件的引入等原因，集群异构性 [5] 问题广泛存在。另外，任务本身也存在异构性问题，计算密集型和I/O密集型任务对计算资源需求不一致，分配节点时也应考虑。而目前Spark平台在做任务调度时，并不考虑集群异构性及节点资源利用情况，则集群中各节点在任务执行时会出现负载不均衡的问题，导致一部分节点资源消耗过载，另一部分冗余的问题。由于短板效应，整体效率将受制于集群的弱节点，导致整体性能的下降。

因此本文基于Spark，提出了一种新的异构集群调度策略，来解决上述问题，以期提高整体执行效率。

章节2将分析目前Spark如何实现任务调度，并对现有的一些针对分布式集群异构性问题的解决方案进行总结并给出本文的新思路；章节3将详述本文的调度策略思路；章节4将通过实验验证该策略的可行性和效果；章节5将总结并给出一些后续思考。

2. 相关研究及创新

2.1. 现有方案分析

由于Hadoop技术更加成熟且在企业内使用更广且更久，因此目前针对分布式计算平台集群异构问题的优化方案主要集中在Hadoop平台，如：Facebook, Twitter, Amazon, Baidu等。Yahoo和Facebook也在调度策略方向做过研究，分别提出了Capacity Scheduler [6] 和FAIR Scheduler，均已被Apache加入到Hadoop中。2009年，Matei Zaharia [7] [8] 提出了Delay Scheduling的策略，并开发了FAIR Scheduler，解决了多用户资源分配公平性问题和单队列阻塞问题，Spark FAIR Scheduler的思路即来源于此。2005年，Edmund B. Nightingale [9] 提出了Speculative Task Execution Strategy (STES)，其思路是当节点空闲时静默预测执行其他节点在本地的任务副本，提高节点利用率，通过执行前保存快照，确保预测失败可回滚。2008年，Matei Zaharia [10] 改进了STES，提出了Improved STES，用任务的预计完成时间替代任务完成进度作为调度依据。2009年，Mark Yong [11] 提出了Task Tracker Resource Aware Scheduler (TRAS)，因为即便是Improved STES也会因为副本分布不均导致资源分配不均，即可预测执行的任务集中在忙碌节点附近。TRAS在Hadoop的任务跟踪器(Task Tracker)中引入资源监控模块，记录节点资源使用情况，然后在作业跟踪器(Job Tracker)中加入了两种调度策略，一种是依据监控数据动态分配每个Task Tracker的执行任务数；另一种是固定执行Task Tracker的任务数，将所有可用执行节点存放于队列中用于调度。该策略考虑了资源使用情况，并利用延迟调度保证了资源分配的相对公平。2013年，Zhuo Tang [12] 提出了Map Reduce Task Scheduler for Deadline (MTSD), MTSD首先将异构集群中的所有节点根据计算能力划分为多个层级，再针对不同级别节点估算其上任务的预计完成时间，区分Map任务和Reduce任务，然后根据完成时间和任务截止时间作为依据调度。2014年，Xiaolong Xu [13] 提出了Adaptive Task Scheduling on Dynamic Workload Adjustment(ATSDWA)，ATSDWA在每个节点部署了一个监测模块，收集节点资源使用情况和执行时间。每个节点根据硬件配置初始化最大任务数，并由任务调度器(Task Scheduler)在每个心跳包传输时反馈，然后依据监测信息动态调整各节点最大可运行任务数，从而实现了Hadoop的动态自适应调度。

Spark方面，2016年，Zhiwei Yang提出了Heterogeneous Spark Adaptive Task Scheduling (HSATS)，其思路与ATSDWA类似，在Worker节点加入监测模块，并在Task Scheduler中加入节点权值动态调整算法，根据节点的实时权值完成调度。

综上所述，异构集群的调度优化问题的解决思路演化大致是从单队列到多队列、静态分配到动态调节、按序执行到预测执行，另外在此基础上，调度反馈、剩余时间估计、异构集群分区等思路也不断在被挖掘和优化。不过更多研究成果依然集中在Hadoop上，随着Spark的崛起，企业也将慢慢由Hadoop向Spark转型，相信更多的研究也将随之转向Spark，不过Hadoop的研究及成果仍有重要的参考意义。

2.2. 新思路

前文概述了异构集群调度优化的既有解决方案，包括Hadoop和Spark。下面给出一种新的思路。

之前的解决思路更多关注的是如何实现异构集群资源的平均分配，即希望通过调度策略使异构集群在资源利用层面上可视为同构。而本文希望在此基础上，再充分利用集群异构性，以提高集群效率。

存储体系中，常通过多级高速缓存提高整体系统的效率，高速缓存的特点即单点效率高但容量较小。这里就是利用了存储介质的异构性，通过引入高性能的异构介质实现了整体系统的效率提升。同理，目前的分布式集群仍处于单层结构，而计算元件其实也类似于存储元件，其性能在不断提高，所以单层的集群结构是有待优化的。所以笔者的异构集群优化思路就是通过将集群进行分层，实现整体效率提升。其在实际应用场景的意义在于，可以通过向集群中引入少量高速元件作为高性能节点，从而提高整体分布式系统的效率。而该策略关键要解决的问题就在于如何将集群分层并将不同复杂度的任务按需分配到各个层级节点上。

因此本文的调度策略的主要思路即在现有的动态调节基础上，引入分层调度思想，以期实现整体性能的提升。

3. 调度架构及策略

3.1. 任务识别

Spark在提交作业(Job)后，会将其划分为多个阶段(Stage)，并根据之间的依赖关系进一步切分为多个任务(Task), Task是最终调度的基本单元。这一节将从微观的角度分析任务识别的可行性。

首先，当所提交程序调用Spark的Transformation或Action操作接口时，SparkContext会对传入的闭包进行序列化检查，保证其可序列化传输并反序列化执行。清理好的闭包函数将作为初始化参数写入创建的RDD中。此时，Spark即将RDD数据和闭包处理函数绑定，由于RDD是Spark的数据流主线，所以中间无论是执行Stage划分调度还是Task划分调度，都不影响RDD与其闭包的绑定关系。当最终分配到Worker节点上的Executor开始实际执行时，会解析并调用RDD上绑定的闭包执行函数对数据进行迭代操作。

所以从微观角度分析，闭包操作是可以追溯的，因此可以通过在RDD创建时，对传入的闭包进行复杂度分析，得到闭包复杂度并写入RDD，作为最终调度时的参考指标。

定义一：(任务复杂度) 定义为每个任务的复杂度，为任务总数。调度策略将依据任务的复杂度决定调度的优先级。

3.2. 集群分层

集群异构性随着硬件更迭和高性能硬件引入将趋于显著，目前Spark调度仅依据CPU核数实现调度，该假设对实际的异构集群并不“公平”。一方面，单一CPU核心的计算能力存在明显差异；另一方面，GPU等高计算性能硬件的计算能力远高于CPU，以核心数进行分配，实际上忽略了每个核心本身的异构性，调度粒度不够细。

所以本文的调度方案首先将集群根据核心的性能进行分层，作为最终调度策略的指标之一。基本分层思路是在集群的不同节点上取单一核心，在其上分别运行多个benchmark作业并记录相应的执行耗时，根据指定的分层数进行划分。

定义二：(节点性能指数) 定义为节点性能指数，为节点个数，该指数大小代表对应节点的CPU计算性能，指数越大，说明该CPU性能越强。

定义三：(节点分层级别) 定义为集群分层数，为节点计算性能的级别，的定义如下：

(1)

其中，公式中的是一个大于1的常数，定义为分层指数，这样最终分层结果服从以分层指数为底的指数函数，即越高级别的节点越少，而低级别的节点较多，符合分层的期望。

根据上述两个定义，下面给出集群节点的分层算法。

算法一 (节点分层算法)

T[]// benchmark任务完成时间, size = N

L[]//节点层级信息, size = K

foreach Worker i

运行benchmark任务

T[i] = 执行时间

end

T[]按升序排序

T[]根据T[1]归一化

L[1].add(Worker 1)

for (j = 2 to T.size)

tmp = 1

level = 0

while (tmp< T[j])

tmp *= α

level++

end

level = min(level, K)

L[level].add(Worker j)

end

return L[]

算法的基本思路如下：

1. 首先遍历Cluster中的所有Worker，并分别运行同一组benchmark任务，统计每个Worker的执行时间；

2. 将得到的结果按升序排序，即约靠前的节点，执行时间越短，相对性能越强；

3. 以最短执行时间结果为标准，对数组初始化，用以后续评估；

4. 先将第一个节点归为节点，然后依次遍历，并根据定义三得到所有节点对应的分层结果。

根据上述算法，将得到各层级的节点集合，然后可为对应的节点定义其，即相同级别的节点的性能指数相等，依据级别划分性能指数的主要目的是排除偶然性。另外，可将算法一中运行的benchmark进行多次更换得到多个分级结果，得到分级矩阵，行代表不同节点，列代表不同benchmark，最终取节点在所有benchmark中分级的众数作为节点最终分级结果。

3.3. 节点检测

前文提及Spark任务调度依据核心数作为分配依据，但根据核心数分配是一种静态思路，核心本身存在忙闲状态，对于在忙的CPU也存在其上队列长度的不同，因此需要动态对CPU使用情况及其上任务队列进行监控，方可实现任务的动态调度优化。

Spark集群是主从式结构，Master和Worker之间利用RPC机制实现通讯，因此可在每个Worker节点上添加一个检测模块，因为要保证Master和Worker的连接，之间会存在心跳(Heartbeat)信息交互，我们可以利用每次心跳信息交互的契机，同步一次当前节点的资源使用情况，Master在本地保存一份Worker节点的资源利用表，作为下一次资源分配时的依据，以实现资源的动态分配。

具体检测的节点参数主要有：队列长度、CPU使用率、节点性能指数三种。单节点上队列长度将影响该节点的完成时间，一般队列越长，其上的预期执行时间越长，则应该尽可能减少其上任务的分配，另外Spark执行时存在依赖，若队列过长，还可能造成其他节点任务依赖于队列中某个任务，导致整个作业的阻塞，因此要检测队列长度从而在调度时避免长队列的出现。而CPU使用率直接反映了节点核心的忙闲，CPU占用过高，说明节点可用的计算资源匮乏，即再分配任务可能需要等待计算资源的释放，造成延迟，所以调度时应可能平衡各节点的CPU占用。性能指数，如前定义二所述，反映了节点的性能，调度时，需要按各节点的承受能力，即性能为其合理分配任务队列，另外，高复杂度的任务也应尽可能交由高性能节点执行，以减少低性能节点负载从而提高整体作业的效率。

Spark上调度结构如图1。

Driver启动Job后，将会创建对应的Task Scheduler作为整个作业的任务调度器，当需要任务分配时，会根据任务所需资源向Master的集群管理器(Cluster Manager)申请运行资源，此时，Cluster Manager会获取所以Worker节点上的可用Executor信息作为其任务的可分配资源池。当任务分配到Executor后，Executor会向Driver注册并通过Heartbeat消息与其保持连接。此时可通过创建新的Heartbeat消息，将CPU状态同步传输给Task Scheduler, Task Scheduler则将其记录并保存，作为其调度指标。

Heartbeat消息交互模型如图2。

具体的交互流程如下：

1. Executor被Master分配给Driver执行Job时，会向Driver发送注册信息，Driver即获取了Executor的基本信息；

2. Executor开始实例化并初始化执行时，会启动一个Heartbeater，如图2所示，同时Heartbeater上回绑定一个Heartbeat Task，即每次心跳时所执行的任务；

3. 每次心跳执行到该任务时，Executor会创建一个Heartbeat消息，该消息包装了所需要向Driver传输的数据，可通过重构消息的结构完成自定义消息的传输；

4. Executor发送消息后，会由Driver的Heartbeat Receiver接收到，并进行消息的解析，将上述的参数保存在Driver中，用于后续调度使用。

3.4. 集群分层调度方案

前三节已经分别从任务、集群和节点三个层次对Spark调度分别进行了分析。本文将综合上述三个因素，实现最终的调度策略。

Figure 1. Spark cluster scheduling structure

图1. Spark节点调度结构

Figure 2. Heartbeat message interaction

图2. Heartbeat消息交互

首先，在任务执行前，将预先执行分层算法(算法一)，对当前的集群环境进行分析，并依据分析结果，将所有节点的性能指标数据写入Spark的配置文件，Spark将会在初始化时读取并存入SparkEnv作为后续调度指标之一。该预执行作业会在以下情况发生时触发：

1. 集群硬件环境发生改变；

2. 分层数配置变化，如：从3层到5层；

3. 无层级信息数据；

4. 配置文件距上次更新时间过长，数据过期。

然后，Spark开始正式启动，到创建RDD时，会解析传入的闭包操作复杂度，将其复杂度记录到RDD上。Job经过DAG Scheduler和Task Scheduler的划分，开始进行最终资源分配时，将会存在以下调度参数：对于Task，将存在C_p；对于待分配的Executor，存在三元组(P_i, running Tasks.len, CPU Usage)，分别代表该Executor的节点性能参数，其上执行队列的长度，以及Task Scheduler中记录的节点CPU使用情况。算法将在Task Scheduler中引入计算模块，计算每个Executor相对于待调度任务的得分，再结合其复杂度，完成Executor调度。

调度器系统结构如图3。

定义四：(评估函数)定义为Executor上执行队列长度，为其CPU使用率。定义为Executor的当前执行能力指数。

(2)

其中，、表示对应的评估指数，表示执行队列长度阈值，表示使用率阈值，当Executor的两个指标均超过阈值时，会降低该Executor的分配优先级，主要是防止出现单点密集分配的情况。函数值越小，说明执行能力越强。

定义五：(复杂度转化函数)定义为复杂度转化函数，将复杂度转化为最优节点计算性能指数。调度时将会优先分配性能指数大于等于的节点。若未分配成功，则分配层级从向下依次选取，直至找到合适的Executor。

Figure 3. Scheduling strategy structure

图3. 调度策略结构

(3)

其中表示所定义的性能指标的峰值。

算法二 (节点调度算法)

G[] //可执行Executor信息

selected = NULL //所选Executor

foreach Executor q

if (lenq>lenth || Uq>Uth)

break

G[].add({q, f(lenq, Uq)})

end

G[]按升序排序

for (i = g(Cp) to K)

for (j = 1 to G.size)

level = get Executor G[j].q level

if (level ≥i)

selected = Executor G[j].q

end

for (i = g(Cp)-1 to 1)

for (j = 1 to G.size)

level = get Executor G[j].q level

if (level ≥i)

selected = Executor G[j].q

end

if (selected == NULL)

selected = Random(Executors)

return selected

算法的基本思路如下：

1. 首先遍历所有Executor，排除所有队列长度或CPU使用率超过阈值的Executor，并根据定义四的评估函数，得到当前每个Executor的可执行能力，并将队列升序排序G；

2. 根据定义五的转化函数，计算得到当前复杂度的任务的最优执行层级；

3. 先遍历G，得到大于等于最优执行层级的Executor；

4. 若上一轮遍历没有满足的Executor，则再次遍历，获取小于最优层级的Executor；

5. 若最终依然没有结果，则随机调度。

4. 实验分析

实验部分将从算法仿真和真机两个角度进行调度策略分析，分析的指标主要是运行时间长短和各节点分配是否均衡。

4.1. 仿真实验

为验证调度策略本身的算法性能，本文通过代码仿真了异构集群环境下任务的生成和调度。实验思路如下：

1. 节点仿真：主要参数有性能指标、CPU使用率、任务队列。节点参数根据正态分布生成。

2. 任务仿真：主要参数有执行时间、消耗CPU。任务参数根据正态分布生成。任务的生成过程采用泊松分布。

3. 任务运行：任务被分配到节点运行时，消耗CPU将累计到节点CPU使用率上，并加入其任务运行队列。另外任务的执行时间将根据节点性能变化，即性能越高，所需要的执行时间越短。

4. 调度仿真：Spark的原生策略用随机调度仿真，本文调度策略同上文所述。

本次仿真实验将多次统计作业的完成时间，以及集群各节点的使用率。运行时间的均值作为执行效率的指标，使用率作为分配是否均匀的指标。

实验一：(相同任务数运行时间对比)实验结果如图4所示。可见运行时间在相同执行节点条件和任务数下，新策略运行时间明显缩短。

实验二：(相同任务数节点分配对比) 实验结果如图5所示。可见在相同节点条件和任务数下，新策略的节点分布更加均匀。

实验三：(不同任务数运行时间对比) 实验结果如图6所示。可见相同节点条件下，随着任务数的增加，新策略的运行时间均短于原策略，且优势趋于明显(因为节点数少时，随机调度的大数原理相对不明显，导致调度过于集中而超过了单一节点的负载，时间明显变长)。

实验四：(不同任务数节点分配对比) 实验结果如图7所示。可见相同节点条件下，随着任务数的增加，节点的分配一直比原策略均匀，新策略在任务数增加依然可以保证均匀分配。

上述四个仿真实验，在模拟环境下推演了新策略的理论效果，且分别从运行时间和分配均匀度两个方面证明了新策略的优势，另外算法参数在实验中保持一致，实际使用中还可以通过多次实验对参数配置进行调优以提高执行效率，因此新策略是理论上是有效的。

Figure 4. Time comparison of multiple experiment with the same task number

图4. 相同任务数多次实验运行时间对比

Figure 5. Distribution comparison of multiple experiment with the same task number

图5. 相同任务数多次实验分配情况对比

4.2. 真机实验

上一节从仿真角度分析了新算法的优势。本节将于真机环境进行模拟实验。由于条件限制，无法完全模拟真实的异构集群环境，这里通过配置文件硬编码的方式，构建了虚拟异构集群。其中集群部署于阿里云，共3台机器，1个Master加3个Worker(Master本身也作为Worker)。配置为：Master(双核，4G内存)，Worker(单核，2G内存)。实验程序采用简单的WordCount，然后在集群中多次运行不同大小的作业文件作为变量。

实验五：(不同作业大小WordCount运行时间对比) 实验结果如图8所示。图中运行时间为多次运行后的平均值，可见真实环境下，新策略确实缩短了WordCount的运行时间。

Figure 6. Time comparison of multiple experiment with different task number

图6. 不同任务数多次实验运行时间对比

Figure 7. Distribution comparison of multiple experiment with different task number

图7. 不同任务数多次实验分配情况对比

Figure 8. Time consumptions of multiple experiments with different job size

图8. 不同作业大小多次实验运行时间对比

不过由于条件限制，实际的效果受到了多方面因素的影响，如实验环境并不是真实的异构集群，实验集群相对较小等。

但通过上述的仿真加真机模拟实验，仍可证明新策略相对于旧策略的性能优势。同时，还提供了新的提高集群执行效率的思路，即利用集群异构性，分层调度，以发挥高性能节点的计算优势，避免短板效应导致的整体集群运行效率下滑。

5. 结论

综上所述，新的调度策略在异构集群环境下可以让任务调度更均匀，并且减少作业整体的运行时间，提高集群的整体运行效率。该策略将切实地优化Spark在实际集群环境中的运行效率，有较高的使用意义。另外也提供了一种快速提升集群工作效率的方式，若作业中存在高计算量任务时，可通过在集群中引入少量GPU等高性能元件，然后使用该策略，Spark将会识别出其中的高计算量任务并优先分配给这些高性能元件，这样整体的运作效率不会因为任务的复杂度提高而下降，同时也充分地利用了新引入的高性能元件，具备一定的工程意义。

下一步的工作将集中在如何优化本文中的细节算法，实现任务复杂度的自动识别以及如何用机器学习的手段自动对算法参数进行调优，从而让调度策略更智能。

致谢

在此感谢国家自然科学基金项目的支持，感谢研究生导师刘功申先生的指导和帮助，也要向所有文献作者、研究前辈们表示感谢。

基金项目

国家自然科学基金项目(编号：61472248)。

文章引用

徐佳俊,刘功申,苏波,孟魁. 基于Spark的异构集群调度策略研究
Adaptive Scheduling Strategy for Heterogeneous Spark Cluster[J]. 计算机科学与应用, 2016, 06(11): 692-704. http://dx.doi.org/10.12677/CSA.2016.611084

参考文献 (References)

1. Dean, J. and Ghemawat, S. (2008) MapReduce: Simplified Data Processing on Large Clusters. Communications of the ACM, 51, 107-113. https:/doi.org/10.1145/1327452.1327492

2. Borthakur, D. (2007) The Hadoop Distributed File System: Architecture and Design. Hadoop Project Website, 11, 21.

3. Zaharia, M., Chowdhury, M., Franklin, M.J., et al. (2010) Spark: Cluster Computing with Working Sets. HotCloud, 10, 10.

4. Zaharia, M., Chowdhury, M., Das, T., et al. (2012) Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing. Proceedings of the 9th USENIX Conference on Networked Systems Design and Implementation, USENIX Association, 2.

5. 杨志伟, 郑烇, 王嵩, 等. 异构Spark集群下自适应任务调度策略[J]. 计算机工程, 2016, 42(1): 31-35, 40.

6. Thakur, S., Singh, R. and Sharma, S. (2015) Dynamic Capacity Scheduling in Hadoop. International Journal of Computer Applications, 125. https:/doi.org/10.5120/ijca2015906178

7. Zaharia, M. (2009) Job Scheduling with the Fair and Capacity Schedulers. Hadoop Summit, 9.

8. Zaharia, M., Borthakur, D., Sen Sarma, J., et al. (2010) Delay Scheduling: A Simple Technique for Achieving Locality and Fairness in Cluster Scheduling. Proceedings of the 5th European Conference on Computer Systems, ACM, 265- 278.

9. Nightingale, E.B., Chen, P.M. and Flinn, J. (2005) Speculative Execution in a Distributed File System. ACM SIGOPS Operating Systems Review, ACM, 39, 191-205.

10. Zaharia, M., Konwinski, A., Joseph, A.D., et al. (2008) Improving MapReduce Performance in Heterogeneous Environments. OSDI, 8, 7.

11. Yong, M., Garegrat, N. and Mohan, S. (2009) Towards a Resource Aware Scheduler in Hadoop. Proceeding of ICWS, 102-109.

12. Tang, Z., Zhou, J., Li, K., et al. (2013) A MapReduce Task Scheduling Algorithm for Deadline Constraints. Cluster Computing, 16, 651-662. https:/doi.org/10.1007/s10586-012-0236-5

13. Xu, X., Cao, L. and Wang, X. (2014) Adaptive Task Scheduling Strategy Based on Dynamic Workload Adjustment for Heterogeneous Hadoop Clusters.

期刊菜单