什么是任务调度问题(JSP)
任务调度,这个听起来有点高大上的领域,其实在我们的日常生活中无处不在。你可以把它想象成是一位超级高效的秘书,负责安排公司里的各项工作任务。这位秘书要确保每个任务都能在合适的时间得到处理,既不能让员工闲着,也不能让工作堆积如山。在计算机科学中,任务调度就是这么一个角色,它负责指挥计算机系统中的各种任务按部就班地进行。
想象一下,我们的电脑或者手机,每天都要处理成千上万的任务,比如打开应用、运行程序、处理数据等。如果没有一个合理的调度策略,这些任务可能会相互打架,导致系统崩溃或者运行缓慢。任务调度的作用,就是像交通警察一样,指挥这些任务有条不紊地进行。它通过一系列精心设计的算法,比如优先级调度、轮询调度、公平调度等,来确保每个任务都能在适当的时候得到处理。
接地气一点来说,任务调度就像是我们厨房里的厨师长。你瞧,厨房里有洗菜的、切菜的、炒菜的,每个环节都有不同的任务。厨师长要根据客人的点单、食材的准备情况以及厨师的擅长领域,来合理安排每个人的工作。任务调度也是这样,它要根据任务的紧急程度、资源占用情况以及系统的整体负载,来决定哪个任务先执行,哪个任务后执行。
在逻辑严谨性上,任务调度领域的研究者们需要考虑的因素非常多。比如,如何保证重要任务优先执行,同时又不至于让不那么重要的任务饿死(即长时间得不到执行);如何在多任务并发的情况下,合理分配CPU、内存等资源,提高系统的吞吐量;以及如何在任务执行过程中,动态调整调度策略,以应对不断变化的系统环境。
总之,任务调度是计算机科学中的一个关键领域,它不仅关系到我们日常使用的电子设备的性能,还涉及到数据中心、云计算、物联网等多个领域的效率和安全。通过对任务调度的深入研究,我们能更好地利用计算机资源,提高工作效率,让我们的生活和工作更加便捷。
应用案例:云计算中的任务调度
在云计算环境中,资源调度问题可视为一个JSP问题。具体来说,可以将云计算中的任务视为任务,服务器视为机器,通过调度算法优化资源利用率和任务完成时间。以下是一个基本的云计算任务调度示例:
● 任务描述:客户提交一组渲染任务,每个任务有特定的计算量。
● 目标:最小化所有任务的最大完成时间。
● 解决方案:通过将任务分配给合适的服务器,使用量子计算技术优化调度方案,达到资源高效利用和任务尽早完成的目标。
JSP 的基本组成包括:
● 任务(Job):需要完成的任务,每个任务只有一道工序。
● 机器(Machine):执行任务的资源,每台机器一次只能处理一个任务。
● 调度(Schedule):安排任务给不同的机器,并决策任务在机器上的执行顺序(事实上在本文中的JSP问题中,任务在机器上的执行顺序对结果无影响)。
为了将问题抽象简化,将多机任务调度问题的假设总结如下:
➢ 1. 各任务需要的处理时间是一个确定的常数,只与任务有关;
➢ 2. 各任务需要的处理时间与所在的机器无关,即假设各机器的任务处理效率一致;
➢ 3. 各机器可以有不同的空闲开始时间,在此之前机器无法处理任务;
➢ 4. 同一个任务只能被分配到一台机器上运行;
➢ 5. 一台机器同一时刻最多只能处理一个任务;
➢ 6. 机器在处理完一个任务后立即执行下一个被分配的任务直到完成所有被分配的任务;
➢ 7. 所有的任务都要完成处理;
问题定义
各个任务所需的运行时间以及各机器空闲开始时间取值为整数(比如取定义的时间精度的整数倍)。这样做便于将组合优化模型转为QUBO(Quadratic Unconstrained Binary Optimization,二次无约束二值优化)形式,以适配专用量子计算机。
为了规范化表述,将多机任务调度问题用到的集合与数据做以下定义:
定义机器集合M,比如,机器的数量表示为|M|。
定义任务集合N,比如N={任务1,任务2,...},任务的数量表示为|N|。
定义任务 所需的处理时间为。
定义机器的空闲开始时间为。
下面的示意图以4台机器处理10个任务为例,纵轴为机器,横轴为时间,每台服务器的空闲开始时间分别为1,2,3,4,后面每个带有数字的方块代表分配到各机器上的任务对应的时长,一个让整体完成时间最短的分配方案如图,该方案也是让各机器负载均衡的一个最优解,即各机器完成时间尽可能接近。
JSP 的数学描述及QUBO模型
定义二值变量Xij,代表任务i是否分配到机器j上,如果任务i被分配到机器j,Xij=1,否则Xij=0。根据前述定义与假设,机器j的任务完成时间可表示为
下面根据不同的目标,分别给出对应的QUBO模型。
模型一最小化整体完成时间
针对第一种目标,即整体完成时间最短,首先建立组合优化模型如下:
定义变量为整体最晚完成的时间,也就是各个机器完成时间中的最大值,
目标函数
约束条件
约束(1)表示最晚完成时间u不小于任何机器的完成时间tj,由于目标函数是最小化最晚完成时间u,变量u将取到满足(1)的最小值,也就是最晚完成的机器对应的完成时间。约束(2)限制了对于任何任务只能被一台机器执行。
为了适配量子计算,需要将上面的组合优化模型转为QUBO形式,QUBO特点是所有决策变量为二值变量,目标是二次函数,且无约束条件。由于为整数,可用基于多个二值变量的二进制来表示:
其中为二值变量,取值0或1。为需要的二进制位数集合,取决于数据的值。这样求解的最小值就转变为求解的取值。
下一步将不等式约束(1)通过增加松弛变量的方式转化为等式约束。所有的松弛变量都是非负的。约束(1)可表示为:
由于松弛变量也是整数,将其二进制化,约束(1)可进一步表示为:
为了将等式约束化为目标函数的一部分从而满足QUBO形式,将等式约束改写为的形式,然后将左侧取平方,乘以足够大的惩罚系数加入目标函数即可。这样当约束被满足,目标项中的相关项也就为0。目标最小化求解会倾向于让所有惩罚项为零,即所有约束被满足。这样,原模型就可以转化为以下QUBO模型:
模型二最小化各机器完成时间差距(负载均衡)
针对第二种目标,即各机器完成时间差异最小,将最小化各机器完成时间的方差作为优化目标,建立组合优化模型如下:
目标函数
注意到各机器的平均完成时间与分配方案无关,是常数,将其定义为。
QUBO化的思路与上一模型一致,则QUBO模型可表达为:
模型代码
该代码可在Kaiwu SDK上运行求解。
# 导入numpy库,用于数值运算
1. import numpy as np
# 导入csv模块,用于读取和写入CSV文件
2. import csv
# 导入kaiwu SDK,并将其别名为kw
3. import kaiwu as kw
# 从kaiwu.qubo模块中导入特定的函数和类
4. from kaiwu.qubo import binary, details, spin, cim_ising_model, make, constraint
# 导入time模块,用于时间相关的操作
5. import time
# 是否将Ising矩阵写入csv文件
2. WRITE_MATRIX = False
3.
4. # 任务数量
5. N_TASK = 20
6. # 机器数量
7. N_MACHINE = 5
8.
9. # 索引集合
10. SET_TASK = {t for t in range(1, N_TASK + 1)} # 任务 1, 2, ..., N_TASK
11. SET_MACHINE = {m for m in range(1, N_MACHINE + 1)} # 服务器 1, 2, ..., N_MACHINE
12.
13. # 模型数据
14. DURATION = {t: np.random.randint(1, N_TASK + 1) for t in SET_TASK} # 随机任务持续时间 1 ~ 20
15. START = {m: np.random.randint(1, N_MACHINE + 1) for m in SET_MACHINE} # 随机服务器空闲开始时间 1 ~ 5
16.
17. # 约束惩罚系数
18. LAMBDA = 100000
1. # 决策变量
2. x = {(t, m): binary('x[' + str(t - 1) + '][' + str(m - 1) + ']') for t in SET_TASK for m in SET_MACHINE} # 任务i是否被分配给服务器j
3.
4. # QUBO目标函数
5. obj_function = 0.0
6. # variance项
7. obj_function += sum(
8. pow(
9. START[m] + sum(DURATION[t] * x[(t, m)] for t in SET_TASK) -
10. (sum(START[m] for m in SET_MACHINE) + sum(DURATION[t] for t in SET_TASK)) / N_MACHINE,
11. 2
12. )
13. for m in SET_MACHINE
14. ) / N_MACHINE
15. # 约束项
16. obj_function += LAMBDA * sum(pow(sum(x[(t, m)] for m in SET_MACHINE) - 1, 2) for t in SET_TASK)
17.
18. # 每个服务器的结束时间
19. machine_endtime = {
20. m: START[m] + sum(DURATION[t] * x[(t, m)] for t in SET_TASK)
21. for m in SET_MACHINE
22. }
23.
24. # 求解准备
25. obj_function = make(obj_function)
26. ci = cim_ising_model(obj_function)
27. ci.get_qubo()
28. ising = ci.get_ising()
29. matrix = ising["ising"]
30. bias = ising["bias"]
1. # 输出矩阵
2. if WRITE_MATRIX:
3. import pandas as pd
4. pd.DataFrame(matrix).to_csv('matrix ' + str(N_TASK) + ' task ' + str(N_MACHINE) + ' machine LAMBDA=' + str(LAMBDA) + '.csv')
5.
6. # 输出解字典
7. def get_solutions(the_matrix, the_output):
8. the_opt = kw.sampler.optimal_sampler(the_matrix, the_output, 0, negtail_ff=True) # 翻转负尾
9. the_best = the_opt[0][0]
10. the_vars = ci.get_variables()
11. the_sol_dict = kw.qubo.get_sol_dict(the_best, the_vars)
12. return the_sol_dict
13.
14. # 输出未满足约束条数
15. def get_count_constr_not_met(solution_dict, print_detail=False):
16. count_constr_not_met = 0 # 未满足约束总条数
17. for t in SET_TASK:
18. constr_value = kw.qubo.get_val(sum(x[(t, m)] for m in SET_MACHINE) - 1, solution_dict)
19. if print_detail:
20. print('constr_server_capacity', t, constr_value)
21. if constr_value != 0:
22. count_constr_not_met += 1
23. # print('number of constrs not met', count_constr_not_met)
24. return count_constr_not_met
25.
26. # 输出结果
27. def result_summary(the_sol_dict):
28. # 各机器完成时间
29. max_complete_time = 0.0
30. for m in SET_MACHINE:
31. complete_time = kw.qubo.get_val(machine_endtime[m], the_sol_dict)
32. # print('machine', m, 'complete_time', complete_time)
33. if complete_time > max_complete_time:
34. max_complete_time = complete_time
35. # 最晚完成时间
36. print('max_complete_time', max_complete_time)
37. # 未满足约束
38. print('constr_not_met', get_count_constr_not_met(the_sol_dict))
# 模拟器参数的搜索空间
1. search_space = {
2. 'pump': [2],
3. 'noise': [0.65],
4. 'laps': [200000],
5. 'dt': [0.35],
6. 'normalization': [0.6, 0.6, 0.6, 0.6], # [0.55 ~ 0.65]
7. 'iterations': [100]
8. }
9. for _ in range(10):
10. print(_, time.ctime())
11. gridsearch_output = kw.utils.grid_search_core(matrix, search_space, jobs=8)
12. # dict_keys: ['all_result', 'best_result', 'best_param', 'hamiltonian_log']
13. # 最优参数
14. opt_params = gridsearch_output['all_result'][0][2]
15. # 最优解向量,含spin
16. cim_best = gridsearch_output['all_result'][0][0]
17. best = (cim_best * cim_best[-1])[:-1] # 翻转负尾
18. # 哈密顿量H
19. H = gridsearch_output['all_result'][0][1]
20.
21. vars = ci.get_variables()
22. sol_dict = kw.qubo.get_sol_dict(best, vars)
23. result_summary(sol_dict)
总结
任务调度问题(JSP)是一个复杂但实用的优化问题,广泛应用于制造业、项目管理和云计算等领域。尽管求解 JSP 具有挑战性,但通过使用各种先进算法和技术,例如量子计算,可以有效优化调度方案,提升系统效率和资源利用率。
——end——