4.2 调整惩罚系数

案例：基于松弛变量的JSP问题QUBO建模

JSP问题是一个复杂的组合优化问题，目标是在满足一定的约束条件下，合理地分配资源，优化生产过程中的作业顺序，以最小化完成所有任务的总时间、最大化资源利用率或降低成本等，基于CIM和Kaiwu SDK可以轻松求解。

在任务调度模型中，假设与约束条件总结如下：

（1）各任务仅包含一道工序；
（2）各任务的加工时间已知，与机器无关；
（3）一台机器在任意时刻最多只能处理一个任务；
（4）每个任务可以分配到任意一台机器加工，且只能在一台机器上加工；
（5）每个机器可以有不同的空闲开始时间。

JSP示意图

和任务调度模型一样，这个问题的QUBO建模常常包含多种约束，每种约束针对不同实体会产生多个约束条件。使用QUBO建模需要将约束条件转为约束项并给定合适的惩罚系数，如果惩罚系数过大，会导致系数矩阵的精度超过相干光量子计算机的精度限制，如果惩罚系数过小，会导致求解的过程中的约束条件无法优先满足，最优解不是可行解的情况。因此，对于这种存在大量约束条件的问题，需要一些方法自动为每个约束确定惩罚系数。

定义变量 $u$ 为整体最晚完成的时间，也就是各个机器完成时间中的最大值，则该最优化为：

\begin{aligned} min u = min max_{j \in M} t_{j} \\ s . t . & u \geq \sum_{i \in N} W_{i} x_{i j} + S_{j} & \forall j \in M \\ \sum_{j \in M} x_{i j} = 1 & \forall i \in N \end{aligned}

约束（1）表示最晚完成时间 $u$ 不小于任何机器的完成时间 $t_{j}$ ，由于目标函数是最小化最晚完成时间 $u$ ，变量 $u$ 将取到满足（1）的最小值，也就是最晚完成的机器对应的完成时间。约束（2）限制了对于任何任务只能被一台机器执行， $W_{i}$ 表示任务i的花费时间， $s_{j}$ 是机器 $j$ 的启动时间。

将上面的模型转为QUBO形式，由于 $u$ 为整数，可用基于多个二值变量的二进制来表示：

u = \sum_{l \in L} 2^{l} u_{l}

其中 $u_{l}$ 为二值变量，取值 $0$ 或 $1$ 。 $l$ 为需要的二进制位数集合，取决于数据的值，这样求解 $u$ 的最小值就转变为求解 $u_{l}$ 的取值。

下一步将不等式约束（1）通过增加松弛变量 $γ$ 的方式转化为等式约束，所有的松弛变量都是非负的。约束（1）可表示为：

u = \sum_{i \in N} W_{i} x_{i j} + S_{j} + γ_{j} \forall j \in M

由于松弛变量也是整数，将其二进制化，约束（1）可进一步表示为：

\sum_{l \in L} 2^{l} u_{l} = \sum_{i \in N} W_{i} x_{i j} + S_{j} + \sum_{l \in L} 2^{l} γ_{j l} \forall j \in M

为了将等式约束化为目标函数的一部分从而满足QUBO形式，将等式约束改写为 $f (x, u) = 0$ 的形式，然后将左侧取平方，乘以足够大的惩罚系数 $γ$ 加入目标函数即可，这样当约束被满足，目标项中的相关项也就为 $0$ 。目标最小化求解会倾向于让所有惩罚项为零，即所有约束被满足，这样原模型就可以转化为以下QUBO模型：

\begin{aligned} min_{u, x, γ} & \sum_{l \in L} 2^{l} u_{l} \\ + \sum_{j \in M} λ_{1 j} {(\sum_{l \in L} 2^{l} u_{l} - \sum_{i \in N} W_{i} x_{i j} - S_{j} - \sum_{l \in L} 2^{l} γ_{j l})}^{2} \\ + \sum_{i \in N} λ_{2 i} {(\sum_{j \in M} x_{i j} - 1)}^{2} \end{aligned}

其中，我们需要处理两类核心约束：

（1）任务分配约束（硬约束）

\sum_{j \in M} x_{i j} = 1 \forall i \in N

该约束确保每个任务必须分配到唯一机器，使用下界法计算惩罚系数下界：

λ_{1} > \frac{Δ f_{max}^{(t a s k)}}{Δ P_{min}^{(t a s k)}}

（2）机器时间约束（松弛等式）

\sum_{l} 2^{l} u_{l} = \sum_{i} W_{i} x_{i j} + S_{j} + \sum_{l} 2^{l} γ_{j l} \forall j \in M

该约束通过松弛变量转化，需计算二次惩罚项系数：

λ_{2} > \frac{Δ f_{max}^{(m a c h i n e)}}{Δ P_{min}^{(m a c h i n e)}}

总结

本文介绍了自动确定惩罚系数的方法，包括惩罚法（Penalty Method）、下界法直接估计和迭代确定三种思路。这些方法可有效解决在量子计算中惩罚系数难以确定的问题，为求解大规模组合优化问题提供新的思路。通过不断优化惩罚系数，可以在满足约束条件的同时，更好地优化目标函数，从而提高求解效率和质量。

显然，基于Kaiwu SDK，用户只需关注建立与场景所对应的数学模型，SDK提供的方法可以自动确定惩罚系数，这将极大降低使用相干光量子计算机求解实际问题的难度。

1.1 量子计算介绍

1.2 相干光量子计算机

1.3 Ising（伊辛）模型＆QUBO模型

1.4 CIM求解组合优化问题过程

2.1 TSP实例教学

3.1 Kaiwu SDK

3.2 云服务&经典求解器

3.3 开源代码使用指南

3.4 新手教程

3.5 CIM求解组合优化问题的优势和方法

3.6 常见使用问题指南

4.1 处理约束问题

4.2 调整惩罚系数

4.3 处理降次问题

5.1 适配参数精度（8bit整数）

5.2 量子＋经典算法

6.1 论文解读

量子＋运筹优化

生物制药

电力

6.2 优秀论文库

4.2 调整惩罚系数

案例：基于松弛变量的JSP问题QUBO建模

总结

量子＋运筹优化

生物制药

电力

4.2 调整惩罚系数 ​

案例：基于松弛变量的JSP问题QUBO建模 ​

总结 ​

4.2 调整惩罚系数

案例：基于松弛变量的JSP问题QUBO建模

总结