LprUS

УДК 519.24

Б.Ц.Бахшиян, канд. физ.-мат. наук
(Институт космических исследований РАН, Москва),
А.И.Матасов, д-р физ.-мат. наук
(Московский государственный университет)
К.С.Федяев
(Московский государственный авиационный ииститут)

О РЕШЕНИИ ВЫРОЖДЕННЫХ ЗАДАЧ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ

Излагается критерий оптимальности и соответствующий симплексный алгоритм решения вырожденной задачи линейного программирования. Приводятся результаты решения практической задачи, показывающие эффективность использования нового алгоритма, проводится его сравнение с аналогичными алгоритмами, известными ранее.

1. Введение. Настоящая статья есть развитие работы [1] и посвящена вырожденным задачам линейного программирования [2]--[9]. При решении таких задач симплексным методом часто возникают большие последовательности итераций, на которых целевая функция практически не изменяется. Вероятность появления таких вырожденных итераций резко возрастает с увеличением размерности задачи и зачастую делает применение симплексного алгоритма бесполезным. Большинство классических методов теории вырожденного линейного программирования было посвящено лишь борьбе с зацикливанием, избежать вырожденных итераций при использовании таких методов не удавалось. Эти способы сводились либо к специальному выбору выводимого из базиса вектора (лексикографическое правило и правило случайного выбора [3]), либо к выбору вводимого в базис вектора (правило Данцига [4]), либо к одновременному выбору обоих этих векторов (правило Блэнда [2]).

По-видимому, наиболее эффективным методом борьбы с вырожденностью является метод Вольфа, предложенный впервые в [8] и модифицированный в работе [7]. Этот метод требует решения на каждой вырожденной итерации вспомогательной задачи линейного программирования. Ее решение позволяет либо сделать вывод об оптимальности текущего базиса основной задачи, либо заменить в нем сразу несколько векторов, что приводит к уменьшению целевой функции. Таким образом, процесс поиска оптимального решения исходной задачи становится строго монотонным. Однако метод Вольфа имеет два недостатка. Во-первых,размерность вспомогательной задачи совпадает с размерностью исходной. Кроме того, при решении вспомогательной задачи также могут возникнуть вырожденные итерации. В этом случае в процедуре преодоления вырожденности необходимо применять рекурсию.

В работе [1] предложен алгоритм, предусматривающий решение на каждой вырожденной итерации вспомогательной задачи линейного программирования, которая невырождена с вероятностью 1, и имеет меньше строк и столбцов в матрице ограничений, чем исходная. В настоящей работе дано оригинальное и дополненное изложение нового алгоритма, устраняющее некоторые неточности статьи [1], а также впервые представлены результаты решения с его помощью задач большой размерности. Кроме того, получены полезные модификации алгоритма и оценки для оптимума.

Сравнение предлагаемого алгоритма с алгоритмом Вольфа в модификации [7] показывает, что во многих случаях новый алгоритм окзывается более эффективным, хотя и требует дополнительных вычислений при построении вспомогательной задачи.

Будем рассматривать задачу линейного программирования,в которой по заданным векторам
a_i , b IR^m , i=1, ... ,n , c IRⁿ, требуется найти вектор x^* IRⁿ такой, что

c^Tx^=* { c ^Tx : x_i a_i = b, x = (x₁ , ... , x_n )^T 0 } . (1)
Оптимальное значение c^Tx^* целевой функции c^Tx далее будем называть значением задачи (1). Будем также считать, что линейная оболочка векторов a₁ , ... , a_n совпадает с IR^m, иначе следует перейти к соответствующему подпространству.

Пусть x -- допустимое базисное решение задачи (1), характеризуемое тем, что линейно независимы все k векторов-условий a_i , отвечающих положительным компонентам вектора x. Очевидно, k m. В случае k < m текущее допустимое базисное решение называется вырожденным, а число m-k -- степенью вырожденности. Матрицу U, состоящую из столбцов

a_i , i ₊ { i : x_i > 0, 1 i n },

будем называть матрицей строгого базиса[1] в отличие от составной базисной матрицы B=(U,V), где V -- такая произвольная m x (m-k) -матрица (не обязательно составленная из векторов a_i ), что матрица B невырождена. Тогда пространство IR^m разлагается в прямую сумму

IR^m=(U) (V)

подпространств (U) и (V) размерности k и m-k, базисами которых являются столбцы матриц U и V соответственно. Иными словами,

a_i= u_i ,
u_i+v_i ,    i₊ ,
i₀ {1,...,n} \ ₊ ,     u_i(U), v_i(V). (2)

Пусть ₀ IR^m -- любое решение неоднозначно разрешимой относительно вектора двойственных переменных системы уравнений

c_i - ^Ta_i=0,   i₊ ^T U=c_u^T , (3)

где c_u состоит из компонент c_i при i₊. Рассмотрим величины

_i = c_i - ₀^T a_i , 1 i n , (4)

которые носят название относительных оценок [6]. Согласно (3) , _i = 0 при i₊ . Достаточным условием оптимальности текущего допустимого базисного решения является выполнение неравенства [3]

_min _i 0 , (5)

где множество ₀ определено в (2). Условие (5) является необходимым для невырожденного допустимого базисного решения [6]. Найдем необходимые и достаточные условия оптимальности вырожденного допустимого базисного решения.

2. Основные теоремы. Рассмотрим вспомогательную задачу линейного программирования

{ _i y_i : y_i v_i = d , y_i0 , i₀ } , (6)

где d (V)-- любой вектор, для которого совместны ограничения в (6).

Замечание 1. Задача (6) имеет матрицу условий размером ( m - k ) x ( n - k ), так как в базисе, определяемом столбцами матрицы V (далее -- в базисе V), ее условия-равенства эквивалентны системе m - k скалярных уравнений. Ниже мы не будем пока переходить к базису V, чтобы не вводить новых координат.

Можно доказать следующую теорему 1 (критерий оптимальности). Допустимое базисное решение задачи (1) оптимально тогда и только тогда, когда конечно значение задачи (6).

Алгоритм уменьшения целевой функции в задаче (1) при неоптимальном допустимом базисном решении базируется на следующей теореме.

Теорема 2 (критерий неоптимальности). Текущее допустимое базисное решение задачи (1) неоптимально тогда и только тогда, когда найдется множество индексов S ₀ , | S | m - k + 1 такое, что выполняются следующие условия:
1. векторы a_i , i S линейно независимы;
2. существуют числа _i > 0, i S такие, что

_i v_i = 0 , _i _i < 0 ; _i > 0 , i S . (7)

Доказательство. Пусть _B ₀ -- множество, состоящее из m - k индексов, соответствующих векторам текущего базиса в задаче (6). По теореме 1 текущее допустимое базисное решение задачи (1) неоптимально тогда и только тогда, когда целевая функция задачи (6) неограничена на множестве своих допустимых решений. Согласно теории линейного программирования [3], это эквивалентно тому, что на некотором шаге симплексного метода решения задачи (6) находится небазисный вектор v_p , p ₀ \ _B , такой, что коэффициенты _j его разложения по базису, определяемые однозначно из уравнений

v_p= _j v_j , (8)

удовлетворяют неравенствам

_p - _j _j < 0 ; _j 0 , j _B . (9)

Рассмотрим множество

S = { j : j _B , _j < 0 } { p },

составленное из индексов ненулевых компонент _j и индекса p. Примем
_i = - t _i , i S , i p , _p = t ,     (10)

где t -- произвольное положительное число. Тогда соотношения (8) и (9) записываются в виде (7). Теорема доказана.

Таким образом, при неоптимальности текущего допустимого базисного решения задачи (1) множество S , указанное в теореме 2, находится в процессе решения задачи (6). Покажем, как уменьшить при этом целевую функцию задачи (1). В соответствии с равенством в (7) и разложением (2) имеем

_jv_j = 0    _j a_j(U)    _ja_j = _i a_i , (11)

где коэффициенты _i определяются однозначно, так как система уравнений в (11) относительно _i представляет собой k линейно независимых уравнений с k неизвестными.

Замечание 2. Линейная комбинация _j a_j является аналогом вектора, вводимого в базис в обычном симплекс-методе.

Введем множество индексов

= { j : j ₊ , _j > 0 } (12)

и, если оно не пусто, положим

= { x_j
_j : j } > 0 (13)

Множество индексов, на котором достигается минимум в (13), обозначим

R = {r : x_r
_r = }. (14)

Можно доказать следующую теорему 3 (метод уменьшения целевой функции). Пусть текущее допустимое базисное решение x неоптимально. Тогда
1. если , то множество индексов

₊ = ₊ S \ R (15)

соответствует строгому базису задачи (1), отвечающему меньшему значению целевой функции

c_i x_i = c_i x_i + _j_j , (16)

где числа _j , j S определены по формуле (10), а новые переменные, соответствующие строгому базису, определяемому множеством ₊ , вычисляются по формулам

x_i= x_i - _i ,
_i , i₊ \ R
iS , (17)

2. если = , то значение задачи (1) равно - .

Замечание 3. Как следует из (11) и (13), величина _i при любых i не зависит от множителя t в (10). Это означает, что его выбор не влияет и на значение целевой функции в (16).

Замечание 4. Число столбцов в строгом базисе, определяемом множеством ₊ согласно (15), равно

k = | ₊ | = k + | S | - | R |.

При этом, очевидно, | S | 2, т.е. в базис всегда вводится не менее двух векторов. Рассмотрим некоторые частные случаи.

a) В общем случае, учитывая, что | R | k , | S | 2, получаем

k k + 2 - k = 2 ,

т.е. степень вырождения (m-1) после решения вспомогательной задачи не может реализоваться.

б) В случае, когда множество R содержит только один индекс, из базиса выводится один вектор. Тогда

k k + | S | - 1 k + 1,

т.е. при | R | = 1 степень вырождения уменьшается.

в) Пусть | S | = m - k + 1, т.е. в разложении (2) нет нулевых коэффициентов. Тогда k = m, и текущий базис становится невырожденным.

3. Описание алгоритма. Алгоритм метода, обоснованного теоремами 1 -- 3, зависит от выбора матрицы V, дополняющей матрицу строгого базиса U до базисной матрицы B. Приведем этот алгоритм сначала для случая, когда B найдена в результате обычных симплексных итераций, приведших к текущему вырожденному решению. Другой способ выбора базисной матрицы описан ниже в замечании 6.

Пусть g_iIR^k, h_iIR^m-k -- векторы коэффициентов разложения вектора a_i , не входящего в строгий базис U, по столбцам матриц U и V соответственно, т.е. u_i =U g_i , v_i = V h_i , или

g_i
h_i = B^-1a_i , i ₀ . (18)

Тогда из соотношений (11) следует

= _j g_j , (19)

а задача (6) может быть записана в эквивалентной форме

{ _i y_i : y_i h_i = f , y_i 0 , i ₀ } , (20)

где f = B^-1 d . Задача (20) содержит m - k ограничений, причем столбцы h_i , соответствующие столбцам матрицы V , образуют, очевидно, единичную матрицу. Это позволяет сразу указать начальное допустимое базисное решение задачи (20), а в качестве компонент вектора f выбрать произвольные положительные числа.

В соответствии с изложенным выше алгоритм борьбы с вырожденностью может быть записан в следующем виде.

1. Из условия (18) определяются векторы g_i и h_i , i ₀ .

2. Строится вектор f , компоненты которого -- положительные случайные числа.

3. Решается задача (20), в которой начальный базис -- единичная матрица.

4. Если задача (20) имеет конечное значение, то текущий базис B задачи (1) оптимален. Иначе -- переход на шаг 5.

5. Из условия (10) при t = 1 определяются коэффициенты _j , j S .

6. По формуле (19) находится вектор .

7. По формуле (13) определяется параметр .

8. В соответствии с условием теоремы 3 строится множество ₊ индексов, соответствующих новому строгому базису задачи (1).

Замечание 5. При случайном выборе компонент вектора f задача (20) с вероятностью 1 невырождена. В случае появления вырождения достаточно лишь заново задать компоненты вектора f в соответствии с шагом 2 алгоритма и пересчитать значения базисных переменных, после чего продолжить решение.

Замечание 6. Возможны и другие способы выбора базисной матрицы B. Например, можно принять

U = U₁
U₂ , B = U₁ 0
U₂ I_m-k ,

где U₁ -- невырожденная k x k - матрица, I_m-k -- единичная матрица порядка m - k . Тогда

B^-1 = U₁^-1
-U₂ U₁^-1 0
I_m-k , g_i = U₁^-1 u_i , h_i = v_i - U₂ U₁^-1 u_i , i₀ ,

т.е. в данном случае достаточно обращать матрицу размерности k x k. Поэтому такой выбор базисной матрицы B может оказаться полезным при k << m.
4. Эквивалентный критерий оптимальности и дополнения к алгоритму. Теорема 3 является обобщением обычного симплекс-метода. При этом роль относительной оценки _i < 0 играет величина (см. теорему 3)

D() = _i _i ,

которую естественно называть обобщенной относительной оценкой. Рассмотрим минимальную из величин D() при условии нормировки на вектор , заданный в (10) с точностью до множителя:

D^ =* { D() : _i v_i = 0, _i =1 , _i 0 , i S } .

Последняя задача оптимизации фактически является задачей линейного программирования, которая в обычном виде имеет вид

D^ =* { _i_i : _i v_i = 0, _i =1 , _i 0 , i ₀ } . (21)

Величина D^* является аналогом минимальной относительной оценки _min = _i в обычном симплекс-методе, и для невырожденного допустимого базисного решения, очевидно, совпадает с ней. Приведем необходимый для дальнейшего другой критерий оптимальности задачи (1).

Теорема 4.
1. Текущее допустимое базисное решение оптимально тогда и только тогда, когда D^* 0 или условия в (21) несовместны. В последнем случае текущее допустимое базисное решение является единственным допустимым решением задачи (1).
2. Если D^* < 0 , то множество S , введенное в теореме 2, находится из решения задачи (21) и соответствует любому текущему базису этой задачи, для которого D() < 0. При этом целевая функция задачи (1) уменьшается по формуле (16).

Доказательство легко проводится от противного с использованием теорем 2 и 3.

Непосредственно из теоремы (2) вытекает следующая лемма.

Лемма 1. (связь между задачами (21) и (6)) Если задача (6) не имеет конечного значения, то множество _B { p } определяет допустимый базис задачи (6), соответствующий вектору , ненулевые компоненты которого определяются из соотношения (10) при t = (1 - _i )^-1 . При этом D() < 0 .

На практике при решении задачи (1) обычным симплекс-методом достаточное условие оптимальности (5) заменяется условием -оптимальности

_min - , (22)

где - заданное положительное число. Такая замена может быть обоснована следующей леммой.

Лемма 2. Если оптимальное решение задачи (1) удовлетворяет условию

x_i^ M ,* (23)

где M > 0 - заданное число, то для любого неоптимального допустимого базисного решения x справедливо неравенство

c^T x^ c^T x + M _min .* (24)

Доказательство леммы 2 приведено в Приложении.
Аналогично доказывается, что в вырожденном случае имеет место более точная оценка

c^T x^ c^T x + MD^* .* (25)

Поэтому вместо эквивалентного критерия оптимальности D^ 0* на практике может быть использован критерий -оптимальности

D^ -.* (26)

Однако непосредственная проверка этого критерия может быть затруднена в силу вырожденности задачи (21). Поэтому на практике целесообразно использовать следующий результат.

Лемма 3. Значение D^* задачи (21) удовлетворяет неравенству

D^ D() + _min ,*

где _min - минимальная относительная оценка для текущего базиса в задаче (21).

Доказательство леммы 1 следует из формулы (24), примененной к задаче (21) при M = 1 . Другое доказательство этого утверждения приведено в [9].

С использованием приведенных лемм шаг 5 описанного выше алгоритма может быть модифицирован следующим образом.

5.1 Согласно лемме 1 строится допустимое базисное решение задачи (21), компоненты которого вычисляются по формуле

_i =
1
1 - _i - _i , i _B ,
1 , i = p,
0 иначе.

5.2 Ищется величина D() (согласно лемме 1, D() < 0).

5.3 Для текущего базиса задачи (21), определяемого множеством индексов _B { p } , ищется минимальная относительная оценка _min.

5.4 Если выполняется условие D() + _min - , то согласно лемме 3 текущий базис задачи (1) является -оптимальным , и вычисления завершаются. В противном случае выполняется один из двух следующих шагов.

5.5 Если _min 0 , то решение задачи (21), построенное на шаге 5.1, является оптимальным. В этом случае числа _i определяются из соотношения (10) при t = (1 - _i )^-1 . Переход к шагу 6.

5.6 Если _min < 0 , то решение, построенное на шаге 5.1, неоптимально. В этом случае можно попытаться уменьшить найденное значение D() , решая задачу (21) начиная с базиса, определяемого множеством индексов _B { p } . Критерий окончания -- выполнение достаточных условий оптимальности для задачи (21) или появление при ее решении вырожденных итераций. В результате определяется вектор , для которого

D( ) D() < 0 .

Тогда в качестве чисел _i , i S , выбираются ненулевые компоненты вектора .

Замечание 7. (оценивание целевой функции с положительными коэффициентами) На практике неравенство (26) часто является лишь косвенным признаком того, что решение близко к оптимальному, так как не всегда известно, что справедливо условие (23). Однако в случае c_i > 0 , 1 i n имеет место непосредственная оценка значения задачи (1) :

c^T x c^T x^* c^T x
1 - D_c^* , (27)

где x -- текущее допустимое базисное решение,

D_c^ =* { _i_i : _i h_i = 0 , c_i _i =1 , _i 0 , i ₀ } .

Оценка (27) следует из неравенства

c^T x^ c^T x + c^T x^D^ ,*

аналогичного неравенству (25). В невырожденном случае оценка (27) переходит в оценку

c^T x^* c^T x
1 - ( _i / c_i ) ,

полученную ранее в [11] другим способом.

5. Практические результаты. Рассмотрим использование предложенного алгоритма на примере решения описанной в [7] задачи составления расписания авиаперевозок.

Пусть m -- число заказов на авиаперевозки или заданий, n -- число возможных способов доставки грузов, которые условимся называть режимами работы. Будем предполагать, что в каждом режиме выполняется один или несколько заказов по доставке. Обозначим c_j -- суммарные затраты на проведение j-го режима. Введем матрицу A с элементами

a_ij = 1 , если в j-м режиме работы выполняется i-е задание,
0 в противном случае.

Обозначим также через x_j число использований при проведении работы j-го режима. Тогда задача минимизации расходов при выполнении заказов будет иметь вид

{ c^Tx : x_i a_i= e , x_i IN , 1 i n } . (28)

где e = (1, ... ,1)^T IR^m, и первое условие означает, что каждое задание будет выполнено ровно один раз.

Задача (28) представляет собой задачу целочисленного программирования и может быть решена при помощи соответствующего метода. При этом на предварительном этапе требуется решить задачу линейного программирования, полученную из задачи (28) заменой условия x_i IN на более слабое x_i 0 при 1 i n. При решении такой задачи с использованием стандартного симплекс-метода часто наблюдаются большие последовательности вырожденных итераций. Приведем результаты применения описанного выше алгоритма, а также алгоритма, описанного в [7].

При численных расчетах решалась задача для n=3135 и m=80. Коэффициенты матрицы A выбирались случайно из множества { 0,1 }. Коэффициенты c_j также задавались случайно в интервале от 1000 до 20000. Результаты расчетов приведены в таблицах.

Таблица 1. Использование стандартного алгоритма.

Номер
итерации Размер
строгого
базиса Значение
целевой
функции Время
расчетов
(сек.)

1 80 2965.5

624-631 69 1677.7 3.61

674-735 41 1674.5 29.48

898-927 52 1673.5 30.16

1043-1069 36 1673.1 13.15

1130-1153 32 1672.2 11.57

1243-1279 27 1671.6 18.29

1323 25 1670.7 0.59

Выполнено итераций: всего -- 1324, вырожденных -- 607.
Общее время расчетов -- 13 минут 36.96 секунд.

Таблица 2. Использование алгоритма Вольфа.

Номер
итерации Размер
строгого
базиса Размерность
подзадачи Число
итераций
в подзадаче Значение
целевой
функции Время
расчетов

1 80 2868.3

554 77 80 X 3135 1 1681.2 0.38

560 65 80 X 3135 13 1672.3 5.49

564 54 80 X 3135 21 1671.3 8.51

566 41 80 X 3135 36 1670.8 17.08

568 26 80 X 3135 170 1670.3 72.89

569 23 80 X 3135 150 1670.2 97.49

Выполнено итераций: всего -- 569, вырожденных -- 36.
Общее время расчетов -- 9 минут 12.61 секунд.

Таблица 3. Использование нового алгоритма.

Номер
итерации Размер
строгого
базиса Размерность
подзадачи Число
итераций
в подзадаче Значение
целевой
функции Время
расчетов
(сек.)

1 80 2887.3

554 78 2 X 3057 2 1675.1 1.10

560 65 15 X 3070 7 1672.1 5.22

564 41 39 X 3094 82 1671.1 24.34

565 32 48 X 3103 240 1670.8 59.59

566 28 52 X 3107 100 1670.6 34.88

Выполнено итераций: всего -- 566, вырожденных -- 22.
Общее время расчетов -- 7 минут 16.87 секунд.

Использование стандартного алгоритма приводит к последовательностям вырожденных итераций, число которых достигает 50. Целевая функция при этом практически остается постоянной. Всего было сделано 1324 итерации, и затем выполнились достаточные условия оптимальности.

Использование нового алгоритма и алгоритма Вольфа позволило сократить число итераций при решении более чем вдвое. При использовании алгоритма Вольфа на каждой вырожденной итерации решалась вспомогательная задача той же размерности, что и исходная, при использовании нового алгоритма размерность вспомогательной задачи зависела от числа ненулевых базисных переменных. Это позволило сократить время расчетов по сравнению с алгоритмом Вольфа примерно на 20 процентов.

Было проведено большое число экспериментов, при которых решались задачи различной размерности с различными условиями. В большом количестве случаев новый алгоритм оказывался более эффективным и позволял сократить время вычислений порой вдвое. В то же время в ряде случаев более эффективным оказывался алгоритм Вольфа. Это не позволяет сделать однозначный вывод о преимуществе нового метода борьбы с вырождением перед методом Вольфа, но говорит о его высокой эффективности и целесообразности проведения дальнейших исследований в этой области.

СПИСОК ЛИТЕРАТУРЫ

1. Бахшиян Б.Ц.
Критерии оптимальности и алгоритмы решения вырожденной и обобщенной задач линейного программирования
Экономика и мат. методы. 1989. Т.28. N2, С.314.
2. R.G.Bland.
New finite pivot rules for simplex method
Math. Oper. Res. 1977. V. 2. P. 103-107.
3. G.B.Dantzig.
Linear Programming and Extensions.
Princeton U.P., 1963.
4. G.B.Dantzig.
Making Progress During a Stall in the Simplex Algorithm Linear Algebra and its Applications.
1989. V.114/115. P.251-259.
5. T.C.T. Kotiun, D.I.Steinberg.
On the Possibility Cycling with the Simplex Method
Oper. Res. 1984. V.26. N2. P.374-376.
6. A.Murtagh.
Advanced Linear Programming: Computation and Practice.
McGraw-Hill International Book Company, 1981.
7. D.M. Ryan, M.R.Osborne.
On the solution of highly degenerate linear programmes Mathematical Programming.
1988. V.41.P.385-392.
8. P.Wolfe.
A technique for resolving degeneracy in linear programming. J. Soc. Indust. and Appl. Math. 11: 205-211 (1963).
9. Лидов М.Л.
О модификации симплекс-метода линейного программирования в случае вырождения
Космические исследования. 1991. Т.29.N4.С.499-508.
10. R.T.Rockafellar.
Convex Analysis. Princeton U.P.,1970.
11. Лидов М.Л.
Математическая аналогия между некоторыми оптимальными задачами коррекции траекторий и выбора состава измерений и алгоритмы их решения
Космические исследования. 1971. Т.9. N 5. С. 687-706.

Вернуться на титульный лист