Jump to content

оптимизация Ляпунова

В данной статье описана оптимизация Ляпунова для динамических систем . Это пример применения оптимального управления в сетях массового обслуживания .

Введение

[ редактировать ]

Оптимизация Ляпунова — это использование функции Ляпунова для оптимального управления динамической системой. Функции Ляпунова широко используются в теории управления для обеспечения различных форм устойчивости систем. Состояние системы в конкретный момент времени часто описывается многомерным вектором. Функция Ляпунова является неотрицательной скалярной мерой этого многомерного состояния. Обычно функция определяется так, чтобы она возрастала, когда система движется к нежелательным состояниям. Устойчивость системы достигается за счет принятия управляющих воздействий, которые заставляют функцию Ляпунова дрейфовать в отрицательном направлении к нулю.

Дрейф Ляпунова занимает центральное место в изучении оптимального управления в сетях массового обслуживания. Типичная цель — стабилизировать все сетевые очереди при одновременной оптимизации некоторых показателей производительности, например минимизации среднего энергопотребления или максимизации средней пропускной способности. Минимизация дрейфа квадратичной функции Ляпунова приводит к Алгоритм маршрутизации противодавления для стабильности сети, также называемый алгоритмом максимального веса . [1] [2] Добавление взвешенного штрафного члена к дрейфу Ляпунова и минимизация суммы приводит к алгоритму «дрейф плюс штраф» для совместной устойчивости сети и минимизации штрафа. [3] [4] [5] Процедура «дрейф плюс штраф» также может использоваться для вычисления решений выпуклых и линейных программ . [6]

Ляпуновский дрейф для сетей массового обслуживания

[ редактировать ]

Рассмотрим сеть массового обслуживания, которая развивается в дискретном времени с нормализованными временными интервалами. Предположим, есть очереди в сети и определять вектор невыполненных очередей во времени к:

Квадратичные функции Ляпунова

[ редактировать ]

Для каждого слота определять:

Эта функция является скалярной мерой общего количества невыполненной очереди в сети. Она называется квадратичной функцией Ляпунова от состояния очереди. Определим дрейф Ляпунова как изменение этой функции от одного слота к другому:

Ограничение штрека Ляпунова

[ редактировать ]

Предположим, что очереди в очереди меняются со временем согласно следующему уравнению:

где и находятся ли прибытия и возможности обслуживания соответственно в очереди в слоте Это уравнение можно использовать для вычисления границы дрейфа Ляпунова для любого слота t:

Переставляя это неравенство, суммируя по всем и деление на 2 приводит к:

где:

Предположим, что вторые моменты поступления и обслуживания в каждой очереди ограничены, так что существует конечная константа такой, что для всех и все возможные векторы очереди имеет место следующее свойство:

Взятие условных математических ожиданий (уравнения 1) приводит к следующей оценке условного ожидаемого дрейфа Ляпунова :

Основная теорема о сносе Ляпунова

[ редактировать ]

Во многих случаях сетью можно управлять так, чтобы разница между поступлениями и обслуживанием в каждой очереди удовлетворяла следующему свойству для некоторого действительного числа: :

Если вышеизложенное справедливо для одного и того же эпсилона для всех очередей все слоты и все возможные векторы тогда (уравнение 2) сводится к условию сноса, используемому в следующей теореме Ляпунова о сносе. Приведенную ниже теорему можно рассматривать как вариацию теоремы Фостера для цепей Маркова . Однако для этого не требуется структура цепи Маркова.

Теорема (о дрейфе Ляпунова). [5] [7] Предположим, существуют константы такой, что для всех и все возможные векторы условный дрейф Ляпунова удовлетворяет:
Тогда для всех слотов средний по времени размер очереди в сети удовлетворяет:

Доказательство. Если взять ожидания обеих сторон неравенства дрейфа и использовать закон повторных ожиданий, получим:

Суммируя приведенное выше выражение и использование закона телескопирования сумм дает:

Используя тот факт, что неотрицательен, и перестановка членов в приведенном выше выражении доказывает результат.

Оптимизация Ляпунова для сетей массового обслуживания.

[ редактировать ]

Рассмотрим ту же сеть массового обслуживания, что и в предыдущем разделе. Теперь определите как сетевой штраф, наложенный на слот Предположим, что цель состоит в том, чтобы стабилизировать сеть массового обслуживания, минимизируя при этом среднее время Например, чтобы стабилизировать сеть при минимизации средней мощности за время, может быть определен как общая мощность сети в слоте t. [8] Для решения проблем максимизации среднего по времени некоторого желаемого вознаграждения. наказание может быть определено Это полезно для максимизации сети во всем коммунальном хозяйстве при условии стабильности. [3]

Стабилизировать сеть, минимизируя среднее время штрафа. сетевые алгоритмы могут быть разработаны для выполнения управляющих действий, которые жадно минимизируют границу следующего выражения дрейф плюс штраф для каждого слота : [5]

где — это неотрицательный вес, который выбирается по желанию, чтобы повлиять на компромисс в производительности. Ключевой особенностью этого подхода является то, что он обычно не требует знания вероятностей случайных сетевых событий (таких как случайное поступление заданий или реализация каналов). Выбор сводится к минимизации ограничения на дрейф каждого слота, а для маршрутизации в сетях массового обслуживания с несколькими переходами — к алгоритму маршрутизации с противодавлением, разработанному Тассиуласом и Эфремидесом. [1] [2] С использованием и определение как потребление электроэнергии в слоте приводит к алгоритму «дрейф плюс штраф» для минимизации средней мощности при условии стабильности сети, разработанному Нили. [8] С использованием и используя поскольку отрицательный результат метрики полезности управления допуском приводит к алгоритму «дрейф плюс штраф» для совместного управления потоком и сетевой маршрутизации, разработанному Нили, Модиано и Ли. [3]

В этом контексте важно обобщение теоремы о сносе Ляпунова из предыдущего раздела. Для простоты изложения предположим, что ограничено снизу:

Например, вышеизложенное удовлетворено в случаях, когда штраф всегда неотрицательен. Позволять представляют собой желаемую цель для среднего по времени Позволять быть параметром, используемым для оценки важности достижения цели. Следующая теорема показывает, что если выполняется условие «дрейф плюс штраф», то средний по времени штраф не превышает желаемого целевого значения не более чем на O(1/V), а средний размер очереди равен O(V). Параметр можно настроить так, чтобы средний штраф по времени был как можно ближе (или ниже) к целевому значению с соответствующим компромиссом по размеру очереди.

Теорема (оптимизация Ляпунова). Предположим, существуют константы и такой, что для всех и все возможные векторы выполняется следующее условие «дрифт плюс штраф»:
Тогда для всех средний по времени штраф и средний по времени размер очереди удовлетворяют:

Доказательство. Взяв ожидания обеих сторон постулируемого сноса плюс штраф и используя закон повторных ожиданий, мы имеем:

Суммируя вышесказанное по сравнению с первым слотов и использование закона телескопирования сумм дает:

Деление на а перестановка условий доказывает границу среднего по времени штрафа. Аналогичный аргумент доказывает ограничение среднего по времени размера очереди.

[ редактировать ]
  1. ^ Jump up to: а б Л. Тассиулас и А. Эфремид, « Свойства стабильности систем массового обслуживания с ограничениями и политики планирования для максимальной пропускной способности в многоскачковых радиосетях» , Транзакции IEEE по автоматическому управлению , том 37, № 12, стр. 1936-1948, декабрь 1992 г.
  2. ^ Jump up to: а б Л. Тассиулас и А. Эфремидес, « Динамическое размещение серверов в параллельных очередях со случайно изменяющейся связностью », Транзакции IEEE по теории информации, том. 39, нет. 2, стр. 466–478, март 1993 г.
  3. ^ Jump up to: а б с М. Дж. Нили, Э. Модиано и К. Ли, « Справедливость и оптимальное стохастическое управление для гетерогенных сетей », Proc. IEEE INFOCOM, март 2005 г.
  4. ^ Л. Георгиадис, М. Дж. Нили и Л. Тассиулас, « Распределение ресурсов и межуровневое управление в беспроводных сетях », «Основы и тенденции в области сетевых технологий » , том. 1, нет. 1, стр. 1-149, 2006.
  5. ^ Jump up to: а б с М. Дж. Нили. Стохастическая оптимизация сети с применением к системам связи и массового обслуживания , Morgan & Claypool, 2010.
  6. ^ М. Дж. Нили, « Распределенное и безопасное вычисление выпуклых программ в сети подключенных процессоров », DCDIS Conf, Гуэлф, Онтарио, июль 2005 г.
  7. ^ Э. Леонарди, М. Меллиа, Ф. Нери и М. Аджмоне Марсан, « Границы средних задержек, средних значений размера очереди и отклонений в коммутаторах на основе ячеек с очередью ввода », Proc. ИНФОКОМ IEEE, 2001.
  8. ^ Jump up to: а б М. Дж. Нили, « Энергетически оптимальное управление для беспроводных сетей, изменяющихся во времени », IEEE Transactions on Information Theory, vol. 52, нет. 7, стр. 2915–2934, июль 2006 г.

Первичные источники

[ редактировать ]
  • М. Дж. Нили. Стохастическая оптимизация сети с применением к системам связи и массового обслуживания , Morgan & Claypool, 2010.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: f1220af9db12e8f463a1e41abb23f50b__1677560640
URL1:https://arc.ask3.ru/arc/aa/f1/0b/f1220af9db12e8f463a1e41abb23f50b.html
Заголовок, (Title) документа по адресу, URL1:
Lyapunov optimization - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)