Об инвариантности оптимального управления линейной экономической системой при одновременном масштабировании ее параметров

Паламарчук Екатерина С.

doi:10.33276/S0000084-5-1

Главная>Выпуск 2>Об инвариантности оптимального управления линейной экономической системой при одновременном масштабировании ее параметров

Об инвариантности оптимального управления линейной экономической системой при одновременном масштабировании ее параметров

Оглавление

Аннотация Оценить Содержание публикации

Библиография Комментарии

Аннотация

Код статьи

S111111110000084-5-1

DOI

10.33276/S0000084-5-1

Тип публикации

Статья

Статус публикации

Опубликовано

Авторы

Паламарчук Екатерина Сергеевна Связаться с автором

Должность: Ведущий научный сотрудник
Аффилиация: Центральный экономико-математический институт РАН
Адрес: Российская Федерация, Москва, Нахимовский проспект, 47

Выпуск

Том 1 Выпуск 2

Аннотация

Рассматривается задача управления линейной экономической системой, представляемая в виде стохастического линейно-квадратического регулятора на бесконечном интервале времени при динамическом масштабировании коэффициентов в уравнении состояния и целевом функционале. Используемые критерии оптимальности представляют собой обобщения долговременного среднего и потраекторного долговременного среднего. При этом в качестве нормировки целевых функционалов применяется интеграл от масштабирующей функции. Показано, что вид оптимального управления инвариантен по времени и может быть получен на основе установившейся оптимальной стратегии, известной для автономной системы.

Ключевые слова

стохастический линейно-квадратический регулятор, инвариантность, масштабирование, алгебраическое уравнение Риккати

Источник финансирования

Работа выполнена в рамках НИР «Теория и методы для компьютерного и математического моделирования и анализа общественных систем и процессов», номер государственной регистрации АААА-А18-118021990120-2.

Классификатор

Получено

27.09.2018

Дата публикации

13.12.2018

Всего подписок

Всего просмотров

1998

Оценка читателей

0.0 (0 голосов)

Цитировать Скачать pdf

ГОСТ	Паламарчук Е. С. Об инвариантности оптимального управления линейной экономической системой при одновременном масштабировании ее параметров // Вестник ЦЭМИ РАН. – 2018. – T. 1. – Выпуск 2. URL: https://cemi.jes.su/s111111110000084-5-1/. DOI: 10.33276/S0000084-5-1
MLA	Palamarchuk, Ekaterina "On the invariance of optimal control for a linear stochastic economic system under dynamic scaling of its coefficients." Herald of CEMI. 1.2 (2018). DOI: 10.33276/S0000084-5-1
APA	Palamarchuk E. (2018). On the invariance of optimal control for a linear stochastic economic system under dynamic scaling of its coefficients. Herald of CEMI. vol. 1, no. 2 DOI: 10.33276/S0000084-5-1

Библиография

1. Белкина Т.А., Паламарчук Е.С. О стохастической оптимальности для линейного регулятора с затухающими возмущениями // Автоматика и телемеханика. 2013. № 4. С. 110-128.

2. Дэвис М.Х.А. Линейное оценивание и стохастическое управление. М.: Наука, 1984.

3. Квакернаак X., Сиван P. Линейные оптимальные системы управления. М.: Наука, 1977.

4. Паламарчук Е.С. Анализ критериев долговременного среднего в задаче стохастического линейного регулятора // Автоматика и телемеханика. 2016. № 10. С. 78-92.

5. Паламарчук Е.С. Стабилизация линейных стохастических систем с дисконтированием: моделирование долгосрочных эффектов применения оптимальных стратегий управления // Математическое моделирование. 2015. Т. 27, № 1. С. 3-15.

6. Czornik A. On time-varying LQG // IFAC Proceedings Volumes. 1998. Vol. 31. No. 18. P. 411-415.

7. Karafyllis I., Tsinias J. Non-uniform in time stabilization for linear systems and tracking control for non-holonomic systems in chained form //International Journal of Control. 2003. Vol. 76. No. 15. P. 1536-1546.

8. Smith P.L., Ratcliff R., Sewell D.K. Modeling perceptual discrimination in dynamic noise: Time-changed diffusion and release from inhibition // Journal of Mathematical Psychology. 2014. Vol. 59. P. 95-113.


1	Введение	Введение Введение

2	Рассматривается задача оптимального управления линейной экономической системой, функционирующей в условиях неопределенности на долгосрочном временном интервале. Динамика состояния системы задается при помощи управляемого случайного процесса, а воздействие случайных факторов моделируется аддитивным винеровским шумом. В качестве целевого функционала используется интегральный квадратичный функционал за плановый период. Матрицы коэффициентов системы управления определяются на основе динамического масштабирования стандартной системы с постоянными параметрами. Показывается, что оптимальный закон управления носит инвариантный характер, т.е. в явном виде не зависит от времени, а критерии оптимальности включают нормировки целевого функционала с учетом совокупного масштабирования (интеграла от масштабирующей функции).	Рассматривается задача оптимального управления линейной экономической системой, функционирующей в условиях неопределенности на долгосрочном временном интервале. Динамика состояния системы задается при помощи управляемого случайного процесса, а воздействие случайных факторов моделируется аддитивным винеровским шумом. В качестве целевого функционала используется интегральный квадратичный функционал за плановый период. Матрицы коэффициентов системы управления определяются на основе динамического масштабирования стандартной системы с постоянными параметрами. Показывается, что оптимальный закон управления носит инвариантный характер, т.е. в явном виде не зависит от времени, а критерии оптимальности включают нормировки целевого функционала с учетом совокупного масштабирования (интеграла от масштабирующей функции). Рассматривается задача оптимального управления линейной экономической системой, функционирующей в условиях неопределенности на долгосрочном временном интервале. Динамика состояния системы задается при помощи управляемого случайного процесса, а воздействие случайных факторов моделируется аддитивным винеровским шумом. В качестве целевого функционала используется интегральный квадратичный функционал за плановый период. Матрицы коэффициентов системы управления определяются на основе динамического масштабирования стандартной системы с постоянными параметрами. Показывается, что оптимальный закон управления носит инвариантный характер, т.е. в явном виде не зависит от времени, а критерии оптимальности включают нормировки целевого функционала с учетом совокупного масштабирования (интеграла от масштабирующей функции).

3	Описание модели и основные предположения	Описание модели и основные предположения Описание модели и основные предположения

4	Пусть на полном вероятностном пространстве задан n-мерный случайный процесс, описываемый уравнением	Пусть на полном вероятностном пространстве <img src="http://www.cemi.jes.su/images/publication_images/3508/image1.png" class="image-formula"/> задан n-мерный случайный процесс<img src="http://www.cemi.jes.su/images/publication_images/3508/image2.png" class="image-formula"/>, описываемый уравнением Пусть на полном вероятностном пространстве <img src="http://www.cemi.jes.su/images/publication_images/3508/image1.png" class="image-formula"/> задан n-мерный случайный процесс<img src="http://www.cemi.jes.su/images/publication_images/3508/image2.png" class="image-formula"/>, описываемый уравнением

5	Подпись к рисунку/медиа
6	где - d-мерный стандартный винеровский процесс, - допустимое управление, или k- мерный процесс, согласованный с фильтрацией, , такой что уравнение (1) имеет решение; A, B, G- матрицы соответствующих размерностей,G≠0; - неслучайный вектор. Множество допустимых управлений обозначим U. В (1) α_t>0, t≥0 - масштабирующая функция. Уравнение вида (1) ранее рассматривалось в различных приложениях при частичном масштабировании коэффициентов, см. (Karafyllis, Tsinias, 2003; Smith, Ratcliff, Sewell, 2014).	где <img src="http://www.cemi.jes.su/images/publication_images/3508/image4.png" class="image-formula"/>- <em>d</em>-мерный стандартный винеровский процесс, <img src="http://www.cemi.jes.su/images/publication_images/3508/image5.png" class="image-formula"/>- допустимое управление, или <em>k</em>- мерный процесс, согласованный с фильтрацией<img src="http://www.cemi.jes.su/images/publication_images/3508/image6.png" class="image-formula"/>, <img src="http://www.cemi.jes.su/images/publication_images/3508/image7.png" class="image-formula"/>, такой что уравнение (1) имеет решение; <em>A</em><em>, </em><em>B</em><em>, </em><em>G</em>- матрицы соответствующих размерностей,<em>G</em>≠0; <img src="http://www.cemi.jes.su/images/publication_images/3508/image8.png" class="image-formula"/>- неслучайный вектор. Множество допустимых управлений обозначим <em>U</em><em>.</em> В (1) α<sub>t</sub>>0, t≥0 - масштабирующая функция. Уравнение вида (1) ранее рассматривалось в различных приложениях при частичном масштабировании коэффициентов, см. (Karafyllis, Tsinias, 2003; Smith, Ratcliff, Sewell, 2014). где <img src="http://www.cemi.jes.su/images/publication_images/3508/image4.png" class="image-formula"/>- <em>d</em>-мерный стандартный винеровский процесс, <img src="http://www.cemi.jes.su/images/publication_images/3508/image5.png" class="image-formula"/>- допустимое управление, или <em>k</em>- мерный процесс, согласованный с фильтрацией<img src="http://www.cemi.jes.su/images/publication_images/3508/image6.png" class="image-formula"/>, <img src="http://www.cemi.jes.su/images/publication_images/3508/image7.png" class="image-formula"/>, такой что уравнение (1) имеет решение; <em>A</em><em>, </em><em>B</em><em>, </em><em>G</em>- матрицы соответствующих размерностей,<em>G</em>≠0; <img src="http://www.cemi.jes.su/images/publication_images/3508/image8.png" class="image-formula"/>- неслучайный вектор. Множество допустимых управлений обозначим <em>U</em><em>.</em> В (1) α<sub>t</sub>>0, t≥0 - масштабирующая функция. Уравнение вида (1) ранее рассматривалось в различных приложениях при частичном масштабировании коэффициентов, см. (Karafyllis, Tsinias, 2003; Smith, Ratcliff, Sewell, 2014).

7	Для любого T>0 определим целевой функционал издержек	Для любого T>0 определим целевой функционал издержек Для любого T>0 определим целевой функционал издержек

8	Подпись к рисунку/медиа
9	где - допустимое управление на интервале [0,T], Q, R, - постоянные матрицы, неотрицательно определенная и положительно определенная соответственно (- транспонирование). При наличии монотонной функции α_t>0 в (2), α_t можно придать смысл дисконтирующей. Положительное дисконтирование возникает для убывающей α_t, а отрицательное имеет место в случае, когда α_t - возрастает, см. (Паламарчук, 2015).	где <img src="http://www.cemi.jes.su/images/publication_images/3508/image10.png" class="image-formula"/> - допустимое управление на интервале [0,T], <em>Q</em>, <em>R</em>, - постоянные матрицы, неотрицательно определенная и положительно определенная соответственно (<img src="http://www.cemi.jes.su/images/publication_images/3508/image11.png" class="image-formula"/>- транспонирование). При наличии монотонной функции α<sub>t</sub>>0 в (2), α<sub>t</sub> можно придать смысл дисконтирующей. Положительное дисконтирование возникает для убывающей α<sub>t</sub>, а отрицательное имеет место в случае, когда α<sub>t</sub> - возрастает, см. (Паламарчук, 2015). где <img src="http://www.cemi.jes.su/images/publication_images/3508/image10.png" class="image-formula"/> - допустимое управление на интервале [0,T], <em>Q</em>, <em>R</em>, - постоянные матрицы, неотрицательно определенная и положительно определенная соответственно (<img src="http://www.cemi.jes.su/images/publication_images/3508/image11.png" class="image-formula"/>- транспонирование). При наличии монотонной функции α<sub>t</sub>>0 в (2), α<sub>t</sub> можно придать смысл дисконтирующей. Положительное дисконтирование возникает для убывающей α<sub>t</sub>, а отрицательное имеет место в случае, когда α<sub>t</sub> - возрастает, см. (Паламарчук, 2015).

10	Обращаясь к анализу (1)-(2) в ситуации масштабирования, отметим, что если функция α_t является монотонной и α₀=1, то при α_t>1 имеем инфляцию (рост абсолютных значений) коэффициентов, случай , аналогичен «гиперинфляции».	Обращаясь к анализу (1)-(2) в ситуации масштабирования, отметим, что если функция α<sub>t</sub> является монотонной и α<sub>0</sub>=1, то при α<sub>t</sub>>1 имеем инфляцию (рост абсолютных значений) коэффициентов, случай <img src="http://www.cemi.jes.su/images/publication_images/3508/image12.png" class="image-formula"/>, <img src="http://www.cemi.jes.su/images/publication_images/3508/image13.png" class="image-formula"/> аналогичен «гиперинфляции». Обращаясь к анализу (1)-(2) в ситуации масштабирования, отметим, что если функция α<sub>t</sub> является монотонной и α<sub>0</sub>=1, то при α<sub>t</sub>>1 имеем инфляцию (рост абсолютных значений) коэффициентов, случай <img src="http://www.cemi.jes.su/images/publication_images/3508/image12.png" class="image-formula"/>, <img src="http://www.cemi.jes.su/images/publication_images/3508/image13.png" class="image-formula"/> аналогичен «гиперинфляции».

11	Ситуация означает отсутствие масштабирования, постоянство коэффициентов во времени и соответствует автономной системе управления. Если же α_t, , приводит к вырождению матриц.	<p>Ситуация <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image14.png" alt="" /> означает отсутствие масштабирования, постоянство коэффициентов во времени и соответствует автономной системе управления. Если же α<sub>t</sub>, <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image13.png" alt="" />, приводит к вырождению матриц. </p> <p>Ситуация <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image14.png" alt="" /> означает отсутствие масштабирования, постоянство коэффициентов во времени и соответствует автономной системе управления. Если же α<sub>t</sub>, <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image13.png" alt="" />, приводит к вырождению матриц. </p>

12	Далее формулируются предположения, в рамках которых будут получены основные результаты исследования. Предположение . Масштабирующая функция α_t>0, t≥0 является интегрируемой и . Предположение P. Пара матриц (A,B) - стабилизируема, пара матриц - выявляема (соответствующие определения см., напр., в (Дэвис, 1984, с.167-168)).	<p>Далее формулируются предположения, в рамках которых будут получены основные результаты исследования.</p> <p>Предположение <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image16.png" alt="" />. Масштабирующая функция α<sub>t</sub>>0, t≥0 является интегрируемой и <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image17.png" alt="" /><img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image13.png" alt="" />.</p> <p>Предположение <em><strong>P</strong></em>. Пара матриц <em>(</em><em>A</em><em>,</em><em>B</em><em>) </em>- стабилизируема, пара матриц <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image18.png" alt="" /> - выявляема (соответствующие определения см., напр., в (Дэвис, 1984, с.167-168)).</p> <p>Далее формулируются предположения, в рамках которых будут получены основные результаты исследования.</p> <p>Предположение <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image16.png" alt="" />. Масштабирующая функция α<sub>t</sub>>0, t≥0 является интегрируемой и <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image17.png" alt="" /><img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image13.png" alt="" />.</p> <p>Предположение <em><strong>P</strong></em>. Пара матриц <em>(</em><em>A</em><em>,</em><em>B</em><em>) </em>- стабилизируема, пара матриц <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image18.png" alt="" /> - выявляема (соответствующие определения см., напр., в (Дэвис, 1984, с.167-168)).</p>

13	Постановка задачи и описание оптимальной установившейся стратегии управления	Постановка задачи и описание оптимальной установившейся стратегии управления Постановка задачи и описание оптимальной установившейся стратегии управления

14	Хорошо известно, см. (Квакернаак, Сиван, 1977, Теорема 3.7, с. 275), что при условии выполнения предположения P существует так называемый оптимальный установившийся закон управления U^*, имеющий вид	Хорошо известно, см. (Квакернаак, Сиван, 1977, Теорема 3.7, с. 275), что при условии выполнения предположения <em><strong>P</strong></em> существует так называемый оптимальный установившийся закон управления <em>U</em><sup><em></em></sup>, имеющий вид Хорошо известно, см. (Квакернаак, Сиван, 1977, Теорема 3.7, с. 275), что при условии выполнения предположения <em><strong>P</strong></em> существует так называемый оптимальный установившийся закон управления <em>U</em><sup><em></em></sup>, имеющий вид

15	Подпись к рисунку/медиа (3) (3)
16	где матрица П является единственным неотрицательно определенным решением алгебраического уравнения Риккати	где матрица П является единственным неотрицательно определенным решением алгебраического уравнения Риккати где матрица П является единственным неотрицательно определенным решением алгебраического уравнения Риккати

17	Подпись к рисунку/медиа (4) (4)
18	Для системы с постоянными параметрами стратегия U^* оказывается решением задачи управления на бесконечном интервале времени с критерием долговременного среднего, см., напр., (Дэвис, 1984, Теорема 5.4.3, с. 169), а также вероятностного критерия потраекторного среднего (потраекторного эргодического):	Для системы с постоянными параметрами стратегия <em>U</em><sup><em></em></sup> оказывается решением задачи управления на бесконечном интервале времени с критерием долговременного среднего, см., напр., (Дэвис, 1984, Теорема 5.4.3, с. 169), а также вероятностного критерия потраекторного среднего (потраекторного эргодического): Для системы с постоянными параметрами стратегия <em>U</em><sup><em></em></sup> оказывается решением задачи управления на бесконечном интервале времени с критерием долговременного среднего, см., напр., (Дэвис, 1984, Теорема 5.4.3, с. 169), а также вероятностного критерия потраекторного среднего (потраекторного эргодического):

19	(5)и с вероятностью 1.	(5)<img src="http://www.cemi.jes.su/images/publication_images/3508/image21.png" class="image-formula"/>и <img src="http://www.cemi.jes.su/images/publication_images/3508/image22.png" class="image-formula"/> с вероятностью 1. (5)<img src="http://www.cemi.jes.su/images/publication_images/3508/image21.png" class="image-formula"/>и <img src="http://www.cemi.jes.su/images/publication_images/3508/image22.png" class="image-formula"/> с вероятностью 1.

20	При этом оптимальное значение обоих критериев совпадает и равно ((tr (.) - след матрицы).	При этом оптимальное значение обоих критериев совпадает и равно <img src="http://www.cemi.jes.su/images/publication_images/3508/image23.png" class="image-formula"/> ((<em>tr</em> (.) - след матрицы). При этом оптимальное значение обоих критериев совпадает и равно <img src="http://www.cemi.jes.su/images/publication_images/3508/image23.png" class="image-formula"/> ((<em>tr</em> (.) - след матрицы).

21	Как было показано в (Паламарчук, 2016), приведенные критерии адекватно отражают воздействие фактора неопределенности на оценку качества управления только для случая системы (1)-(2) с ограниченными коэффициентами и невырожденной матрицей диффузии в (1). В рассматриваемой ситуации одновременного масштабирования параметров (1)-(2) для сравнении стратегий управления при будут использоваться понятия обобщенного долговременного среднего и обобщенного стохастического долговременного среднего, введенные в (Белкина, Паламарчук, 2013) для переменной матрицы G_t, когда в (5) вместо нормировки T используется. В данном случае, и в следующем разделе будет приведен результат о виде оптимального закона управления.	Как было показано в (Паламарчук, 2016), приведенные критерии адекватно отражают воздействие фактора неопределенности на оценку качества управления только для случая системы (1)-(2) с ограниченными коэффициентами и невырожденной матрицей диффузии в (1). В рассматриваемой ситуации одновременного масштабирования параметров (1)-(2) для сравнении стратегий управления при <img src="http://www.cemi.jes.su/images/publication_images/3508/image24.png" class="image-formula"/> будут использоваться понятия обобщенного долговременного среднего и обобщенного стохастического долговременного среднего, введенные в (Белкина, Паламарчук, 2013) для переменной матрицы <em>G</em><sub><em>t</em></sub>, когда в (5) вместо нормировки <em>T</em> используется<img src="http://www.cemi.jes.su/images/publication_images/3508/image25.png" class="image-formula"/>. В данном случае<img src="http://www.cemi.jes.su/images/publication_images/3508/image26.png" class="image-formula"/>, и в следующем разделе будет приведен результат о виде оптимального закона управления. Как было показано в (Паламарчук, 2016), приведенные критерии адекватно отражают воздействие фактора неопределенности на оценку качества управления только для случая системы (1)-(2) с ограниченными коэффициентами и невырожденной матрицей диффузии в (1). В рассматриваемой ситуации одновременного масштабирования параметров (1)-(2) для сравнении стратегий управления при <img src="http://www.cemi.jes.su/images/publication_images/3508/image24.png" class="image-formula"/> будут использоваться понятия обобщенного долговременного среднего и обобщенного стохастического долговременного среднего, введенные в (Белкина, Паламарчук, 2013) для переменной матрицы <em>G</em><sub><em>t</em></sub>, когда в (5) вместо нормировки <em>T</em> используется<img src="http://www.cemi.jes.su/images/publication_images/3508/image25.png" class="image-formula"/>. В данном случае<img src="http://www.cemi.jes.su/images/publication_images/3508/image26.png" class="image-formula"/>, и в следующем разделе будет приведен результат о виде оптимального закона управления.

22	Основные результаты	Основные результаты Основные результаты

Библиография

Комментарии

Войти через