On the invariance of optimal control for a linear stochastic economic system under dynamic scaling of its coefficients

Palamarchuk, Ekaterina

doi:10.33276/S0000084-5-1

Home>Issue 2>On the invariance of optimal control for a linear stochastic economic system under dynamic scaling of its coefficients

On the invariance of optimal control for a linear stochastic economic system under dynamic scaling of its coefficients

Table of contents

Annotation Estimate Publication content

References Comments

On the invariance of optimal control for a linear stochastic economic system under dynamic scaling of its coefficients

Annotation

PII

S111111110000084-5-1

DOI

10.33276/S0000084-5-1

Publication type

Article

Status

Published

Authors

Ekaterina Palamarchuk Send message

Occupation: Leading researcher
Affiliation: CEMI RAS
Address: Russian Federation, Nakhimovskiy prospekt, 47

Edition

Volume 1 Issue 2

Abstract

We consider a stochastic linear quadratic control problem over an infinite time-horizon for a linear economic system under dynamic scaling of coefficients in the state equation and the cost matrices. Employed optimality criteria represent extensions of the long-run average and pathwise long-run average costs. The costs are normalized by the integrated scaling function. It has been shown that the optimal control law is time-invariant and can be derived on the basis of the stable feedback known as the optimal control law for autonomous system.

Keywords

stochastic linear-quadratic controller, invariance, scaling, algebraic Riccati equation

Received

27.09.2018

Date of publication

13.12.2018

Number of purchasers

Views

1999

Readers community rating

0.0 (0 votes)

Cite Download pdf

GOST	Palamarchuk E. On the invariance of optimal control for a linear stochastic economic system under dynamic scaling of its coefficients // Herald of CEMI. – 2018. – V. 1. – Issue 2. URL: https://cemi.jes.su/s111111110000084-5-1/. DOI: 10.33276/S0000084-5-1
MLA	Palamarchuk, Ekaterina "On the invariance of optimal control for a linear stochastic economic system under dynamic scaling of its coefficients." Herald of CEMI. 1.2 (2018). DOI: 10.33276/S0000084-5-1
APA	Palamarchuk E. (2018). On the invariance of optimal control for a linear stochastic economic system under dynamic scaling of its coefficients. Herald of CEMI. vol. 1, no. 2 DOI: 10.33276/S0000084-5-1

References

1. Belkina T.A., Palamarchuk E.S. O stokhasticheskoj optimal'nosti dlya linejnogo regulyatora s zatukhayuschimi vozmuscheniyami // Avtomatika i telemekhanika. 2013. № 4. S. 110-128.

2. Dehvis M.Kh.A. Linejnoe otsenivanie i stokhasticheskoe upravlenie. M.: Nauka, 1984.

3. Kvakernaak X., Sivan P. Linejnye optimal'nye sistemy upravleniya. M.: Nauka, 1977.

4. Palamarchuk E.S. Analiz kriteriev dolgovremennogo srednego v zadache stokhasticheskogo linejnogo regulyatora // Avtomatika i telemekhanika. 2016. № 10. S. 78-92.

5. Palamarchuk E.S. Stabilizatsiya linejnykh stokhasticheskikh sistem s diskontirovaniem: modelirovanie dolgosrochnykh ehffektov primeneniya optimal'nykh strategij upravleniya // Matematicheskoe modelirovanie. 2015. T. 27, № 1. S. 3-15.

6. Czornik A. On time-varying LQG // IFAC Proceedings Volumes. 1998. Vol. 31. No. 18. P. 411-415.

7. Karafyllis I., Tsinias J. Non-uniform in time stabilization for linear systems and tracking control for non-holonomic systems in chained form //International Journal of Control. 2003. Vol. 76. No. 15. P. 1536-1546.

8. Smith P.L., Ratcliff R., Sewell D.K. Modeling perceptual discrimination in dynamic noise: Time-changed diffusion and release from inhibition // Journal of Mathematical Psychology. 2014. Vol. 59. P. 95-113.

Comments

No posts found

Write a review

Translate


1	Введение	Введение Введение

2	Рассматривается задача оптимального управления линейной экономической системой, функционирующей в условиях неопределенности на долгосрочном временном интервале. Динамика состояния системы задается при помощи управляемого случайного процесса, а воздействие случайных факторов моделируется аддитивным винеровским шумом. В качестве целевого функционала используется интегральный квадратичный функционал за плановый период. Матрицы коэффициентов системы управления определяются на основе динамического масштабирования стандартной системы с постоянными параметрами. Показывается, что оптимальный закон управления носит инвариантный характер, т.е. в явном виде не зависит от времени, а критерии оптимальности включают нормировки целевого функционала с учетом совокупного масштабирования (интеграла от масштабирующей функции).	Рассматривается задача оптимального управления линейной экономической системой, функционирующей в условиях неопределенности на долгосрочном временном интервале. Динамика состояния системы задается при помощи управляемого случайного процесса, а воздействие случайных факторов моделируется аддитивным винеровским шумом. В качестве целевого функционала используется интегральный квадратичный функционал за плановый период. Матрицы коэффициентов системы управления определяются на основе динамического масштабирования стандартной системы с постоянными параметрами. Показывается, что оптимальный закон управления носит инвариантный характер, т.е. в явном виде не зависит от времени, а критерии оптимальности включают нормировки целевого функционала с учетом совокупного масштабирования (интеграла от масштабирующей функции). Рассматривается задача оптимального управления линейной экономической системой, функционирующей в условиях неопределенности на долгосрочном временном интервале. Динамика состояния системы задается при помощи управляемого случайного процесса, а воздействие случайных факторов моделируется аддитивным винеровским шумом. В качестве целевого функционала используется интегральный квадратичный функционал за плановый период. Матрицы коэффициентов системы управления определяются на основе динамического масштабирования стандартной системы с постоянными параметрами. Показывается, что оптимальный закон управления носит инвариантный характер, т.е. в явном виде не зависит от времени, а критерии оптимальности включают нормировки целевого функционала с учетом совокупного масштабирования (интеграла от масштабирующей функции).

3	Описание модели и основные предположения	Описание модели и основные предположения Описание модели и основные предположения

4	Пусть на полном вероятностном пространстве задан n-мерный случайный процесс, описываемый уравнением	Пусть на полном вероятностном пространстве <img src="http://www.cemi.jes.su/images/publication_images/3508/image1.png" class="image-formula"/> задан n-мерный случайный процесс<img src="http://www.cemi.jes.su/images/publication_images/3508/image2.png" class="image-formula"/>, описываемый уравнением Пусть на полном вероятностном пространстве <img src="http://www.cemi.jes.su/images/publication_images/3508/image1.png" class="image-formula"/> задан n-мерный случайный процесс<img src="http://www.cemi.jes.su/images/publication_images/3508/image2.png" class="image-formula"/>, описываемый уравнением

5	Подпись к рисунку/медиа
6	где - d-мерный стандартный винеровский процесс, - допустимое управление, или k- мерный процесс, согласованный с фильтрацией, , такой что уравнение (1) имеет решение; A, B, G- матрицы соответствующих размерностей,G≠0; - неслучайный вектор. Множество допустимых управлений обозначим U. В (1) α_t>0, t≥0 - масштабирующая функция. Уравнение вида (1) ранее рассматривалось в различных приложениях при частичном масштабировании коэффициентов, см. (Karafyllis, Tsinias, 2003; Smith, Ratcliff, Sewell, 2014).	где <img src="http://www.cemi.jes.su/images/publication_images/3508/image4.png" class="image-formula"/>- <em>d</em>-мерный стандартный винеровский процесс, <img src="http://www.cemi.jes.su/images/publication_images/3508/image5.png" class="image-formula"/>- допустимое управление, или <em>k</em>- мерный процесс, согласованный с фильтрацией<img src="http://www.cemi.jes.su/images/publication_images/3508/image6.png" class="image-formula"/>, <img src="http://www.cemi.jes.su/images/publication_images/3508/image7.png" class="image-formula"/>, такой что уравнение (1) имеет решение; <em>A</em><em>, </em><em>B</em><em>, </em><em>G</em>- матрицы соответствующих размерностей,<em>G</em>≠0; <img src="http://www.cemi.jes.su/images/publication_images/3508/image8.png" class="image-formula"/>- неслучайный вектор. Множество допустимых управлений обозначим <em>U</em><em>.</em> В (1) α<sub>t</sub>>0, t≥0 - масштабирующая функция. Уравнение вида (1) ранее рассматривалось в различных приложениях при частичном масштабировании коэффициентов, см. (Karafyllis, Tsinias, 2003; Smith, Ratcliff, Sewell, 2014). где <img src="http://www.cemi.jes.su/images/publication_images/3508/image4.png" class="image-formula"/>- <em>d</em>-мерный стандартный винеровский процесс, <img src="http://www.cemi.jes.su/images/publication_images/3508/image5.png" class="image-formula"/>- допустимое управление, или <em>k</em>- мерный процесс, согласованный с фильтрацией<img src="http://www.cemi.jes.su/images/publication_images/3508/image6.png" class="image-formula"/>, <img src="http://www.cemi.jes.su/images/publication_images/3508/image7.png" class="image-formula"/>, такой что уравнение (1) имеет решение; <em>A</em><em>, </em><em>B</em><em>, </em><em>G</em>- матрицы соответствующих размерностей,<em>G</em>≠0; <img src="http://www.cemi.jes.su/images/publication_images/3508/image8.png" class="image-formula"/>- неслучайный вектор. Множество допустимых управлений обозначим <em>U</em><em>.</em> В (1) α<sub>t</sub>>0, t≥0 - масштабирующая функция. Уравнение вида (1) ранее рассматривалось в различных приложениях при частичном масштабировании коэффициентов, см. (Karafyllis, Tsinias, 2003; Smith, Ratcliff, Sewell, 2014).

7	Для любого T>0 определим целевой функционал издержек	Для любого T>0 определим целевой функционал издержек Для любого T>0 определим целевой функционал издержек

8	Подпись к рисунку/медиа
9	где - допустимое управление на интервале [0,T], Q, R, - постоянные матрицы, неотрицательно определенная и положительно определенная соответственно (- транспонирование). При наличии монотонной функции α_t>0 в (2), α_t можно придать смысл дисконтирующей. Положительное дисконтирование возникает для убывающей α_t, а отрицательное имеет место в случае, когда α_t - возрастает, см. (Паламарчук, 2015).	где <img src="http://www.cemi.jes.su/images/publication_images/3508/image10.png" class="image-formula"/> - допустимое управление на интервале [0,T], <em>Q</em>, <em>R</em>, - постоянные матрицы, неотрицательно определенная и положительно определенная соответственно (<img src="http://www.cemi.jes.su/images/publication_images/3508/image11.png" class="image-formula"/>- транспонирование). При наличии монотонной функции α<sub>t</sub>>0 в (2), α<sub>t</sub> можно придать смысл дисконтирующей. Положительное дисконтирование возникает для убывающей α<sub>t</sub>, а отрицательное имеет место в случае, когда α<sub>t</sub> - возрастает, см. (Паламарчук, 2015). где <img src="http://www.cemi.jes.su/images/publication_images/3508/image10.png" class="image-formula"/> - допустимое управление на интервале [0,T], <em>Q</em>, <em>R</em>, - постоянные матрицы, неотрицательно определенная и положительно определенная соответственно (<img src="http://www.cemi.jes.su/images/publication_images/3508/image11.png" class="image-formula"/>- транспонирование). При наличии монотонной функции α<sub>t</sub>>0 в (2), α<sub>t</sub> можно придать смысл дисконтирующей. Положительное дисконтирование возникает для убывающей α<sub>t</sub>, а отрицательное имеет место в случае, когда α<sub>t</sub> - возрастает, см. (Паламарчук, 2015).

10	Обращаясь к анализу (1)-(2) в ситуации масштабирования, отметим, что если функция α_t является монотонной и α₀=1, то при α_t>1 имеем инфляцию (рост абсолютных значений) коэффициентов, случай , аналогичен «гиперинфляции».	Обращаясь к анализу (1)-(2) в ситуации масштабирования, отметим, что если функция α<sub>t</sub> является монотонной и α<sub>0</sub>=1, то при α<sub>t</sub>>1 имеем инфляцию (рост абсолютных значений) коэффициентов, случай <img src="http://www.cemi.jes.su/images/publication_images/3508/image12.png" class="image-formula"/>, <img src="http://www.cemi.jes.su/images/publication_images/3508/image13.png" class="image-formula"/> аналогичен «гиперинфляции». Обращаясь к анализу (1)-(2) в ситуации масштабирования, отметим, что если функция α<sub>t</sub> является монотонной и α<sub>0</sub>=1, то при α<sub>t</sub>>1 имеем инфляцию (рост абсолютных значений) коэффициентов, случай <img src="http://www.cemi.jes.su/images/publication_images/3508/image12.png" class="image-formula"/>, <img src="http://www.cemi.jes.su/images/publication_images/3508/image13.png" class="image-formula"/> аналогичен «гиперинфляции».

11	Ситуация означает отсутствие масштабирования, постоянство коэффициентов во времени и соответствует автономной системе управления. Если же α_t, , приводит к вырождению матриц.	<p>Ситуация <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image14.png" alt="" /> означает отсутствие масштабирования, постоянство коэффициентов во времени и соответствует автономной системе управления. Если же α<sub>t</sub>, <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image13.png" alt="" />, приводит к вырождению матриц. </p> <p>Ситуация <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image14.png" alt="" /> означает отсутствие масштабирования, постоянство коэффициентов во времени и соответствует автономной системе управления. Если же α<sub>t</sub>, <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image13.png" alt="" />, приводит к вырождению матриц. </p>

12	Далее формулируются предположения, в рамках которых будут получены основные результаты исследования. Предположение . Масштабирующая функция α_t>0, t≥0 является интегрируемой и . Предположение P. Пара матриц (A,B) - стабилизируема, пара матриц - выявляема (соответствующие определения см., напр., в (Дэвис, 1984, с.167-168)).	<p>Далее формулируются предположения, в рамках которых будут получены основные результаты исследования.</p> <p>Предположение <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image16.png" alt="" />. Масштабирующая функция α<sub>t</sub>>0, t≥0 является интегрируемой и <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image17.png" alt="" /><img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image13.png" alt="" />.</p> <p>Предположение <em><strong>P</strong></em>. Пара матриц <em>(</em><em>A</em><em>,</em><em>B</em><em>) </em>- стабилизируема, пара матриц <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image18.png" alt="" /> - выявляема (соответствующие определения см., напр., в (Дэвис, 1984, с.167-168)).</p> <p>Далее формулируются предположения, в рамках которых будут получены основные результаты исследования.</p> <p>Предположение <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image16.png" alt="" />. Масштабирующая функция α<sub>t</sub>>0, t≥0 является интегрируемой и <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image17.png" alt="" /><img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image13.png" alt="" />.</p> <p>Предположение <em><strong>P</strong></em>. Пара матриц <em>(</em><em>A</em><em>,</em><em>B</em><em>) </em>- стабилизируема, пара матриц <img class="image-formula" src="http://www.cemi.jes.su/images/publication_images/3508/image18.png" alt="" /> - выявляема (соответствующие определения см., напр., в (Дэвис, 1984, с.167-168)).</p>

13	Постановка задачи и описание оптимальной установившейся стратегии управления	Постановка задачи и описание оптимальной установившейся стратегии управления Постановка задачи и описание оптимальной установившейся стратегии управления

14	Хорошо известно, см. (Квакернаак, Сиван, 1977, Теорема 3.7, с. 275), что при условии выполнения предположения P существует так называемый оптимальный установившийся закон управления U^*, имеющий вид	Хорошо известно, см. (Квакернаак, Сиван, 1977, Теорема 3.7, с. 275), что при условии выполнения предположения <em><strong>P</strong></em> существует так называемый оптимальный установившийся закон управления <em>U</em><sup><em></em></sup>, имеющий вид Хорошо известно, см. (Квакернаак, Сиван, 1977, Теорема 3.7, с. 275), что при условии выполнения предположения <em><strong>P</strong></em> существует так называемый оптимальный установившийся закон управления <em>U</em><sup><em></em></sup>, имеющий вид

15	Подпись к рисунку/медиа (3) (3)
16	где матрица П является единственным неотрицательно определенным решением алгебраического уравнения Риккати	где матрица П является единственным неотрицательно определенным решением алгебраического уравнения Риккати где матрица П является единственным неотрицательно определенным решением алгебраического уравнения Риккати

17	Подпись к рисунку/медиа (4) (4)
18	Для системы с постоянными параметрами стратегия U^* оказывается решением задачи управления на бесконечном интервале времени с критерием долговременного среднего, см., напр., (Дэвис, 1984, Теорема 5.4.3, с. 169), а также вероятностного критерия потраекторного среднего (потраекторного эргодического):	Для системы с постоянными параметрами стратегия <em>U</em><sup><em></em></sup> оказывается решением задачи управления на бесконечном интервале времени с критерием долговременного среднего, см., напр., (Дэвис, 1984, Теорема 5.4.3, с. 169), а также вероятностного критерия потраекторного среднего (потраекторного эргодического): Для системы с постоянными параметрами стратегия <em>U</em><sup><em></em></sup> оказывается решением задачи управления на бесконечном интервале времени с критерием долговременного среднего, см., напр., (Дэвис, 1984, Теорема 5.4.3, с. 169), а также вероятностного критерия потраекторного среднего (потраекторного эргодического):

19	(5)и с вероятностью 1.	(5)<img src="http://www.cemi.jes.su/images/publication_images/3508/image21.png" class="image-formula"/>и <img src="http://www.cemi.jes.su/images/publication_images/3508/image22.png" class="image-formula"/> с вероятностью 1. (5)<img src="http://www.cemi.jes.su/images/publication_images/3508/image21.png" class="image-formula"/>и <img src="http://www.cemi.jes.su/images/publication_images/3508/image22.png" class="image-formula"/> с вероятностью 1.

20	При этом оптимальное значение обоих критериев совпадает и равно ((tr (.) - след матрицы).	При этом оптимальное значение обоих критериев совпадает и равно <img src="http://www.cemi.jes.su/images/publication_images/3508/image23.png" class="image-formula"/> ((<em>tr</em> (.) - след матрицы). При этом оптимальное значение обоих критериев совпадает и равно <img src="http://www.cemi.jes.su/images/publication_images/3508/image23.png" class="image-formula"/> ((<em>tr</em> (.) - след матрицы).

21	Как было показано в (Паламарчук, 2016), приведенные критерии адекватно отражают воздействие фактора неопределенности на оценку качества управления только для случая системы (1)-(2) с ограниченными коэффициентами и невырожденной матрицей диффузии в (1). В рассматриваемой ситуации одновременного масштабирования параметров (1)-(2) для сравнении стратегий управления при будут использоваться понятия обобщенного долговременного среднего и обобщенного стохастического долговременного среднего, введенные в (Белкина, Паламарчук, 2013) для переменной матрицы G_t, когда в (5) вместо нормировки T используется. В данном случае, и в следующем разделе будет приведен результат о виде оптимального закона управления.	Как было показано в (Паламарчук, 2016), приведенные критерии адекватно отражают воздействие фактора неопределенности на оценку качества управления только для случая системы (1)-(2) с ограниченными коэффициентами и невырожденной матрицей диффузии в (1). В рассматриваемой ситуации одновременного масштабирования параметров (1)-(2) для сравнении стратегий управления при <img src="http://www.cemi.jes.su/images/publication_images/3508/image24.png" class="image-formula"/> будут использоваться понятия обобщенного долговременного среднего и обобщенного стохастического долговременного среднего, введенные в (Белкина, Паламарчук, 2013) для переменной матрицы <em>G</em><sub><em>t</em></sub>, когда в (5) вместо нормировки <em>T</em> используется<img src="http://www.cemi.jes.su/images/publication_images/3508/image25.png" class="image-formula"/>. В данном случае<img src="http://www.cemi.jes.su/images/publication_images/3508/image26.png" class="image-formula"/>, и в следующем разделе будет приведен результат о виде оптимального закона управления. Как было показано в (Паламарчук, 2016), приведенные критерии адекватно отражают воздействие фактора неопределенности на оценку качества управления только для случая системы (1)-(2) с ограниченными коэффициентами и невырожденной матрицей диффузии в (1). В рассматриваемой ситуации одновременного масштабирования параметров (1)-(2) для сравнении стратегий управления при <img src="http://www.cemi.jes.su/images/publication_images/3508/image24.png" class="image-formula"/> будут использоваться понятия обобщенного долговременного среднего и обобщенного стохастического долговременного среднего, введенные в (Белкина, Паламарчук, 2013) для переменной матрицы <em>G</em><sub><em>t</em></sub>, когда в (5) вместо нормировки <em>T</em> используется<img src="http://www.cemi.jes.su/images/publication_images/3508/image25.png" class="image-formula"/>. В данном случае<img src="http://www.cemi.jes.su/images/publication_images/3508/image26.png" class="image-formula"/>, и в следующем разделе будет приведен результат о виде оптимального закона управления.

22	Основные результаты	Основные результаты Основные результаты

References

Comments

Via social network