Минимизация риска при функциональных ограничениях на динамическую помеху

Дмитрий Александрович Серков

Дмитрий Александрович Серков
- Институт математики и механики им. Н.Н. Красовского УрО РАН
- Уральский федеральный университет им. первого Президента России Б.Н. Ельцина

Ключевые слова: стратегия с полной памятью, критерий Сэвиджа, функциональные ограничения на помеху

Аннотация

В обзоре изложены вопросы применения критерия Ниханса-Сэвиджа к задачам управления в условиях динамических помех: дается мотивация и постановка задачи минимизации риска при различных функциональных ограничениях на помеху; приводятся непосредственные соотношения, связывающие результаты при различных ограничениях и классах разрешающих стратегий; даны примеры решения различных задач управления с этим критерием оценки; сопоставляются результаты, получаемые с применением критерия Ниханса-Сэвиджа, с результатами, базирующимися на классическом минимаксном критерии; исследуются условия неулучшаемости стратегий с полной памятью; дается представление функции оптимального риска как предела итерационной программной конструкции для функционала сожаления и условие регулярности этого функционала; приводятся другие условия на рассматриваемую управляемую систему, обеспечивающие возможность численной реализации оптимальной по риску стратегии.

Литература

1. Айзекс Р. Дифференциальные игры. М.: Мир, 1967. 480 c.
2. Красовский Н.Н. Лекции по теории управления. Вып. 3. Дифференциальные игры. Свердловск: Уральский государственный университет им. А.М. Горького, 1970. 88 с.
3. Красовский Н.Н., Субботин A.И. Позиционные дифференциальные игры. М.: Наука, 1974. 456 с.
4. Субботин A.И., Ченцов A.Г. Оптимизация гарантии в задачах управления. М.: Наука, 1981. 288 с.
5. Красовский Н.Н. Управление динамической системой. М.: Наука, 1985. 520 с.
6. Kryazhimskii A.V. The problem of optimization of the ensured result: unimprovability of full-memory strategies // Constantin Caratheodory: An International Tribute. 1991. P. 636-675.
7. Барабанова Н.Н., Субботин А.И. О непрерывных стратегиях уклонения в игровых задачах о встрече движений // Прикл. матем. и мех. 1970. Т. 34. № 5. С. 796-803.
8. Барабанова Н.Н., Субботин А.И. О классах стратегий в дифференциальных играх уклонения от встречи // Прикл. матем. и мех. 1971. Т. 35. № 3. С. 385-392.
9. Красовский Н.Н. Игровые задачи о встрече движений. М.: Наука, 1970. 420 с.
10. Красовский Н.Н., Субботин A.И. О структуре дифференциальных игр // Докл. АН СССР. 1970. Т. 190. № 3. С. 523-526.
11. Красовский Н.Н., Субботин A.И. Альтернатива для игровой задачи сближения // Прикл. матем. и мех. 1970. Т. 34. № 6. С. 1005-1022.
12. Niehans J. Zur Preisbildung bei ungewissen Erwartungen // Scbweizerische Zietschrift fur Volkswirtschaft und Statistik. 1948. Vol. 84. No. 5. P. 433-456.
13. Savage L.J. The theory of statistical decision // Journal of the American Statistical Association. 1951. Vol. 46. No. 253. P. 55-67. DOI: 10.1080/01621459.1951.10500768
14. Salmon David M. Policies and controller design for a pursuing vehicle // IEEE Transactions on Automatic Control. 1969. Vol. AC-14. No. 5. P. 482-488.
15. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М.: Наука, 1977. 624 с.
16. Серков Д.А. Оптимальная гарантия при помехах, порожденных функциями Каратеодори // Вестник Удмуртского университета. Математика. Механика. Компьютерные науки. 2012. № 2. С. 74-83.
17. Натансон И.П. Теория функций вещественной переменной. М.: Наука, 1974. 480 с.
18. Ченцов А.Г. Об игровой задаче на минимакс функционала // Докл. АН СССР. 1976. Т. 230. № 5. С. 1047-1050.
19. Субботин А.И. Обобщенные решения уравнений в частных производных первого порядка. Перспективы динамической оптимизации. М.-Ижевск: Инcтитут компьютерных исследований, 2003. 336 с.
20. Серков Д.А. Стратегии минимаксного риска (сожаления) в системе с простыми движениями // Труды ИММ УрО РАН. 2007. Т. 13. № 3. С. 121-135. http://www.mathnet.ru/links/76f25b7a5c5927a4c0fb10bee62e3f84/timm111.pdf
21. Субботина Н.Н. Универсальные оптимальные стратегии в позиционных дифференциальных играх // Дифф. уравнения. 1983. Т. 19. № 11. С. 1890-1896.
22. Серков Д.А. О неулучшаемости стратегий с полной памятью в задаче минимизации риска // Труды ИММ УрО РАН. 2013. Т. 19. № 4. С. 222-230.
23. Кряжимский А.В., Осипов Ю.С. О позиционном моделировании управления в динамических системах // Изв. АН СССР: Техн. кибернет. 1983. № 2. С. 51-60.
24. Osipov Yu.S., Kryazhimskii A.V. Inverse problems for ordinary differential equations: dynamical solutions. London: Gordon and Breach Publishers, 1995. 625 p.
25. Серков Д.А. Оптимальное по риску управление при функциональных ограничениях на помеху // Математическая теория игр и ее приложения. 2013. Т. 5. Вып. 1. С. 74-103.
26. Ченцов А.Г. К игровой задаче наведения // Докл. АН СССР. 1976. Т. 226. № 1. С. 73-76.
27. Ченцов А.Г. К игровой задаче наведения с информационной памятью // Докл. АН СССР. 1976. Т. 227. № 2. С. 306-309.
28. Ченцов А.Г. Итерационная программная конструкция для дифференциальной игры с фиксированным моментом окончания // Докл. АН СССР. 1978. Т. 240. № 1. С. 36-39.
29. Ченцов А.Г. Об игровой задаче сближения в заданный момент времени // Математический сборник. 1976. Т. 99 (141). № 3. С. 394-420.
30. Петросян Л.А., Чистяков С.В. Об одном подходе к решению игр преследования // Вестник ЛГУ. Математика. Механика. Астрономия. 1977. Т. 1. С. 77-82.
31. Чистяков С.В. К решению игровых задач преследования // Прикл. матем. и мех. 1977. Т. 41. № 5. С. 825-832.
32. Чистяков С.В. О функциональных уравнениях в играх сближения в заданный момент времени // Прикл. матем. мех. 1982. Т. 46. № 5. С. 874-877.
33. Чистяков С.В. Программные итерации и универсальные $\varepsilon$-оптимальные стратегии в позиционной дифференциальной игре // Докл. АН СССР. 1991. Т. 319. № 6. С. 1333-1335.
34. Чистяков С.В. Операторы значения в теории дифференциальных игр // Известия Института математики и информатики УдГУ. 2006. № 3 (37). С. 169-172.
35. Чистяков С.В., Никитин Ф.Ф. Теорема существования и единственности решения обобщенного уравнения Айзекса-Беллмана // Дифференц. уравнения. 2007. Т. 43. № 6. С. 757-766.
36. Меликян А.А. Цена игры в линейной дифференциальной игре сближения // Докл. АН СССР. 1977. Т. 237. № 3. С. 521-524.
37. Ухоботов В.И. Построение стабильного моста для одного класса линейных игр // Прикл. матем. и мех. 1977. Т. 41. № 2. С. 358-364.
38. Серков Д.А. Сильно оптимальные стратегии // Доклады АН СССР. 1991. Т. 321. № 2. С. 258-262.
39. Окстоби Дж. Мера и категория. М.: Мир, 1974. 160 с.
40. Филиппов В.В. О теории задачи Коши для обыкновенного дифференциального уравнения с разрывной правой частью // Математический сборник. 1994. Т. 185. № 11. С. 95-118.
41. Иосида К. Функциональный анализ. М.: Мир, 1967. 624 с.