Relationship Between Maximum Principle and Dynamic Programming in presence of Intermediate and Final State Constraints - ENSTA Paris - École nationale supérieure de techniques avancées Paris Accéder directement au contenu
Article Dans Une Revue ESAIM: Control, Optimisation and Calculus of Variations Année : 2021

Relationship Between Maximum Principle and Dynamic Programming in presence of Intermediate and Final State Constraints

Olivier Bokanowski
Anya Désilles
Housnaa Zidani

Résumé

In this paper, we consider a class of optimal control problems governed by a differential system. We analyze the sensitivity relations satisfied by the co-state arc of the Pontryagin maximum principle and the value function that associates the optimal value of the control problem to the initial time and state. Such a relationship has been already investigated for state-constrained problems under some controllability assumptions to guarantee Lipschitz regularity property of the value function. Here, we consider the case with intermediate and final state constraints, without any controllability assumption on the system, and without Lipschitz regularity of the value function. Because of this lack of regularity, the sensitivity relations cannot be expressed with the sub-differentials of the value function. This work shows that the constrained problem can be reformulated with an auxiliary value function which is more regular and suitable to express the sensitivity of the adjoint arc of the original state-constrained control problem along an optimal trajectory. Furthermore, our analysis covers the case of normal optimal solutions, and abnormal solutions as well.
Dans cet article, nous considérons une classe de problèmes de contrôle optimal régis par un système différentiel non-linéaire. Nous analysons le lien entre l'état adjoint du Principe du Maximum de Pontryagin et la fonction de valeur qui associe la valeur optimale du problème de contrôle aux conditions initiales du système. Une telle relation a déjà été étudiée pour les problèmes de contraintes d'état sous certaines hypothèses de contrôlabilité afin de garantir la régularité Lipschitz de la fonction valeur. Ici, nous considérons le cas avec des contraintes d'état intermédiaires et finale, sans aucune hypothèse de contrôlabilité sur le système ni sur la régularité Lipschitz de la fonction valeur. A cause de ce manque de régularité, les relations de sensibilité ne peuvent pas s'exprimer avec les sous-differentiels de la fonction valeur. Par contre, on prouve que le problème contraint peut se reformuler avec une fonction valeur auxiliaire qui est plus régulière et qui permet d'exprimer la sensibilité de l'état adjoint du problème original avec contraintes d'état autour d'une trajectoire optimale. De plus, notre analyse couvre le cas d’extrémales normales, ainsi que le cas d'extrémales anormales.
Fichier principal
Vignette du fichier
000-mainPMP-HJB.pdf (400.5 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-03079781 , version 1 (17-12-2020)
hal-03079781 , version 2 (30-08-2021)

Identifiants

Citer

Olivier Bokanowski, Anya Désilles, Housnaa Zidani. Relationship Between Maximum Principle and Dynamic Programming in presence of Intermediate and Final State Constraints. ESAIM: Control, Optimisation and Calculus of Variations, inPress, ⟨10.1051/cocv/2021084⟩. ⟨hal-03079781v2⟩
81 Consultations
394 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More