Programmation dynamique
Programmation dynamique
Technique de recherche opérationnelle visant à définir une suite de décisions reliées entre elles en vue d’optimiser un résultat cumulé de l’ensemble des périodes correspondantes; par exemple, quantités à mettre en fabrication chaque mois, compte tenu des ventes et des frais de stockage pour maximiser le profit annuel.
On utilise le principe d’optimalité de Bellman : « toute politique optimale ne peut être faite que d’une suite de politiques optimales ».
Ce principe est appliqué de façon séquentielle en partant de l’état final et en remontant à l’état initial, en cherchant pour chaque période quelle est l’action qui permet de passer d’un état à l’état postérieur de façon optimale.