
Курсова — 5 Оптимальне керування дискретними динамічними системами
Існує два типи детермінованих керованих процесів (детермінованих систем)
(1)
— детермінована система
— керування (деяка функція від дискретного часу, яка входить у різницеве рівняння динамічної системи)
Стохастична керована система
(2)
, де
— шум (може бути білим
),
а може бути і небілим, наприклад, описуватися ковзним середнім ().
Критерій оптимального управління
Нехай модель (1) або (2) генерує випадковий процес:
— Керований процес із дискретним часом, тобто. процес повинен розвиватися таким чином, щоб мінімізувати деяку функцію ризику, тоді керування називається оптимальним.
Математично це виглядає так:
,
де f(?) — опукла функція
При русі ракети деякою траєкторією з точки А в точку В траєкторія повинна бути такою, щоб мінімізувати енергетичні витрати на управління.
Приклад 2 :
Метод динамічного програмування
Є детермінована система:
Принцип Белмана — полягає в тому, що оптимальне управління шукається з кінця в початок (з майбутнього в минуле).
Завдання вирішується у зворотному напрямку.
Аналітичне вирішення завдання щодо Белмана
Припустимо, що ми вирушили з
і пройшли траєкторію:
. І припустимо, що за крок кроків управління обрали. Принцип динамічного програмування полягає в тому, що будь-який шматок траєкторії оптимального управління є оптимальним.
Припустимо, що починаючи від кроку (k+1) до ‘n’ у формулі (4) оптимальне керування вже вибрано.
Формула (6) називається рівнянням Белмана (рівняння динамічного програмування)
Висновки: (З рівняння (6))
Рівняння (6) дозволяє в реккурентної формі обчислити управління, крок за кроком, від точки N до 1 (з майбутнього минулого) отримати мінімізацію (6) на кожному кроці. Отримати
. Значення управління фактично виходять шляхом перебору. Оптимальна траєкторія
) невідома до останнього кроку.
Якщо завдання має більшу розмірність, то складність при обчисленні дуже велика. Якщо вводити динамічні системи (тобто моделі), можна значно спростити метод знаходження оптимального управління. Тобто. отримати керування в замкнутому вигляді (у вигляді деякої формули).
Синтез оптимального керування для марківських динамічних систем.
(1)
;
;
; де —
— Управління;
— Шум динамічної системи.
Управління має міняти
— траєкторію, і змінювати її те щоб мінімізувати середній критерій якості, причому керується динамічна система за всіма координатами.
— Керований випадковий процес.
Динамічна система, як така, немає, а спостерігається j() (Нелінійно перетворена фазова змінна) з шумом. У цьому випадку кажуть, що динамічна система не спостерігається безпосередньо. Для того, щоб зробити її спостережуваною, необхідно використовувати теорію нелінійної фільтрації (див. попередні лекції).
У цьому випадку отримуємо оцінку нелінійної динамічної системи в умовах лінеаризації за Тейлором:
(2)
Синтез раціонального управління використовуючи (2) проведемо застосувавши квадратичний критерій якості, причому управління динамічною системою вести до деякого стандарту, тобто. задано:
, i=1,2…n
Критерій оптимізації
(3)
;
де || — норма,
.
Ризик складається з двох доданків:
1-е доданок : Це квадрат відхилення траєкторії від еталона Воно має бути мінімізовано з урахуванням формули (2).
2-ге доданок : Це сума з квадратом самого управління (деяка сила) повинні бути мінімізовані (так має бути завжди)
Мінімізація (3) – це досить складне завдання варіаційного обчислення (просто взяти тут похідну за ‘u’ не вдається).
Для мінімізації (3) використовуємо рівняння Белмана:
(4)
У формулі (4) мінімізуючи крок за кроком отримаємо:
(5)
; де
— матриця
Висновки: (До формули (5))
Оптимальне управління (5) реалізується з використанням лінійної оцінки динамічної системи, і це управління вставляється у формулу:
Якщо спростити критерій і привести його до вигляду (3′):(3′)
то мінімізація дає оптимальне управління зразка:
(6)
Оптимальне управління пропорційно різниці між екстраполірованою оцінкою та еталоном, т.ч. отримаємо:
(7)
Оцінка (7) підставляється у (6). Згодом, при мінімізації в цьому випадку сама оцінка
прямує до стандарту.
Приклад синтезу динамічної системи керування частотою генератора
Загальна постановка:
Нехай є деяка еталонна траєкторія
(1) , де
— шум
Якщо стандарт захищений, його фільтрують.
Є керована динамічна система:
Керована динамічна система — фаза генератора чи траєкторія, яка має підлаштуватися під зразок.
(2)
; шуму
часто ні, тому їм нехтують. Нехай
(3)
Розглянемо більш складну модель фази генератора, що розглядається.
(4)
Вважаємо, що у (1),(3) догляд фази дуже повільний, тобто. . Використовуючи нелінійну функцію оцінка зразка:
(4′)
(4) рішення рівняння щодо
має вигляд :
(5)
; с<1.
Вище було доведено, використовуючи рівняння Белмана, що :
(6)
Структурна схема реалізації оптимального управління підстроювання частоти до зразка
На виході — частота генератора, що підлаштовується.
Підстроюваний генератор має такий вигляд:
— змінюється згідно із законом (4), керуюча функція впливає /що виробляється минулому кроці (i-1)/ вона повинна підлаштовувати генератор те щоб вона прагнула эталону.
Для цього : є пристрій управління, який впливає на контур генератора, що підлаштовується так, щоб (шляхом впливу на варикап)
; a = с, тоді
.
Керована система із зворотним зв’язком: якщо є відхилення фази на
, (Тобто відхилення частоти) (
), тоді вирішальний запобіжник дає оцінку
. Це призведе до того, що
відхилиться, напруга подається на пристрій керування, яке ліквідує збільшення. (Праве кільце називається – кільце ФАПЧ).
Постановка задачі
Визначення: Слідчим вимірником називається система, яка здійснює оцінку деякого параметра (який є випадковим процесом) у режимі, що стежить.
Параметр може мати наступний фізичний сенс :
а) Кутові координати деякого літального апарату, що змінюються у часі.
б) Зміна у часі доплерівської частоти.
в) Дальність до об’єкта.
приклад : літальний апарат
На виході — частота генератора, що підлаштовується.
Підстроюваний генератор має такий вигляд:
— змінюється згідно із законом (4), керуюча функція впливає /що виробляється минулому кроці (i-1)/ вона повинна підлаштовувати генератор те щоб вона прагнула эталону.
Для цього : є пристрій управління, який впливає на контур генератора, що підлаштовується так, щоб
(шляхом впливу на варикап)
; a = с, тоді
.
Керована система із зворотним зв’язком: якщо є відхилення фази на
, (Тобто відхилення частоти) (
), тоді вирішальний пристрій дає оцінку
. Це призведе до того, що
відхилиться, напруга подається на пристрій керування, яке ліквідує збільшення. (Праве кільце називається – кільце ФАПЧ).
© Реферат плюс

