Математична модель методу головних компонент
Химия

Математична модель методу головних компонент


Математична модель методу головних компонент

Завантажити реферат: Математична модель методу основних компонентів

Вступ

З-поміж методів, що дозволяють узагальнювати значення елементарних ознак, метод головних компонент виділяється простою логічною конструкцією і в той же час на його прикладі стають зрозумілими загальна ідея та цільові установки численних методів факторного аналізу.

Метод головних компонент дає можливість m – числу вихідних ознак виділити mголовних компонентів, або узагальнених ознак. Простір основних компонентів ортогонально.

Математична модель способу основних компонентів базується на логічному припущенні, що значення множини взаємопов’язаних ознак породжують певний загальний результат.

1 Короткі теоретичні відомості

Розв’язання задачі методом головних компонентів зводиться до поетапного перетворення матриці вихідних даних X (Рисунок 1.1):

Математична модель методу головних компонент

Рисунок 1.1 – Схема математичних перетворень

На малюнку позначено: X — матриця вихідних даних розмірністю n*m (n— Число об’єктів спостереження, m — Число елементарних аналітичних ознак); Z – матриця центрованих та нормованих значень ознак, елементи матриці обчислюють за формулою:Математична модель методу головних компонент; R — матриця парних кореляцій:
R= (1/n)*Z’*Z.

Якщо попередня стандартизація даних не проводилася, то на цьому кроці отримують матрицю S = (1/n)*X’*X, елементи матриці Xдо розрахунку будуть центрованими величинами.

Опишемо подальші кроки обчислень для методу основних компонентів і пояснимо математичний сенс отриманих результатів.

Λ — Діагональна матриця власних (характеристичних) чисел.

Безліч рішень λjзнаходять рішення характеристичного рівняння |R — λE| =
0.
λj – це показники варіації, точніше, показники дисперсії кожної головної компоненти. Сумарне значення Σλjодно сумі дисперсій елементарних ознак Xj. За умови стандартизації вихідних даних ця сума дорівнює числу елементарних ознак m.

Розв’язавши характеристичне рівняння, знаходять його коріння λj. Після цього обчислюють власні вектори матриці
R. Реально це означає рішення mсистем лінійних рівнянь для кожного
λj при j = 1..m. У загальному вигляді система має вигляд:

Математична модель методу головних компонент (1.1)

Наведена система поєднує однорідні лінійні рівняння, і оскільки кількість її рівнянь дорівнює числу невідомих, вона має безліч рішень. Конкретні значення власних векторів у своїй можна визначити, задаючи довільно по крайнього заходу величину однієї компоненти кожного вектора.

A — матриця факторного відображення, її елементи arj — Вагові коефіцієнти. На початку Aмає розмірність m*m – за кількістю елементарних ознак
Xj, потім в аналізі залишається rнайбільш значущих компонент,
r ≤ m. Обчислюють матрицю Aза відомими даними матриці власних чисел
Λта нормованих власних векторів V за формулою A = VΛ1/2.

F — матриця значень основних компонентів розмірністю r*n, F = A-1Z’. Ця матриця у загальному вигляді записується:

Математична модель методу головних компонент

Математична модель методу головних компонент (1.2)

2 Опис програмної реалізації

Програма для реалізації методу основних компонентів була написана мовою Turbo Pascal 7.0. Усі обчислення виконані у послідовності, представленій малюнку 1.1. Позначення програмних змінних і масивів наскільки можна відповідають викладеним вище. Програма є достатньо універсальною, т.к. пристосована для обробки масивів даних будь-якої розмірності (розмір обмежений лише обсягом доступної пам’яті). Однак у програмі не передбачено введення даних із клавіатури. Розмірність масивів задана константами, а масив вихідних даних ініціалізується у тілі програми. За необхідності введення інших даних можна легко скоригувати вихідний текст програми.

Окремою процедурою у програмі описано виведення на екран матриці m*m. У програмі часто доводиться робити цю операцію, тому вона оформлена як процедура out.

Першою процедурою є центрування та нормування вихідних даних. Воно виконується відповідно до описаних вище формул.

Далі запрограмовано знаходження коефіцієнтів характеристичного рівняння для кореляційної матриці R. Воно виробляється відповідно до рекурентних співвідношень Фаддєєва, тобто за слідом матриць, похідних з R, за формулами:

Ai-1=ABi-2; Pi-1=1/(m-1)trAi-1;
Bi-1=Ai-1-Pi-1E; i=1,2..m. (2.1)

Після обчислення рекурентних співвідношень знаходиться характеристичний поліном:

Pm(λ) = λm — P1 λm-1 — P2 λm-2 -…- Pm. (2.2)

Відомо, що за m > 4(2.2) немає загального рішення. Однак ми знаємо, що це рівняння має все речове коріння, і що їх число дорівнює m. Для знаходження використовується ітераційний метод Ньютона, оскільки досліджувана функція – поліном і немає труднощів у обчисленні її похідної. Ітераційна формула Ньютона для i-ї точки має вигляд:

Математична модель методу головних компонент , (2.3)

де j — Номер ітерації.

Далі відповідно до (1.1) знаходимо власні вектори матриці R. Аби вирішити систем рівнянь застосовувався метод Гаусса. Однак попередньо необхідно було виключити одне невідоме. Для цього змінним umjбуло присвоєно поодинокі значення, останній стовпець перенесено у праву частину зі зворотним знаком, а останнє рівняння виключено з розгляду.

Після отримання матриці власних векторів Uбуло проведено її нормування, внаслідок чого було отримано матрицю нормованих власних векторів V.

Потім обчислюється матриця факторного відображення Aвідповідно до правил множення матриць.

Далі знаходиться матриця, зворотна до A, методом m-кратного перерахунку елементів [3,с.358] за рекурентними формулами:

Математична модель методу головних компонент

де k — Номер ітерації, k=1..m. На завершальному етапі A-1= -A(k).

Після знаходження матриці, зворотної A, знаходимо матрицю F – матрицю факторного відображення та виводимо її на екран у транспонованому вигляді відповідно до (1.2). У цьому розрахунки методом основних компонент завершено.

Висновок

У цій роботі була побудована математична модель і програмна реалізація методу основних компонентів. Слід зазначити, що в роботі не була розглянута методика відсіву несуттєвих факторів, і тому результуюча модель, що видається програмою на екран, містить число компонент, що дорівнює кількості вихідних елементарних ознак m. До переваг розробленої програми можна віднести те, що вона може працювати з масивами вихідних даних досить великої розмірності.

Література

1 Сошникова Л.А., Тамашевич В.М., Уебе Г., Шебер М. Багатовимірний статистичний аналіз економіки: Навч. Посібник для вузів / Под ред. проф. Тамашевіча. — М.: ЮНІТІ-ДАНА, 1999. -598с.

2 А. Єпанешников, В. Єпанешников. Програмування серед Turbo Pascal 7.0. -3-тє вид., Стер. -М.: «ДІАЛОГ-МІФІ», 1997. -288с.

3 Жуков Л.А., Стратан І.П. Установлені режими складних електричних мереж та систем: Методи розрахунків. -М.: Енергія, 1979. — 416 с.

© Реферат плюс



Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *