• Таблиця №3


  • Дата конвертації28.07.2018
    Розмір136.05 Kb.
    Типконтрольна робота

    Скачати 136.05 Kb.

    з економетрики 3

    Варіант №3.

    Завдання №1.

    Території федерального округу

    Валовий регіональний продукт, млрд. Руб., Y

    Середньорічна чисельність зайнятих в економіці, млн. Чол., X

    1. Респ. Адигея

    5,1

    0,157

    2. Респ. Дагестан

    13,0

    0,758

    3. Респ. Інгушетія

    2,0

    0,056

    4. Кабардино-Балкарська респ.

    10,5

    0,287

    5. Респ. Калмикія

    2,1

    0,119

    6. Карачаєво-Черкеська Респ.

    4,3

    0,138

    7. Респ. Північна Осетія Аланія

    7,6

    0,220

    8. Краснодарський край

    109,1

    2,033

    9. Ставропольський край

    43,4

    1,008

    10. Астраханська обл.

    18,9

    0,422

    11. Волгоградська обл.

    50,0

    1,147

    12. Ростовська обл.

    69,0

    1,812

    Разом, S

    335

    8,157

    Середня

    27,917

    0,6798

    Середнє квадратичне відхилення, s

    32,20

    0,6550

    Дисперсія, D

    1036,87

    0,4290

    По територіях Південного федерального округу наводяться статистичні дані за 2000 рік:

    Таблиця №1

    завдання:

    1. Розмістіть території по зростанню фактора X. Сформулюйте робочу гіпотезу про можливий зв'язок Y і X.

    2. Побудуйте поле кореляції і сформулюйте гіпотезу про можливу форму і напрямку зв'язку.

    3. Розрахуйте параметри а 1 і а 0 парної лінійної функції і лінійно-логарифмічної функції

    4. Оцініть тісноту зв'язку за допомогою показників кореляції (r yx і η ylnx) і детермінації (r 2 yx і η 2 ylnx), проаналізуйте їх значення.

    5. Надійність рівнянь в цілому оціните через F-критерій Фішера для рівня значущості a = 0,05.

    6. На основі оціночних характеристик виберіть краще рівняння регресії і поясніть свій вибір.

    7. По кращому рівняння регресії розрахуйте теоретичні значення результату ( ), По ним побудуйте теоретичну лінію регресії і визначте середню помилку апроксимації - ε 'пор. , Оціните її величину.

    8. Розрахуйте прогнозне значення результату , Якщо прогнозне значення фактора ( ) Складе 1,023 від середнього рівня ( ).

    9. Розрахуйте інтегральну і граничну помилки прогнозу (для a = 0,05), визначте довірчий інтервал прогнозу ( ; ), А також діапазон верхньої і нижньої меж довірчого інтервалу ( ), Оцініть точність виконаного прогнозу.

    Рішення:

    1.Предварітельний аналіз вихідних даних виявив наявність однієї території (Краснодарський край) з аномальними значеннями ознак. Ця територія виключена з подальшого аналізу. Розташуємо території по зростанню фактора X.


    Територія федерального округу Середньорічна чисельність зайнятих в економіці, млн. Чол., X факт. Валовий регіональний продукт, млрд. Руб., Y

    Таблиця №2

    Території федерального округу

    Середньорічна чисельність зайнятих

    млн. чол., X

    Валовий регіональний продукт

    млрд. руб., Y

    1. Респ. Інгушетія

    0.056

    2.0

    2. Респ.Калмикія

    0.119

    2.1

    3. Карачаєво-Черкеська республіка

    0.138

    4.3

    4. Респ. Адигея

    0.157

    5.1

    5. Респ. Північна Осетія-Алтанія

    0.220

    7.6

    6. Кабардино-Балканська Респ.

    0.287

    10.5

    7. Астраханці обл.

    0.422

    18.9

    8. Респ. Дагестан

    0.758

    13.0

    9. Ставропольський край

    1.008

    43.4

    10. Волгоградська обл.

    1.147

    50.0

    11. Ростовська обл.

    1.812

    69.0

    Разом

    8.157

    335

    Середня

    0.6798

    27.917

    Середнє квадратичне відхилення, s

    0.6550

    32.20

    Дисперсія, D

    0.4290

    1036.87

    2. Зазвичай моделювання починається в побудови рівняння прямої:, що відбиває лінійну форму залежності результату Y від чинника X.


    3. Розрахунок невідомих параметрів рівняння виконаємо методом найменших квадратів (МНК), побудувавши систему нормальних рівнянь і вирішуючи її, щодо невідомих а0 і а1. Для розрахунку використовуємо значення визначників другого порядку Δ, Δа0 і Δа1. Розрахункові процедури представимо в разработочной таблиці, в яку, крім значень Y і X, увійдуть X2, X * Y, а також їх підсумкові значення, середні, сигми і дисперсії для Y і X. (див. Табл.3)

    Таблиця №3

    А

    1

    2

    3

    4

    5

    6

    7

    8

    1

    0,056

    2,0

    0,003

    0,112

    0,725

    1,275

    1, 626

    6, 209

    2

    0, 119

    2,1

    0,014

    0,250

    3,218

    -1,118

    1,249

    5,442

    3

    0,138

    4,3

    0,019

    0,593

    3,969

    0,331

    0,109

    1,610

    4

    0,157

    5,1

    0,025

    0,801

    4,721

    0,379

    0,144

    1,845

    5

    0,22

    7,6

    0,048

    1,672

    7,214

    0,386

    0,149

    1,881

    6

    0,287

    10,5

    0,082

    3,014

    9,865

    0,365

    0,404

    3,094

    7

    0,442

    18,9

    0,178

    7,976

    15,206

    3,694

    13,089

    17,475

    8

    0,758

    13,0

    0,575

    9,854

    28,500

    -15,506

    240,243

    75,475

    9

    1,008

    43,4

    1,016

    43,747

    38,391

    5,009

    25,089

    24,396

    10

    1,147

    50,0

    1,316

    57,350

    43,891

    6,109

    37,324

    29,749

    11

    1,812

    69,0

    3,283

    125,028

    70,202

    -1,202

    1,444

    5,851

    Разом

    6,214

    225,900

    6,559

    250,397

    121,2

    0,000

    321,427

    173,536

    Середня

    0,557

    20,556

    -

    -

    -

    -

    -

    15,776

    Сигма

    0,535

    21,852

    -

    -

    -

    -

    -

    -

    Дисперсія, D

    0,286

    477,502

    -

    -

    -

    -

    -

    -

    Δ =

    34,650

    -

    -

    -

    -

    -

    -

    -

    Δа 0 =

    -51,654

    -1,491

    -

    -

    -

    -

    -

    Δа 1 =

    1370,950

    39,565

    -

    -

    -

    -

    -

    Розрахунок визначника системи виконаємо за формулою:
    11 * 6,559 -6,124 * 6,124 = 34,650;
    Розрахунок визначника вільного члена рівняння виконаємо за формулою:
    225,900 * 6,559 - 250,397 * 6,124 = -51,654.
    Розрахунок визначника коефіцієнта регресії виконаємо за формулою:
    11 * 250,397 - 225,900 * 6,124 = 1370,950.


    4. Розрахунок параметрів рівняння регресії дає наступні результати:

    ; .

    В остаточному підсумку, отримуємо теоретичне рівняння регресії такого вигляду:

    У рівнянні коефіцієнт регресії а1 = 39,565 означає, що при збільшенні середньорічної чисельності зайнятих в економіці на 1 млн. Чол. (від своєї середньої) валовий регіональний продукт зросте на 39,565 млрд. руб. (від своєї середньої).
    Вільний член рівняння а 0 = -1,491 оцінює вплив інших факторів, що впливають на валовий регіональний продукт.
    Відносну оцінку сили зв'язку дає загальний (середній) коефіцієнт еластичності:

    5. Відносну оцінку сили зв'язку дає загальний (середній) коефіцієнт еластичності:


    У нашому випадку, коли розглядається лінійна залежність, розрахункова формула перетвориться до виду:

    Це означає, що при зміні середньорічної чисельності зайнятих в економіці на 1% від своєї середньої валовий регіональний продукт збільшується на 1,073 відсотка від своєї середньої.


    6. Для оцінки тісноти зв'язку розрахуємо лінійний коефіцієнт парної кореляції:

    Коефіцієнт кореляції, що дорівнює 0,9687, показує, що виявлена досить тісна залежність між середньорічною чисельністю зайнятих в економіці і валовим регіональним продуктом. Коефіцієнт детермінації, що дорівнює 0,9384, встановлює, що варіація валового регіонального продукту на 93,84% з 100% зумовлена варіацією середньорічної чисельності зайнятих в економіці; роль інших факторів, що впливають на роздрібний товарообіг, визначається в 6,16%, що є порівняно невеликою величиною.

    7. Для оцінки статистичної надійності виявленої залежності доходу від частки зайнятих розрахуємо фактичне значення F-критерію Фішера - F фактич. і порівняємо його з табличним значенням - F табл. . За результатами порівняння приймемо рішення по нульовій гіпотезі, тобто, або приймемо, або відхилимо її з імовірністю припуститися помилки, яка не перевищить 5% (або з рівнем значущості α = 0,05).
    У нашому випадку,

    Де k-число чинників в рівнянні; n - число досліджуваних об'єктів. Фактичне значення критерію показує, що факторна варіація результату в 137 рази більше залишкової варіації, що сформувалася під впливом випадкових причин. Очевидно, що подібні відмінності не можуть бути випадковими, а є результатом систематичного взаємодії обороту роздрібної торгівлі та загальної суми доходів населення. Для обґрунтованого висновку порівняємо отриманий результат з табличним значенням критерію: при ступенях свободи df 1 = k = 1 і df 2 = nk-1 = 11-1-1 = 9 і рівні значущості α = 0,05.
    В силу того, що нульову гіпотезу про статистично не значущі виявленої залежності валового регіонального продукту від середньорічної чисельності зайнятих в економіці і її параметрах можна відхилити з фактичної ймовірністю припуститися помилки значно меншою, ніж традиційні 5%.

    Визначимо теоретичні значення результату Y теор. Для цього в отримане рівняння послідовно підставимо фактичні значення фактора X і виконаємо розрахунок.

    наприклад, . Див. Гр. 5 розрахункової таблиці. За парам значень Y теор. і X факт. будується теоретична лінія регресії, яка перетнеться з емпіричної регресією в декількох точках. Див. Графік 1.

    9. Побудуємо теоретичну линю регресії, яка перетнеться з емпіричної регресією в декількох точках.

    У нашому випадку, скоригована помилка апроксимації становить 15,776%. Вона вказує на невисоку якість побудованої лінійної моделі і обмежує її використання для виконання точних прогнозних розрахунків навіть за умови порівняно невеликого зміни фактора X (щодо його середнього значення ).

    Залежність ВРП від чисельності зайнятих

    Графік№1

    Оцінку якості моделі дамо за допомогою скоригованої середньої помилки апроксимації:
    У нашому випадку, скоригована помилка апроксимації становить 15,776%. Вона вказує на невисоку якість побудованої лінійної моделі і обмежує її використання для виконання точних прогнозних розрахунків навіть за умови порівняно невеликого зміни фактора X (щодо його середнього значення).
    Побудова логарифмічної функції передбачає попереднє виконання процедури лінеаризації вихідних змінних. В даному випадку, для перетворення нелінійної функції в лінійну введемо нову змінну, яка лінійно пов'язана з результатом. Отже, для визначення параметрів моделі будуть використані традиційні розрахункові прийоми, засновані на значеннях визначників другого порядку.

    Побудова логарифмічної функції передбачає попереднє виконання процедури лінеаризації вихідних змінних. В даному випадку, для перетворення нелінійної функції в лінійну введемо нову змінну , Яка лінійно пов'язана з результатом. Отже, для визначення параметрів моделі будуть використані традиційні розрахункові прийоми, засновані на значеннях визначників другого порядку. Див. Таблицю №4.

    Таблиця № 4

    А

    1

    2

    3

    4

    5

    6

    7

    8

    9

    1

    0,056

    -2,882

    2,000

    8,308

    -5,765

    -12,249

    14,249

    203,023

    69,382

    2

    0,119

    -2,129

    2,100

    4,531

    -4,470

    1,550

    0,550

    0,303

    2,680

    3

    0,138

    -1,981

    4,300

    3,922

    -8,516

    4,261

    0,039

    0,001

    0,188

    4

    0,157

    -1, 852

    5,100

    3,428

    -9,443

    6,623

    -1,523

    2,318

    7,414

    5

    0,220

    -1,514

    7,600

    2,293

    -11,507

    12,799

    -5,199

    27,025

    25,314

    6

    0,287

    -1,248

    10,500

    1,558

    -13,107

    17,665

    -7,165

    51,341

    234,890

    7

    0,422

    -0,863

    18,900

    0,744

    -16,306

    24,722

    -5,822

    33,901

    28,352

    8

    0,758

    -0,277

    13,000

    0,077

    -3,602

    35,444

    -22,444

    503,720

    109,288

    9

    1,008

    0,008

    43,400

    0,000

    0,346

    40,662

    2,738

    7,499

    13,335

    10

    1,147

    0,137

    50,000

    0,019

    6,857

    43,026

    6,974

    48,632

    33,958

    11

    1,812

    0,594

    69,000

    0,353

    41,016

    51,397

    17,603

    309,860

    85,715

    Разом

    6,124

    -12,006

    225,900

    25,234

    -24,497

    225,900

    0,000

    1187,624

    410,517

    Середня

    0,557

    -1,091

    20,536

    -

    -

    -

    -

    2,9

    10,5

    Сигма

    0,535

    1,050

    21,852

    Дисперсія, D

    0,286

    1,103

    477,502

    Розрахунок визначників другого порядку дає наступні результати:

    ; ; .

    Звідси отримуємо параметри рівняння:


    Отримане рівняння має вигляд:

    Оціночні показники дозволяють зробити висновок, що лінійно-логарифмічна функція описує досліджувану зв'язок гірше, ніж лінійна модель: оцінка тісноти виявленої зв'язку ρ = 0,8798 (порівняйте з 0,7741), скоригована середня помилка апроксимації тут вище і становить 37,32%, тобто можливості використання для прогнозу даної моделі більш обмежені.
    Заключним етапом вирішення даного завдання є виконання прогнозу і його оцінка.
    Якщо прогнозне значення фактора складе 1,023 від середнього рівня, тобто

    X прогнозні. = 1,023 * 0,557 = 0,569, тоді прогнозне значення результату сформується на рівні: Y прогнозні. = 39,565-1,491 * 0,569 = 38,715 (млрд. Руб.).
    Розрахуємо інтегральну помилку прогнозу - , Яка формується як сума двох помилок: з помилки прогнозу як результату відхилення прогнозу від рівняння регрессіі- і помилки прогнозу положення регресії . Тобто,

    Помилка положення регресії складе: 0,012 (млрд. Руб.).
    Інтегральна помилка прогнозу складе: 5,976 (млрд. Руб.).
    Гранична помилка прогнозу, яка не буде перевищена в 95% можливих реалізацій прогнозу, становитиме: = 2,26 * 5,976 = 13,506 ≈ 14,0 (млрд. Руб.). Табличне значення t-критерію для рівня значущості α = 0,05 і для ступенів свободи nk-1 = 11-1-1 = 7 складе 2,26. Отже, помилка більшості реалізацій прогнозу не перевищить млрд. Руб.
    Це означає, що фактична реалізація прогнозу буде перебувати в довірчому інтервалі.

    Верхня межа довірчого інтервалу складе
    = 38,715 + 14,0 = 52,715 (млрд. Руб.).
    Нижня межа довірчого інтервалу складе:

    = 38,715 - 14,0 = 24,715 (млрд. Руб.).
    Відносна величина відмінностей значень верхньої та нижньої кордонів складе: = рази. Це означає, що верхня межа в 2,13 рази більше нижньої межі, тобто точність виконаного прогнозу досить невелика, але його надійність на рівні 95% оцінюється як висока. Причиною невеликої точності прогнозу є підвищена помилка апроксимації. Тут її значення виходить за кордон 5-7% через недостатньо високої типовості лінійної регресії, яка проявляється в присутності одиниць з високою індивідуальною помилкою. Якщо видалити території з гранично високою помилкою (наприклад, Дагестан з ), Тоді якість лінійної моделі і точність прогнозу по ній помітно підвищаться.

    Задача№2.

    Проводиться аналіз значень соціально-економічних показників по територіях Північно-Західного федерального округу РФ за 2000 рік ..

    Y - оборот роздрібної торгівлі, млрд. Руб .;

    X 1 - кредити, надані у 2000 році підприємствам, організаціям, банкам і фізичним особам, млрд. Руб .;

    X 2 - частка осіб у вищою і незакінченою вищою освітою серед зайнятих,%;

    X 3 - річний дохід всього населення, млрд. Руб.

    Потрібно вивчити вплив зазначених чинників на вартість валового регіонального продукту.

    Попередній аналіз вихідних даних по 10 територіям виявив наявність двох територій (м.Санкт-Петербург і Вологодська обл.) З аномальними значеннями ознак. Ці території повинні бути виключені з подальшого аналізу. Значення наведених показників розраховані без урахування зазначених двох аномальних одиниць.

    При обробці вихідних даних отримані наступні значення:

    А) - лінійних коефіцієнтів парної кореляції, середніх і середніх квадратичних відхилень -σ:

    N = 8.

    Y

    X 1

    X 2

    X 3

    Y

    1

    0,2461

    0,0117

    0,9313

    X 1

    0,2461

    1

    0,8779

    0,0123

    X 2

    0,8779

    0,8897

    1

    -0,2041

    X 3

    0,9313

    0,0123

    -0,2041

    1

    Середня

    13,64

    0,2134

    22,29

    24,69

    4,250

    0,1596

    2,520

    9,628

    рівня ( ).

    Б) - коефіцієнтів часткової кореляції

    Y

    X 1

    X 2

    X 3

    Y

    1

    0,3734

    -0,0388

    0,9473

    X 1

    0,3734

    1

    0,8483

    -0,2322

    X 2

    -0,0388

    0,8483

    1

    -0,1070

    X 3

    0,9473

    -0,2322

    -0,1070

    1

    завдання:

    1. За значеннями лінійних коефіцієнтів парної і приватної кореляції виберіть неколінеарна фактори і розрахуйте для них коефіцієнти приватної кореляції. Проведіть остаточний відбір інформативних факторів у множинну регресійну модель.

    2. Виконайте розрахунок бета коефіцієнтів (b) і побудуйте з їх допомогою рівняння множинної регресії в стандартизованому масштабі. Проаналізуйте за допомогою бета коефіцієнтів (b) силу зв'язку кожного фактора з результатом і виявите сильно і слабо впливають фактори.

    3. За значеннями b-коефіцієнти розрахуйте параметри рівняння в природній формі (a 1, a 2 і a 0). Проаналізуйте їх значення. Порівняльну оцінку сили зв'язку факторів дайте за допомогою загальних (середніх) коефіцієнтів еластичності - .

    4. Оцініть тісноту множинної зв'язку за допомогою R і R 2, а статистичну значущість рівняння і тісноту виявленої зв'язку - через F-критерій Фішера (для рівня значущості a = 0,05).

    5. Розрахуйте прогнозне значення результату, припускаючи, що прогнозні значення факторів складуть 108,5 відсотка від їх середнього рівня.

    6. Основні висновки оформите аналітичною запискою.

    Рішення:

    1. Представлені в умові завдання значення лінійних коефіцієнтів парної кореляції дозволяють встановити, що оборот роздрібної торгівлі Y більш тісно пов'язаний з річним доходом всього населення X 3 ( ) І з - часткою осіб з вищою і незакінченою освітою серед зайнятих X 2 ( ); найменш тісно результат Y пов'язаний з - кредитами, наданими у 2000 році підприємствам, організаціям, банкам і фізичним особам X 1. Тому, в силу невеликої інформативності фактора, припускаємо, що його можна виключити з подальшого аналізу. Перевіримо наші припущення за допомогою аналізу матриці коефіцієнтів часткової кореляції. Очевидно, що найбільш тісний зв'язок результату Y з річним доходом всього населення ( ) І часткою населення з вищою і незакінченою вищою освітою серед зайнятих,% ( ) І найменш тісно результат Y пов'язаний з - кредитами, наданими у 2000 році підприємствам, організаціям, банкам і фізичним особам.

    ( ). Тому для уточнення остаточного виведення виконаємо розрахунок серії коефіцієнтів часткової кореляції Y з двома можливими комбінаціями факторних ознак: для Y з X 1 і з X 3, а також для Y c X 2 і X 3.

    Розрахунки приватних коефіцієнтів кореляції виконаємо за такими формулами:

    Як бачимо, чинники X і X ₃, дійсно, тісно пов'язані з результатом, і між собою сильно взаємодіють.
    Розрахунок аналогічних показників по наступній парі чинників призводить до інших результатів:

    В даному випадку, межфакторное взаємодія оцінюється як помітне ( ), А фактор слабо пов'язаний з результатом. Таким чином, перша з розглянутих пар факторних ознак (X1 і X3) в більшій мірі відповідає вимогам, що пред'являються МНК до вихідних даних і, зокрема, до відсутності межфакторного взаємодії. Зазначені обставини дозволяють використовувати X1 і X3 в якості інформативних факторів рівняння множинної регресії.
    2. При побудові двухфакторной регресійній моделі скористаємося для спрощення розрахунків методом стандартизованих змінних. В цьому випадку, вихідне рівняння набуває вигляду: . Виконаємо розрахунок - коефіцієнтів, використовуючи значення відомих за умовою лінійних коефіцієнтів парної кореляції.

    В результаті отримано рівняння в стандартизованном масштабі:

    Параметри даного рівняння є відносні оцінки сили впливу кожного з факторів на результат. При збільшенні першого фактора на одну сигму - pea (від своєї середньої) оборот роздрібної торгівлі збільшується на 0,235 своєї сигми ( ); зі збільшенням другого чинника на результат збільшується на 0,928 . Порівнюючи b-коефіцієнт, визначаємо, який з ознак впливає на результат сильніше, а який - слабше. В даному випадку, збільшення роздрібного товарообігу відбувається, перш за все, під впливом третього чинника і в меншій мірі - в результаті збільшення першого фактора.
    3. Використовуючи значення - коефіцієнтів, можна розрахувати параметрів рівняння в природній формі:

    В остаточному підсумку, маємо рівняння: . За значеннями коефіцієнтів регресії можна судити про те, на яку абсолютну величину змінюється результат при зміні кожного фактора на одиницю (від своєї середньої).
    Зі збільшенням першого фактора на 1 одиницю результат збільшується на 6,258 млрд. Руб., Зі збільшенням третього фактора на 1 одиницю збільшується на 0,409 млрд. Руб.
    Але так як ознаки-фактори вимірюються в різних одиницях, порівнювати значення їх коефіцієнтів регресії не слід. Точную оценку силы связи факторов с результатом дают коэффициенты эластичности и β - коэффициенты.
    4. Для сравнительной оценки силы связи выполним расчёт средних коэффициентов эластичности. С их помощью можно определить, на сколько процентов изменяется результат при изменении фактора на 1% (от своего среднего значения). В нашем случае, расчёт показал, что первого фактора на розничный товарооборот оказалось менее сильным по сравнению с влиянием третьего фактора : с ростом первого фактора на 1% розничный товарооборот увеличивается на 0,098%, а при увеличении третьего фактора на 1% розничный товарооборот уменьшается на 0,74%. Различия в силе влияния весьма значительны: первый фактор влияет на результат в семь с лишним раз слабее, чем третий. Поэтому регулирование величины розничного товарооборота через третий фактор будет более результативным, чем через первый.

    6. Тесноту выявленной зависимости розничного товарооборота от инвестиций в экономику региона и от численности населения оценивают множественный коэффициент корреляции и детерминации. Расчёт коэффициента корреляции выполним, используя известные значения линейных коэффициентов парной корреляции и β – коэффициентов: В нашем случае 2-х факторной зависимости расчёт строится следующим образом:

    Как показали расчёты , установлена весьма тесная зависимость розничного товарооборота от первого и третьего фактора. Это означает, что 92,2% вариации розничного товарооборота определены вариацией данных факторов. Оставшиеся 7,8% вариации результата сформировались под влиянием прочих причин, роль которых незначительна.
    7.
    Оценка статистической значимости или надёжности установленной формы зависимости, её параметров, оценок её силы и тесноты является важным этапом анализа результатов. Для выполнения оценки формулируется нулевая гипотеза, которая рассматривает предположение о случайной природе полученных результатов. То есть Для проверки выдвинутой нулевой гипотезы используется F-критерия Фишера. Его фактическое значение определяется, исходя из соотношения факторной и остаточной дисперсий и их степеней свободы: df1=k и df2=nk-1; где: n –число изучаемых единиц; k – число ограничений, которые накладываются на исходные данные при расчёте данного показателя. Здесь k равно числу факторов уравнения, то есть k=2.

    В нашем случае, когда рассматривается зависимость результата от двух факторов, расчёт выглядит следующим образом:

    Фактическое значение критерия показывает , что детерминация, сформированная под воздействием двух изучаемых факторов, почти в 30 раз больше, чем детерминация, связанная с действием прочих причин. Очевидно, что подобное соотношение случайно сформироваться не может, а является результатом влияния существенных, систематических факторов.
    Для принятия обоснованного решения F фактич. сравнивается с F табл., которое формируется случайно и зависит степеней свободы факторной (df1 = k) и остаточной (df2 = nk-1) дисперсий, а также от уровня значимости α=0,05. В нашем примере, где df1=k= 2 и df2=nk-1 = 8-2-1=5 при α=0,05 Fтабл = 5,79. В силу того, что F фактич. =29,551> F табл . = 5,79, можно с высокой степенью надёжности отклонить нулевую гипотезу, а в качестве альтернативы – согласиться с утверждением, что проверяемые параметры множественной регрессионной модели неслучайны, что коэффициенты уравнения и показатели тесноты связи не являются случайными величинами.

    8. Техническая часть прогнозных расчётов по уравнению множественной регрессии сравнительно проста. Достаточно определить прогнозные значения каждого факторного признака , подставить их в уравнение и выполнить с ними расчёт прогнозного значения результата - . При этом следует помнить, что требования к точности и надёжности прогноза предъявляют к используемой модели повышенные требования. В нашем случае, прогнозное значение каждого из факторов, то есть і , получено на основе средней величины:

    После подстановки в уравнение получаем следующий результат:

    (млрд. руб.)

    Если кредиты, предоставленные в 2000 году предприятиям, организациям, банкам и физическим лицам возрастут до 0,232 млрд. руб., а годовой доход всего населения составит 26,789 млрд. руб., тогда следует ожидать, что розничный товарооборот возрастёт до 14,615 млрд. руб., то есть увеличится на 7,2% от своего среднего уровня.

    Задача №3.

    Для проверки рабочих гипотез (№1 и №2) о связи социально-экономических показателей в регионе используется статистическая информация за 2000 год по территориям Центрального федерального округа.

    Y 1 – среднегодовая стоимость основных фондов в экономике, млрд. руб.;

    Y 2 – стоимость валового регионального продукта, млрд. руб.;

    X 1 – инвестиции прошлого, 1999, года в основной капитал, млрд. руб.;

    X 2 – кредиты прошлого, 1999, года, предоставленные предприятиям, организациям, банкам и физическим лицам, млрд. руб.

    X 3 – среднегодовая численность занятых в экономике, млн. чел.

    Рабочие гипотезы:

    Предварительный анализ исходных данных по 18 территориям выявил наличие трёх территорий (г. Москва, Московская обл., Воронежская обл.) с аномальными значениями признаков. Эти единицы должны быть исключены из дальнейшего анализа. Значения приводимых показателей рассчитаны без учёта указанных аномальных единиц.

    При обработке исходных данных получены следующие значения линейных коэффициентов парной корреляции, средних и средних квадратических отклонений -σ:

    N =15.

    Для проверки рабочей гипотезы №1. Для проверки рабочей гипотезы №2.

    Y 1

    X 1

    X 2

    Y 2

    X 3

    Y 1

    1

    0,6631

    0,7477

    Y 2

    1

    0,7863

    0,7337

    X 1

    0,6631

    1

    0,4747

    0,7863

    1

    0,6177

    X 2

    0,7477

    0,4747

    1

    X 3

    0,7337

    0,6177

    1

    Середня

    115,83

    0,1615

    3,75

    Середня

    23,77

    115,83

    0,570

    30,0303

    0,1400

    1,6836

    7,2743

    30,0303

    0,1160

    Задание:

    1. Составьте систему уравнений в соответствии с выдвинутыми рабочими гипотезами.

    2. Определите вид уравнений и системы.

    3. На основе приведённых в условии значений матриц коэффициентов парной корреляции, средних и средних квадратических отклонений:

    - определите бета коэффициенты ( b) и постройте уравнения множественной регрессии в стандартизованном масштабе;

    - дайте сравнительную оценку силы влияния факторов на результат;

    - рассчитайте параметры a 1 , a 2 и a 0 уравнений множественной регрессии в естественной форме;

    - с помощью коэффициентов парной корреляции и b коэффициентов рассчитайте для каждого уравнения линейный коэффициент множественной корреляции ( R) и детерминации ( R 2);

    - оцените с помощью F -критерия Фишера статистическую надёжность выявленных связей.

    4. Выводы оформите краткой аналитической запиской.

    Рішення:

    1. В соответствии с выдвинутыми рабочими гипотезами о связи признаков составим систему уравнений. Коэффициенты при эндогенных переменных обозначим через b , коэффициенты при экзогенных переменных - через a. Каждый коэффициент имеет двойную индексацию: первый индекс – номер уравнения, второй – индивидуальный номер признака. тоді:

    2. Особенность данной системы в том, что в первом уравнении факторы представлены перечнем традиционных экзогенных переменных, значения которых формируются вне данной системы уравнений. Во втором уравнении в состав факторов входит эндогенная переменная Y1, значения которой формируются в условиях данной системы, а именно, в предыдущем уравнении. Системы уравнений, в которых переменные первоначально формируются как результаты, а в дальнейшем выступают в качестве факторов, называются рекурсивными. Именно с подобной системой уравнений имеем дело в данной задаче.

    3. Выполним расчёт b -коэффициентов и построим уравнения множественной регрсии в стандартизованном масштабе. Для уравнения №1:

    По полученным результатам построено уравнение в стандартизованном виде:

    По данным первого уравнения сделаем вывод, что фактор ( ) влияет на результат - среднегодовую ( ) стоимость основных фондов в экономике слабее, чем второй фактор ( ) , т.к. .
    Второе уравнение можно построить на основе следующих результатов:

    Второе уравнение в стандартизованной форме имеет вид: .

    Из второго уравнения очевидно, что на Y2 – стоимость валового регионального продукта среднегодовая стоимость основных фондов в экономике оказывает более сильное влияние, чем третий фактор.
    4. Расчёт параметров уравнения регрессии в естественной форме даёт следующие результаты:

    =115,83 – 85,329*0,1615 – 9,969*3,75 = 64,665

    По полученным результатам построено уравнение №1 в естественной форме:

    Параметры уравнения №2 рассчитываются аналогичным образом. Но главная отличительная особенность их расчёта в том, что в качестве одного из факторов выступают не фактические значения , а его теоретические значения , полученные расчётным путём при подстановке в уравнение №1 фактических значений факторов и .
    Указанным способом рассчитаны параметры рекурсивного уравнения:

    По полученным результатам построено уравнение №2 в естественной форме:

    Представим результаты построения уравнений в виде рекурсивной системы:

    Значения коэффициентов регрессии каждого из уравнений могут быть использованы для анализа силы влияния каждого из факторов на результат. Но для сравнительной оценки силы влияния факторов необходимо использовать либо значения - коэффициентов, либо средних коэффициентов эластичности - ; ; і

    5. Для каждого из уравнений системы рассчитаем показатели корреляции и детерминации.

    В первом уравнении факторы и объясняют 82,56% вариации среднегодовой стоимости основных фондов в экономике, а 17,44% его вариации определяется влиянием прочих факторов.
    Во втором уравнении переменные
    и объясняют 84,72% стоимости валового регионального продукта, а 15,28% изменений зависят от прочих факторов . Обе регрессионные модели выявляют тесную связь результата с переменными факторного комплекса.

    6. Оценим существенность выявленных зависимостей. Для этого сформулируем нулевые гипотезы о статистической незначимости построенных моделей и выявленных ими зависимостей:

    і

    Для проверки нулевых гипотез используется F-критерий Фишера. Выполняется расчёт его фактических значений, которые сравниваются с табличными значениями критерия. По результата сравнения принимается решение относительно нулевой гипотезы. В нашей задаче:

    Табличные значения F-критерия формируются под влиянием случайных причин и зависят от трёх условий: а) от числа степеней свободы факторной дисперсии - , где k – число факторных переменных в модели; б) от числа степеней свободы остаточной дисперсии - , где n – число изучаемых объектов; в) от уровня значимости , который определяет вероятность допустить ошибку, принимая решение по нулевой гипотезе. Как правило, значение берут на уровне 5% ( =0,05), но при высоких требованиях к точности принимаемых решений уровень значимости составляет 1% ( =0,01) или 0,1% (( =0,001).
    В рассматриваемой задаче для и для і =0,05 составляет 3,88. В силу того, что нулевую гипотезу о статистической незначимости характеристик уравнения №1 следует отклонить, то есть . Аналогичное решение принимается и относительно второй нулевой гипотезы, т.к. . То есть, .Отклоняя нулевую гипотезу, допустимо (с определённой степенью условности) принять одну из альтернативных гипотез. В частности, может быть рассмотрена и принята гипотеза о том, что параметры моделей неслучайны, то есть формируются под воздействием представленных в моделях факторов, влияние которых на результат носит систематический, устойчивый характер. Это означает, что полученные результаты могут быть использованы в аналитической работе и в прогнозных расчётах, которые основаны не только на влиянии , но и на влиянии эндогенной переменной Рекурсивные модели связей предоставляют возможность подобного анализа и прогноза.

    Задача №4.

    Предлагается изучить взаимосвязи социально-экономических показателей региона за период.

    Y 1 - удельный вес занятых в экономике среди всего населения региона, %

    Y 2 - среднемесячная заработная плата 1-го занятого в народном хозяйстве региона, тыс. руб.

    Y 3 - среднемесячный душевой доход населения региона, тыс. руб.

    X 1 – средний возраст населения региона, лет

    X 2 - доля безработных среди экономически активного населения, %

    X 3 - стоимость продукции и услуг в среднем на 1-го занятого в народном хозяйстве регина, тыс. руб.

    X 4 - инвестиции текущего года в народное хозяйство региона, млрд. руб.

    X 5 - среднемесячный размер назначенной пенсии, тыс. руб.

    Приводится система рабочих гипотез, справедливость которые необходимо проверить:

    Задание:

    1. На основе рабочих гипотез постройте систему структурных уравнений и проведите их идентификацию;

    2. Укажите, при каких условиях может быть найдено решение каждого из уравнений и системы в целом. Дайте обоснование возможных вариантов подобных решений и аргументируйте выбор оптимального варианта рабочих гипотез;

    3. Опишите методы, с помощью которых будет найдено решение уравнений (косвенный МНК, двухшаговый МНК).

    Рішення:

    1. В соответствии с предложенными рабочими гипотезами построим график, отображающий связи каждой из представленных переменных с другими переменными. Отличительной особенностью уравнений системы является наличие прямых и обратных зависимостей между переменными Y1, Y2 и Y3. Указанная особенность характерна для так называемых структурных уравнений . В состав структурных уравнений входят: а) эндогенные переменные (Yj) , значения которых формируется в условиях данной системы признаков и их взаимозависимостей и б) экзогенные переменные (xm ), значения которых формируются вне данной системы признаков и условий, но сами экзогенные переменные участвуют во взаимосвязях данной системы и оказывают влияние на эндогенные переменные. Коэффициенты при эндогенных переменных обозначаются через , коэффициенты при экзогенных переменных обозначаются через , где i -число изучаемых объектов; m –число экзогенных переменных, которые обычно обозначают через x; j - число эндогенных переменных, обычно обозначаемых через Y. Таким образом, в каждом уравнении системы каждый коэффициент при переменной имеет двойную индексацию : 1) - номер эндогенной переменной, расположенной в левой части уравнения и выступающей в качестве результата; 2) – номер переменной, находящейся в правой части уравнения и выступающей в качестве фактора.

    В нашей задаче система уравнений для описания выдвигаемых рабочих гипотез будет иметь следующий вид:

    2.Выполним идентификацию каждого структурного уравнения и всей системы для ответа на вопрос – имеют ли решения каждое из уравнений и система в целом. Воспользуемся счётным правилом , по которому в каждом уравнении системы необходимо сравнить HY - число эндогенных переменных в данном уравнении и Dx - число отсутствующих в уравнении экзогенных переменных из общего для всей системы их перечня. Для удобства анализа представим результаты в таблице.

    Результаты идентификации структурных уравнений и всей системы.

    Номер уравнения

    Число эндогенных переменных в уравнении, H

    Число экзогенных переменных из общего их списка, отсутствующих в уравнении, D

    Сравнение параметров H и D +1

    Решение об идентификации уравнения

    1

    3

    3

    3 < 3+1

    Сверхидентифицировано

    2

    3

    2

    3 = 2+1

    Точно идентифицировано

    3

    3

    1

    3 > 1+1

    Неидентифицировано

    Вся система уравнений в целом

    Неидентифицирована


    3. В том случае, когда хотя бы одно из уравнений не имеет решения, система в целом также не имеет решения. Если подобный результат нас не устраивает, необходимо внести коррективы в исходные рабочие гипотезы и отредактировать их таким образом, чтобы идентификация была возможна.

    4. Теоретический анализ содержания взаимосвязи, отражённой в уравнении № 3, позволяет рассмотреть варианты возможной корректировки. Во-первых, из правой части может быть исключёна одна из экзогенных переменных. Скорее всего, ею может оказаться x4, так как по своему экономическому смыслу она менее тесно связана со среднемесячным душевым доходом населения региона.
    Во-вторых, возможна корректировка путём исключения из правой части уравнения эндогенной переменной Y2.
    При корректировке рабочей гипотезы путём удаления x3 уравнение №1 становится точно идентифицированным, а вся система – сверхидентифицированной.

    5. Для поиска решений сверхидентифицированной системы уравнений применяются: а) косвенный метод наименьших квадратов (КМНК) для решения точно идентифицированных уравнений и б) двухшаговый МНК (ДМНК) для поиска решений сверхидентифицированных уравнений.

    Задача №5.

    По территориям Сибирского и Уральского федеральных округов России имеются данные о следующих показателях за 2000 год:

    Y 1 – стоимость валового регионального продукта, млрд. руб.

    Y 2 - розничный товарооборот, млрд. руб.

    X 1 основные фонды в экономике, млрд. руб.

    X 2 - инвестиции в основной капитал, млрд. руб.

    X 3 - среднедушевые денежные расходы за месяц, тыс. руб.

    Изучения связи социально-экономических показателей предполагает проверку следующих рабочих гипотез:

    Для их проверки выполнена обработка фактических данных и получена следующая система приведённых уравнений:

    Задание:

    1. Постройте систему структурных уравнений и проведите её идентификацию;

    2. Проанализируйте результаты решения приведённых уравнений;

    3. Используя результаты построения приведённых уравнений, рассчитайте параметры структурных уравнений (косвенный МНК); проанализируйте результаты;

    4. Укажите, каким образом можно применить полученные результаты для прогнозирования эндогенных переменных і

    Рішення:

    1. Построение системы структурных уравнений выполняется в соответствии с рабочими гипотезами:

    2. В соответствии со счётным правилом оба уравнения и система в целом являются точно идентифицированными и это означает, что они имеют единственное решение, которое может быть получено косвенным МНК (КМНК).

    Номер уравнения

    Число эндогенных переменных в уравнении, H

    Число экзогенных переменных из общего их списка, отсутствующих в уравнении, D

    Сравнение параметров H и D +1

    Решение об
    идентификации
    уравнения

    1

    2

    1

    2 = 1+1

    точно идентифицировано

    2

    2

    1

    2 = 1+1

    точно идентифицировано

    Система уравнений в целом

    точно идентифицирована

    3. Процедура КМНК состоит в том, чтобы путём преобразования результатов решения приведённых уравнений получить искомые структурные уравнения. Используемый приём подстановок обеспечивает получение точных результатов только в том случае, если выполняемые преобразования точны и безошибочны. Чтобы получить первое структурное уравнение из первого, приведённого необходимо отсутствующий в структурном уравнении признак выразить через Y2, используя результаты второго приведённого уравнения. Тобто:

    После подстановки значения в первое приведённое уравнение и преобразования подобных членов, получаем следующий результат:

    Как видим, полученный результат соответствует исходной рабочей гипотезе. Анализ показывает, что стоимость ВРП находится в прямой зависимости от розничного товарооборота, от размера инвестиций в экономику и от уровня среднедушевых расходов населения за месяц. Указанные переменные объясняют 94,4% вариации результата, а характеристики установленной зависимости являются статистически значимыми и надёжными, так как
    для .
    Следовательно, есть основания для отклонения нулевой гипотезы о случайной природе выявленной зависимости.
    Аналогично выполняем преобразования для определения параметров второго структурного уравнения. Выразим отсутствующий в уравнении через Y1, используя результаты построения первого приведённого уравнения. Тобто:

    После подстановки значения во второе приведённое уравнение и преобразования подобных членов, получаем следующий результат:

    Уравнение описывает линейную зависимость розничного товарооборота от стоимости ВРП, основных фондов в экономике, от уровня среднедушевых расходов населения за месяц. Данный перечень переменных объясняет 96,3% вариации оборота розничной торговли, а соотношение позволяет отклонить нулевую гипотезу о случайной природе выявленной зависимости.

    4. Для выполнения прогнозных расчётов і наиболее простым является вариант, по которому прогнозные значения экзогенных переменных ( ) подставляются в приведённые уравнения. Точность и надёжность прогнозов в этом случае зависит от качества приведённых моделей и от того, как сильно отличаются прогнозные значения экзогенных переменных от их средних значений.

    Задача №6.

    Имеются сведения о среднем размере земельного участка крестьянского (фермерского) хозяйства – N t, га, за период с 1993 по 2001 год (на конец года) в Российской Федерации.

    роки

    N t

    роки

    N t

    +1993

    42

    1998

    54

    1994

    44

    1999

    62

    1995

    47

    2000

    67

    1996

    48

    2001

    75

    1 997

    50

    Задание:

    1. Постройте график фактических уровней динамического ряда - N t

    2. Рассчитайте параметры уравнения линейного тренда

    3. Оцените полученные результаты:

    - с помощью показателей тесноты связи ( r и r 2);

    - значимость модели тренда ( F -критерий);

    - качество модели через корректированную среднюю ошибку аппроксимации , а также через коэффициент автокорреляции отклонений от тренда -

    4. Выполните прогноз до 2003 года, рассчитайте ошибки прогноза, доверительный интервал прогноза и оцените его точность.

    5. Проанализируйте полученные результаты.

    Рішення:

    1. Общее представление о форме основной тенденции в уровнях ряда даёт график их фактических значений. Для его построения введём дополнительные обозначения для комплекса систематически действующих факторов, который по традиции обозначим через t и условно отождествим с течением времени.

    2. Параметры рассчитаем с помощью определителей второго порядка, используя формулы, Расчёт определителя системы выполним по формуле:

    Расчёт определителя свободного члена уравнения выполним по формуле:

    Расчёт определителя коэффициента регрессии выполним по формуле:
    Расчёт параметров уравнения регрессии даёт следующие результаты:
    ; . В конечном счёте, уравнение линейного тренда имеет вид:


    3. Для оценки тесноты связи рассчитаем линейный коэффициент парной корреляции: ; Уравнение линейного тренда детерминирует 91,96% вариации численности занятых.

    Таблица№ 1.

    роки

    N t

    t

    t 2

    N t *t

    N t расч .

    DN t

    (dN t) 2

    А

    1

    2

    3

    4

    5

    6

    7

    8

    +1993

    42

    1

    1

    42

    38,533

    3,467

    12,018

    6,380

    1994

    44

    2

    4

    88

    42,483

    1,517

    2,300

    2,791

    1995

    47

    3

    9

    141

    46,433

    0,567

    0,321

    1,043

    1996

    48

    4

    16

    192

    50,383

    -2,383

    5,680

    4,387

    1 997

    50

    5

    25

    250

    54,333

    -4,333

    ,778

    7,975

    1998

    54

    6

    36

    324

    58,283

    -4,283

    18,347

    7,883

    1999

    62

    7

    49

    434

    62,233

    -0,233

    0,054

    0,429

    2000

    67

    8

    64

    536

    66,183

    0,817

    0,667

    1,503

    2001

    75

    9

    81

    675

    70,133

    4,867

    23,684

    8,957

    Разом

    489

    45

    285

    2682

    489,000

    0,000

    81,850

    41,350

    Средняя

    54,333

    5

    -

    -

    -

    -

    -

    4,594

    Сигма

    10,635

    2,582

    -

    -

    -

    -

    -

    -

    Дисперсия, D

    113,111

    6,667

    -

    -

    -

    -

    -

    -

    Средняя ошибка аппроксимации очень невелика ( = 4,594%), что указывает на высокое качество модели тренда и возможность её использования для решения прогнозных задач.
    Фактическое значение F-критерия и сравнение с 5,59 его табличного значения позволяет сделать вывод о высокой степени надёжности уравнения тренда.
    Для дополнительной проверки качества тренда выполним расчёт коэффициента корреляции отклонений фактических уровней от рассчитанных по уравнению тренда. Если будет установлено отсутствие связи отклонений, это укажет на их случайную природу, то есть на то, что тренд выбран, верно, что он полностью исключил основную тенденцию из фактических уровней ряда и что он сформировал случайный значения отклонений.

    Выполним расчёт в таблице. Поместим во второй графе фактические отклонения от тренда , для удобства расчёта обозначим их через Y. В соседней графе поместим эти же отклонения, но, сместив их относительно первой строки, на один год вниз; обозначим их через и рассмотрим в качестве фактора X. Линейный коэффициент корреляции отклонений рассчитаем по формуле:

    Используем значения определителей второго порядка для расчёта коэффициента регрессии с1, который отражает силу связи отклонений і . Получены следующие значения определителей:

    Звідси . При этом, коэффициент корреляции отклонений составит:

    В данном случае выявлена заметная связь, существенность которой подтверждает сравнение фактического и табличного значений F - критерия: . Следовательно, нулевая гипотеза о случайной природе отклонений может быть принята, отклонения не связаны между собой и являются случайными величинами.

    Таблица №2

    (Y)

    (X)

    3,47

    -

    -

    -

    1

    1,52

    3,47

    5,26

    12,02

    2

    0,57

    1,52

    0,86

    2,30

    3

    -2,38

    0,57

    -1,35

    0,32

    4

    -4,33

    -2,38

    10,33

    5,68

    5

    -4,28

    -4,33

    18,56

    18,77

    6

    -0,23

    -4,28

    1,00

    18,34

    7

    0,82

    0,23

    -0,19

    0,05

    8

    4,87

    0,82

    3,98

    0,67

    Разом

    -3,46

    -4,86

    38,44

    58,16

    Средняя

    -0,49

    -0,69

    -

    -

    Сигма

    3,13

    2,81

    -

    -

    4. При выполнении прогнозов на 2002 и 2003 годы подставим в уравнение прогнозные значения фактора, 10, 11, что позволяет получить прогнозные значения о среднем размере земельного участка крестьянского (фермерского) хозяйства: 24,38га, 23,36га.

    Рассчитаем ошибки прогноза, доверительный интервал прогноза и оценим его точность.

    Рассчитаем интегральную ошибку прогноза - , которая формируется как сумма двух ошибок: из ошибки прогноза как результата отклонения прогноза от уравнения регрессии - и ошибки прогноза положения регрессии - .

    Ошибка положения регрессии составит: = 0,267(га).
    Интегральная ошибка прогноза составит: =3,428 (га).
    Предельная ошибка прогноза, которая не будет превышена в 95% возможных реализаций прогноза, составит: = 2,37*3,428 = 8,124 ≈ 8,0 (га). Табличное значение t-критерия для уровня значимости α=0,05 и для степеней свободы nk-1 = 9-1-1=7 составит 2,37. Следовательно, ошибка большинства реализаций прогноза не превысит га.
    Это означает, что фактическая реализация прогноза будет находиться в доверительном интервале .

    Верхняя граница доверительного интервала составит:
    = 78,033 + 8,0 = 86,033(га).
    Нижняя граница доверительного интервала составит:

    = 78,033 - 8,0 = 70,033(га). Относительная величина различий значений верхней и нижней границ составит: =1,23 раза. Это означает, что верхняя граница в 1,23 раза больше нижней границы, то есть точность выполненного прогноза достаточно велика и его надёжность на уровне 95% оценивается как высокая.

    Задача №7.

    Данные о стоимости экспорта ( ) и импорта ( ) Испании, млрд. $, приводятся за период с 1991 по 2000 г.

    В уровнях рядов выявлены линейные тренды:

    для экспорта - , а для импорта –

    По указанным трендам произведено выравнивание каждого ряда, то есть рассчитаны теоретические значения их уровней: і

    роки

    Экспорт ( )

    Импорт ( )

    E факт.

    =

    G факт. .

    тисячу дев'ятсот дев'яносто один

    60,2

    57,5

    93,3

    82,3

    одна тисяча дев'ятсот дев'яносто дві

    64,3

    64,4

    99,8

    89,6

    +1993

    59,6

    71,4

    78,6

    97,0

    1994

    73,3

    78,3

    92,5

    104,3

    1995

    91,7

    85,3

    115,0

    111,7

    1996

    102,0

    92,3

    121,8

    119,0

    1 997

    104,1

    99,2

    122,7

    126,4

    1998

    109,2

    106,2

    133,1

    133,7

    1999

    110,0

    113,1

    144,0

    141,1

    2000

    113,3

    120,1

    152,6

    148,4

    Предварительная обработка исходной информации привела к следующим результатам:

    E t

    P t

    t

    E t

    1

    0,5387

    0,6468

    P t

    0,5387

    1

    0,2454

    t

    0,6468

    0,2454

    1

    Разом

    887,7

    1153,4

    55

    Средняя

    88,8

    115,3

    5,5

    20,961

    22,847

    2,872

    Задание :

    1. Для изучения связи рядов рассчитайте отклонения фактических значений каждого ряда от теоретических ( і );

    2. Для оценки тесноты связи рассчитайте:

    - линейный коэффициент парной корреляции отклонений от линии тренда: ;

    - уровней рядов: і

    - коэффициент частной корреляции уровней: ; поясните их значения, укажите причины различий значений парных коэффициентов корреляции (пп. 1 и 2) и схожести коэффициентов парной корреляции отклонений и частной корреляции уровней (пп.1 и 3);

    3. Постройте уравнение множественной регрессии с участием временной составляющей:

    4. Проанализируйте полученные результаты.

    Решение.

    1. Изучение связи рядов выполним двумя способами, сравним их результаты и выберем из них правильный. Для оценки тесноты связи рядов через величины отклонений от оптимального тренда рассчитаем значения отклонений : і (Див. Табл. 1)

    роки

    E факт.

    =

    G факт.

    тисячу дев'ятсот дев'яносто один

    60,2

    57,5

    93,3

    82,3

    2,7

    11,0

    29,7

    7,3

    121,0

    одна тисяча дев'ятсот дев'яносто дві

    64,3

    64,4

    99,8

    89,6

    0,7

    10,2

    7,14

    0,5

    104,0

    +1993

    59,6

    71,4

    78,6

    97,0

    -11,8

    -18,4

    217,1

    139,2

    338,6

    1994

    73,3

    78,3

    92,5

    104,3

    -5,0

    -11,8

    59

    25,0

    139,0

    1995

    91,7

    85,3

    115,0

    111,7

    6,4

    3,3

    21,1

    41,0

    10,9

    1996

    102,0

    92,3

    121,8

    119,0

    9,7

    2,8

    27,2

    94,1

    7,8

    1 997

    104,1

    99,2

    122,7

    126,4

    4,9

    -3,7

    -18,1

    24,0

    327,6

    1998

    109,2

    106,2

    133,1

    133,7

    3,0

    -0,6

    -8,7

    9,0

    75,7

    1999

    110,0

    113,1

    144,0

    141,1

    -3,1

    2,9

    -9,0

    9,6

    81,0

    2000

    113,3

    120,1

    152,6

    148,4

    -6,8

    4,2

    -28,6

    46,2

    818,0

    Разом

    887,7

    -

    1153,4

    -

    0,7

    -0,1

    296,8

    395,9

    2023,6

    Средняя

    88,8

    -

    115,3

    -

    0,1

    0,0

    -

    39,6

    202,4

    Сигма

    21,0

    -

    22,8

    -

    6,3

    8,7

    -

    -

    -

    D

    439,4

    -

    522,0

    -

    39,6

    76,2

    -

    -

    -

    Выполним расчёт коэффициента корреляции отклонений от трендов через коэффициент регрессии отклонений с 1, і . Но для этого предварительно рассчитаем определители второго порядка по уравнению регрессии отклонений: .

    В силу того, что свободный член уравнения регрессии отклонений равен нулю, вид уравнения будет отличаться от традиционного: . С изменением отлонений импорта от своего тренда на единицу отклонения экспорта от своего тренда изменятся в том же направлении на -0,02 часть своей единицы. В дальнейшем коэффициент с 1 используется для расчёта показателей тесноты связи двух рядов отклонений:

    Выявлена тесная связь отклонений от трендов, которая означает, что на 58% вариация размеров отклонений по импорту детерминирует изменения по экспорту, а на 42% вариация размеров отклонений происходит под влиянием прочих факторов.

    Второй вариант оценки связи двух рядов основан на традиционной оценке корреляции их уровней:

    Данный подход к решению задачи предполагает традиционный расчёт определителей уравнения регрессии уровней, нахождение коэффициента регрессии а 1 и далее с помощью і расчёт коэффициента корреляции. Информация для расчёта представлена в табл. 2.

    Расчёт определителей дал следующие результаты:

    Значения параметров регрессии: ; , а уравнение имеет вид:

    .

    Коэффициенты тесноты связи уровней составят: ; . Это значит, что в уровнях существует весьма тесная связь, при которой вариации импорта предопределяет 28,8% вариации экспорта.

    роки

    тисячу дев'ятсот дев'яносто один

    60,2

    93,3

    3624,04

    8704,89

    5616,66

    одна тисяча дев'ятсот дев'яносто дві

    64,3

    99,8

    4134,49

    9960,04

    6417,14

    +1993

    59,6

    78,6

    3552,16

    6177,96

    4684,56

    1994

    73,3

    92,5

    5372,89

    8556,25

    6780,25

    1995

    91,7

    115,0

    8408,89

    13225,00

    10545,50

    1996

    102,0

    121,8

    10404,00

    14835,24

    12423,60

    1 997

    104,1

    122,7

    10836,81

    15055,29

    12773,07

    1998

    109,2

    133,1

    11924,64

    17715,61

    14534,52

    1999

    110,0

    144,0

    12100,00

    20736,00

    15840,00

    2000

    113,3

    152,6

    12836,89

    13286,76

    17289,58

    Разом

    887,7

    1153,4

    83194,81

    128253,04

    106904,88

    Середня

    88,8

    115,3

    Сигма

    21,0

    22,8

    D

    439,4

    522,0

    2. Однако, делать подобный вывод было бы глубоко ошибочно потому, что в уровнях и одного, и другого рядов выявлены устойчивые, статистически значимые линейные тренды. В подобных условиях выявленное взаимодействие уровней не является причинной зависимостью, а представляет собой ложную связь, вызванную наличием трендов схожей линейной формы. В силу того, что оба тренда сформированы под влиянием разного комплекса факторов, схожесть их формы могут создавать иллюзию связи рядов. Подобные соображения позволяют отказаться от результатов изучения связи уровней, содержащих тренд. В подобной ситуации пристального внимания заслуживает связь случайных отклонений от трендов. Именно этот подход позволяет выявить и количественно оценить истинную связь рядов.

    В действительности связь рядов существует, оценивается она как тесная; то есть, в ней экспорт на 58% детерминирован вариацией импорта. Фактический F -критерий равен 0,050. Это больше табличного ( F табл .= 5,32), что доказывает надёжность и значимость истинной связи рядов.

    3. Для формализованного представления подобных зависимостей и использования моделей связи динамических рядов в прогнозных расчётах предлагается построить множественную регрессионную модель связи рядов, включая в неё в качестве обязательной составляющей фактор времени t. Речь идёт о построении модели следующего вида: . В данной задаче в уровнях обоих рядов присутствует линейный тренд. Поэтому включение в модель фактора времени позволит через коэффициент а 2 отразить наличие линейного тренда в уровнях обоих рядов. Если в уровнях рядов представлены тренды иной, более сложной формы, тогда уравнение множественной регрессии должно через фактор времени отразить эту более сложную форму трендов.

    Истинную силу и направление связи рядов отразит коэффициент регрессии а 1, а тесноту их связи оценит частный коэффициент корреляции: .

    Используем для расчёта параметров множественной регрессии матрицу парных коэффициентов корреляции, представленную в исходных данных.

    Для построения уравнения в стандартизованном масштабе: рассчитаем значения -коэффициентов:

    Получено следующее уравнение: .

    Его параметры позволяют сделать вывод о том, что влияния импорта на экспорт почти в четыре раза сильнее, чем влияние систематических факторов, формирующих линейный тренд:

    По значениям -коэффициентов рассчитаем параметры множественной регрессии в естественной форме: ;

    .

    Уравнение имеет вид: . С увеличением импорта на 1 млрд. $ экспорт увеличивается на 0,895 млрд.$; под влиянием комплекса систематических факторов (которые условно обозначили через t) экспорт увеличивается в среднем за год на 2,65 млрд. $.

    Оценку тесноты связи рядов, очищенную от влияния комплекса систематических факторов, даёт частный коэффициент корреляции:

    ; .

    Как видим, получены результаты, совпадающие с оценками тесноты связи по отклонениям от лучших трендов, которыми, в данном случае, являются линейные тренды.

    Использование динамической модели в прогнозе заключается в подстановке в её правую часть прогнозных значений фактора Z и фактора t. То есть,