• Кілька основних правил розрахунку коваріації.
  • Вибіркова дисперсія.
  • Правила розрахунку дисперсії.
  • Чому ковариация не є хорошою мірою звязку


  • Дата конвертації23.03.2017
    Розмір21.72 Kb.
    Типконтрольна робота

    Скачати 21.72 Kb.

    вибіркова коваріація

    Міністерство Освіти Російської Федерації

    Алтайський державний університет

    Економічний факультет

    Заочне відділення

    Кафедра «Інформаційні системи в економіці»

    Контрольна робота по предмету:

    «Економетрика»

    виконав студент

    3 курсу 211 групи

    Неклюдов А.А.

    Барнаул 2003 р


    вибіркова коваріація

    Вибіркова коваріація є мірою взаємозв'язку між двома змінними. Дане поняття може бути продемонстровано на простому прикладі. Переглядаючи табличні дані, вміщені в додатку книги: «Введення в економетрику», Крістофера Доугерті можна побачити, що в період між 1963 і 1972 рр. споживчий попит на бензин в США стійко підвищувався. Ця тенденція припинилася в 1973 р, а потім пішли нерегулярні коливання попиту з незначним його падінням в цілому. У табл. 1.1 наведені дані про споживчий попит і реальних цінах після нафтової кризи. (Реальна ціна обчислюється шляхом ділення індексу номінальної ціни на бензин, на загальний індекс споживчих цін і множенням результату на 100, з таблиці дефляторов цін для особистих споживчих витрат (1972 = 100%)). Індекси з таблиці дефляторов засновані на даних 1972 р .; таким чином, індекс реальної ціни в таблиці 1.1 показує підвищення ціни бензину щодо загальної інфляції починаючи з 1972 р

    Таблиця 1.1

    Споживчі витрати на бензин і його реальна ціна в США
    рік

    витрати

    (Млрд. Дол., Ціни 1972 г.)

    Індекс реальних цін (1972 = 100)
    1 973 26,2 103,5
    1 974 24,8 127,0
    +1975 25,6 126,0
    1976 26,8 124,8
    1 977 27,7 124,7
    1978 28,3 121,6
    1979 27,4 179,7
    1980 25,1 188,8
    тисячу дев'ятсот вісімдесят один 25,2 193,6
    тисяча дев'ятсот вісімдесят дві 25,6 173,9

    Можна бачити деяку негативну зв'язок між споживчим попитом на бензин і його реальною ціною. Показник вибіркової ковариации дозволяє висловити даний зв'язок одиничним числом. Для його обчислення спочатку необхідно знайти середні значення ціни і попиту на бензин. Позначивши ціну через p і попит - через y, знаходимо середні значення p і y, потім для кожного обчислюємо відхилення величин p і y від середніх і перемножуємо їх. Проробимо це для всіх років вибірки і візьмемо середню величину, вона і буде вибіркової ковариацию (Таблиця 1.2).

    Таблиця 1.2

    спостереження

    Ціна

    p

    попит

    y

    _

    (Pp)

    _

    (Yy)

    _ _

    (Pp) (yy)

    1 973 103,5 26,2 -39,86 -0,07 2,79
    1 974 127,0 24,8 -16,36 -1,47 24,05
    +1975 126,0 25,6 -17,36 -0,67 11,63
    1976 124,8 26,8 -18,56 0,53 -9,84
    1 977 124,7 27,7 -18,66 1,43 -26,68
    1978 121,6 28,3 -21,76 2,03 -44,17
    1979 149,7 27,4 6,34 1,13 7,16
    1980 188,8 25,1 45,44 -1,17 -53,16
    тисячу дев'ятсот вісімдесят один 193,6 25,2 50,24 -1,07 -53,76
    тисяча дев'ятсот вісімдесят дві 173,9 25,6 30,54 -0,67 -20,46
    сума: 1433,6 262,7 -162,44
    середнє: 143,36 26,27 -16,24

    Отже, при наявності n спостережень двох змінних (x і y) вибіркова коваріація задається формулою:

    Cov (x, y) = 1 / n * S (x i -x) (y i -y) = 1 / n {(x i -x) (y i -y) + ... + (x n -x) (y n -y)}

    Слід зазначити, що в даному прикладі ковариация негативна. Так це і повинно бути. Негативна зв'язок в даному прикладі виражається негативною ковариацию, а позитивний зв'язок - позитивної ковариацию.

    Так, наприклад, в спостереженні за 1979 г. (pp середн.) = 6,34, (yy середн.) = 1,13, а тому і їх твір позитивно і одно 7,16, в цьому спостереженні значення реальної ціни і попиту вище відповідних середніх значень отже, спостереження дає позитивний внесок в ковариацию.

    У спостереженні за 1978 р реальна ціна нижча за середню, а попит вищий за середній, тому (pp середн.) Негативно, (yy середн.) Позитивно, їх твір негативно, і спостереження вносить негативний внесок в ковариацию.

    У спостереженні за 1974 г., як реальна ціна, так і попит, нижче своїх середніх значень, таким чином, (pp середн.) І (yy середн.) Обидва є негативними, а їх добуток позитивно отже, спостереження вносить позитивний внесок в ковариацию .

    І, нарешті, в спостереженні за 1981 р ціна вище середньої, а попит нижче середнього. Таким чином (pp середн.) Позитивно, (yy середн.) Негативно, тому (pp середн.) (Yy середн.) Негативно, і в ковариацию, відповідно, вноситься негативний внесок.

    Кілька основних правил розрахунку коваріації.

    · Правило 1

    Якщо y = v + w, то Cov (x, y) = Cov (x, v) + Cov (x, w).

    · Правило 2

    Якщо y = az, де a - константа, то Cov (x, y) = aCov (x, z)

    · Правило 3

    Якщо y = a, де a - константа, то Cov (x, y) = 0

    Демонстрація правила 1

    Візьмемо дані по шести сім'ям (домогосподарствам), наведені в таблиці 1.3: загальний річний дохід (x); витрати на харчування та одяг (y); витрати на харчування (v) і витрати на одяг (w). Природно, y дорівнює сумі v і w. Вказану в таблиці величину z розглянемо для демонстрації правила 2.

    Таблиця 1.3

    родина

    дохід сім'ї

    (X)

    Витрати на харчування та одяг

    (Y)

    Витрати на харчування

    (V)

    Витрати на одяг

    (W)

    Друга вибірка: витрати сім'ї на харчування та одяг

    (Z)

    1 3000 1100 850 250 2200
    2 2500 850 700 150 1700
    3 4000 1200 950 250 2400
    4 6000 1600 1150 450 3200
    5 3300 1000 800 200 2000
    6 4500 1300 950 350 2600
    сума: 23300 7050 5400 1650 14100
    середнє: 3883 1175 900 275 2350

    У таблиці 1.4 величини (xx), (yy), (vv) і (ww) обчислюються для кожної сім'ї. Звідси отримуємо (xx середн.) (Yy середн.), (Xx середн.) (Vv середн.) І (xx середн.) (Ww середн.) Для кожної сім'ї. Cov (x, y) виходить як середнє з величин (xx середн.) (Yy середн.) І дорівнює 266250. Cov (x, v) дорівнює 157500 і Cov (x, w) = 108750. Отже, Cov (x, y ) є сумою Cov (x, v) і Cov (x, w).

    Таблиця 1.4

    родина

    _

    xx

    _

    yy

    _ _

    (Xx) (yy)

    _

    (Vv)

    _ _

    (Xx) (vv)

    _

    (Ww)

    _ _

    (Xx) (ww)

    1 -883 -75 66250 -50 44167 -25 22083
    2 -1383 -325 449583 -200 276667 -125 172917
    3 117 25 2917 50 5833 -25 -2917
    4 2117 425 899583 200 529167 175 370416
    5 -583 -175 102083 -100 58333 -75 43750
    6 617 125 77083 50 30833 75 46250
    сума: 1597500 945000 652500
    середнє: 266250 157500 108750

    Демонстрація правила 2

    У таблиці 1.3 остання колонка (z) дає витрати на харчування та одяг для другої множини з 6 сімей. Кожне спостереження z фактично являє собою подвійну значення y. Передбачається, що значення величини x для другого набору сімей є такими ж, як і раніше. Для обчислення Cov (x, z) необхідні значення (xx середн.), А також (zz середн.)

    Таблиця 1.5

    родина (Xx) (Zz) (Xx) (zz)
    1 -883 -150 132500
    2 -1383 -650 899167
    3 117 50 5833
    4 2117 850 1700167
    5 -583 -350 204167
    6 617 250 154167
    сума: 3195000
    середнє: 532500

    З таблиці 1.5 можна бачити, що Cov (x, z) дорівнює 532 500, що в точності так само подвоєною Cov (x, y).

    Демонстрація правила 3

    Припустимо, що кожна сім'я в вибірці має по два дорослих людини, і припустимо, що через непорозуміння ми вирішили обчислити ковариацию між загальним доходом (x) і числом дорослих в сім'ї (a). Природно, що a 1 = a 2 = ... = a 6 = 2. Таким чином, a середн. = 2. Звідси для кожної сім'ї (aa середн.) = 0 і, отже, (xx середн.) (Aa середн.) = 0. Тому Cov (x, a) = 0.

    теоретична ковариация

    Якщо x і y - випадкові величини, теоретична коваріація s xy визначається як математичне сподівання добутку відхилень величин від їх середніх значень:

    pop.cov (x, y) = xy = E {(x) (y- y)}

    Якщо теоретична коваріація невідома, то для її оцінки може бути застосована вибіркова коваріація, обчислена за низкою спостережень. На жаль така оцінка, буде мати негативний зсув.

    Якщо x і y незалежні, то їх теоретична коваріація дорівнює нулю, оскільки:

    E {(x x) (y y)} = E (x x) (y y) = 0 * 0

    Вибіркова дисперсія.

    Для вибірки з n спостережень x 1,..., x n вибіркова дисперсія визначається як середньоквадратичне відхилення в вибоке:

    Var (x) = 1 / nS (xx) 2

    Зауваження. Определеннаятакім чином вибіркова дисперсія являє собою зміщену оцінку теоретичної дисперсії s 2, яка визначається як:

    1 / (n-1) S (xx) 2, є несмещенной оцінкою s 2. Звідси випливає, що очікуване значення величини Var (x) дорівнює [(n-1) / n] s 2 і, отже, вона має негативний зсув. Відзначимо, що якщо розмір вибірки n стає великим, то (n-1) / n наближається до одиниці і, таким чином, математичне очікування величини Var (x) прагне до s 2.

    Правила розрахунку дисперсії.

    · Правило 1

    Якщо y = v + w, то Var (y) = Var (v) + Var (w) + 2Cov (v, w)

    · Правило 2

    Якщо y = az, де a є постійною, то Var (y) = a 2 Var (z)

    · Правило 3

    Якщо y = a, де a є постійною, то Var (y) = 0

    · Правило 4

    Якщо y = v + a, де a є постійною, то Var (y) = Var (v)

    Слід зауважити, що дисперсія змінної x може розглядатися як коваріація між двома величинами x:

    Var (x) = 1 / n * (x i -x) 2 = 1 / n * (x i -x) (x i -x) = Cov (x, x)

    З огляду на це рівність, можна скористатися правилами розрахунку вибіркової ковариации, щоб вивести правила розрахунку дисперсії.

    коефіцієнт кореляції

    Розглядаючи ковариацию не можна не відзначити, що вона є не дуже хорошим вимірником взаємозв'язку між величинами. Більш точної мірою залежності є тісно пов'язаний з нею коефіцієнт кореляції. Подібно дисперсії і коваріації, коефіцієнт кореляції має дві форми - теоретичну і вибіркову.

    Для змінних x і y теоретичний коефіцієнт кореляції визначається як:

    x, y = pop.cov (x, y) / pop.var (x) pop.var (y) =  x, y / x 2 y 2 var (y)

    Якщо x і y незалежні, то r дорівнює нулю, тому що дорівнює нулю теоретична коваріація. Якщо між змінними існує, то s x, y, а отже r x, y будуть позитивними. Якщо існує сувора позитивна лінійна завістмость, то r x, y прийме максимальне значення рівне 1. Аналогічним чином при негативній залежності r x, y буде негативним з мінімальним значенням -1.

    Вибірковий коефіцієнт кореляції r дорівнює:


    r x, y = (n / (n-1)) Cov (x, y) / (n / (n-1)) Var (x) (n / (n-1)) Var (y)

    Множники n / (n-1) скорочуються, тому можна визначити вибіркову кореляцію як:


    r x, y = Cov (x, y) / Var (x) Var (y)

    Подібно величиною r, r приймає максимальне значення, рівне одиниці, яка виходить при суворої лінійної залежності між вибірковими значеннями x і y. Аналогічним чином r приймає мінімальне значення -1, коли існує лінійна негативна залежність. Величина r = 0 показує, що залежність між спостереженнями x і y в вибірці відсутня. Однак, той факт, що r = 0, необов'язково означає, що, і навпаки.

    Для обчислення вибіркового коефіцієнта кореляції використовуємо приклад про попит на бензин. Дані представлені в таблиці 1.1.

    Cov (p, y) = - 16,24 (див. Табл. 1.2), тому тепер необхідно знайти значення Var (p) і Var (y) (див. Табл. 1.6 на наступній сторінці). В останніх двох колонках таблиці 1.6 можна знайти, що Var (p) = 888,58 Var (y) = 1,33. отже:

    r = -16.24 / 888,58 * 1,33 = - 16,24 / 34,38 = - 0,47

    Таблиця 1.6

    спостереження p y (Pp) (yy) 2 (pp) 2 (yy) 2
    1 103,5 26,2 -39,86 -0,07 1588,82 0,01
    2 127,0 24,8 -16,36 -1,47 267,65 2,16
    3 126,0 25,6 -17,36 -0,67 301,37 0,45
    4 124,8 26,8 -18,56 0,53 344,47 0,28
    5 124,7 27,7 -18,66 1,43 348,20 2,05
    6 121,6 28,3 -21,76 2,03 473,50 4,12
    7 149,7 27,4 6,34 1,13 40,20 1,28
    8 188,8 25,1 45,44 -1,17 2064,79 1,37
    9 193,6 25,2 50,24 -1,07 2524,06 1,15
    10 173,9 25,6 30,54 -0,67 932,69 0,45
    сума: 1433,6 262,7 8885,75 13,30
    середнє: 143,36 26,27 888,58 1,33

    Чому ковариация не є хорошою мірою зв'язку?

    Коефіцієнт кореляції є більш відповідним вимірником залежності, ніж ковариация. Основна причина цього полягає в тому, що коваріація залежить від одиниць, в яких вимірюються змінні x і y, в той час як коефіцієнт кореляції є величина безрозмірна.

    Повертаючись до прикладу з попитом на бензин, якщо при обчисленні індексу реальних цін в якості базового року взяти 1980 року замість 1972 р то в цьому випадку ковариация зміниться, а коефіцієнт кореляції - немає.

    При використанні 1972 р вкачестве базового року індекс реальних цін для 1980 р склав 188,8. Якщо тепер прийняти цей індекс за 100 для 1980 р то потрібно перерахувати ряди шляхом множення на коефіцієнт 100 / 188,8 = 0,53. Нові ряди представлені в другій колонці таблиці 1.7 і будуть позначені через P. Величина P чисельно менше, ніж p.

    Так як окреме спостереження ряду цін було перераховано з коефіцієнтом 0,53 то це означає, що і середнє значення за вибірковий період (P середн.) Перераховується з цим коефіцієнтом. Отже, в році t:

    P t - P = 0,53p t - 0,53p = 0,53 (p t - p)

    Це означає, що в році t:

    (P - P) (y - y) = 0,53 (p - p) (y - y),

    і, отже, Cov (P, y) = 0,53Cov (p, y). Однак на коефіцієнт кореляції ця зміна не вплине. Коефіцієнт кореляції для P і y дорівнюватиме:


    r p, y = Cov (P, y) / Var (P) Var (y)

    Таблиця 1.7

    спостереження P y PP yy (PP) 2 (yy) 2 (PP) (yy)
    1 973 54,82 26,2 -21,11 -0,07 445,73 0,01 1,48
    1 974 67,27 24,8 -8,67 -1,47 75,09 2,16 12,74
    +1975 66,74 25,6 -9,20 -0,67 84,55 0,45 6,16
    1976 66,10 26,8 -9,38 0,53 96,64 0,28 -5,21
    1 977 66,05 27,7 -9,88 1,43 97,68 2,05 -14,13
    1978 64,41 28,3 -11,53 2,03 132,84 4,12 -23,40
    1979 79,29 27,4 3,36 1,13 11,28 1,28 3,80
    1980 100,00 25,1 24,07 -1,17 579,26 1,37 -28,16
    тисячу дев'ятсот вісімдесят один 102,54 25,2 26,61 -1,07 708,10 1,15 -28,47
    тисяча дев'ятсот вісімдесят дві 92,11 25,6 16,18 -0,67 261,66 0,45 -10,84
    сума: 759,32 262,7 2492,28