Дата конвертації14.05.2017
Розмір49.59 Kb.
ТипЛабораторна робота

Скачати 49.59 Kb.

Автоматизований апріорний аналіз статистичної сукупності в середовищі MS Excel

6

МІНІСТЕРСТВО ОСВІТИ

Державна освітня установа вищої професійної освіти

ВСЕРОСІЙСЬКИЙ ЗАОЧНИЙ ФІНАНСОВО-ЕКОНОМІЧНИЙ ІНСТИТУТ

ФІЛІЯ У М. Липецьк

КАФЕДРА СТАТИСТИКИ

ЗВІТ

про результати виконання

комп'ютерної лабораторної роботи №1

«Автоматизований апріорний аналіз статистичної сукупності в середовищі MS Excel»

Варіант № 21

виконав:

Рогатовская Д.М.

перевірив:

Левчегов О.Н.

Липецьк, 2008 р

1. Постановка завдання

При проведенні статистичного спостереження за діяльністю підприємств корпорації отримані вибіркові дані по 32-му підприємствам, що випускають однорідну продукцію (вибірка 10% -ва, механічна), про середньорічної вартості основних виробничих фондів і про випуск продукції за рік.

У проведеному статистичному дослідженні обстежені підприємства виступають як одиниці вибіркової сукупності, а показники Середньорічна вартість основних виробничих фондів і Випуск продукції - як досліджувані ознаки одиниць.

Для проведення автоматизованого статистичного аналізу сукупності вибіркові дані представлені в форматі електронних таблиць процесора Excel в діапазоні осередків B4: C35.

Вихідні дані представлені в табл.1.

номер підприємства

Середньорічна вартість основних виробничих фондів, млн.руб.

Випуск продукції, млн. Руб.

1

1232,00

1184,50

2

1450,50

1299,50

3

1496,50

1449,00

4

1577,00

1610,00

5

1025,00

805,00

6

1657,50

1380,00

7

1703,50

1863,00

8

1278,00

1265,00

9

1565,50

1483,50

10

1807,00

1851,50

12

1979,50

1955,00

13

1508,00

1541,00

14

1657,50

1679,00

15

1899,00

2035,50

16

2175,00

2185,00

17

1623,00

1472,00

18

1795,50

1748,00

19

1427,50

1092,50

20

1818,50

1495,00

21

2025,50

2012,50

22

1393,00

1138,50

23

1105,50

1069,50

24

1853,00

1713,50

25

1657,50

1495,00

26

1542,50

1414,50

27

1197,50

920,00

28

1611,50

1437,50

29

1864,50

1575,50

31

1772,50

1495,00

32

1301,00

1334,00

У процесі дослідження сукупності необхідно вирішити ряд завдань.

I. Статистичний аналіз вибіркової сукупності

1. Виявити наявність серед вихідних даних різко виділяються значень ознак ( «викидів» даних) з метою виключення з вибірки аномальних одиниць спостереження.

2. Розрахувати узагальнюючі статистичні показники сукупності з досліджуваних ознаками: середню арифметичну (), моду (Мо), медіану (Ме), розмах варіації (R), дисперсію (), середні відхилення - лінійне () і квадратичне (? N), коефіцієнт варіації (V?), структурний коефіцієнт асиметрії К.Пирсона (Asп).

3. На основі розрахованих показників в припущенні, що розподілу одиниць за обома ознаками близькі до нормального, оцінити:

а) ступінь коливання значень ознак в сукупності;

б) ступінь однорідності сукупності з досліджуваних ознаками;

в) стійкість індивідуальних значень ознак;

г) кількість влучень індивідуальних значень ознак в діапазони (), (), ().

4. Дати порівняльну характеристику розподілів одиниць сукупності за двома досліджуваним ознаками на основі аналізу:

а) варіації ознак;

б) кількісної однорідності одиниць;

в) надійності (типовості) середніх значень ознак;

г) симетричності розподілів в центральній частині ряду.

5. Побудувати інтервальний варіаційний ряд і гістограму розподілу одиниць сукупності за ознакою Середньорічна вартість основних виробничих фондів і встановити характер (тип) цього розподілу.

II. Статистичний аналіз генеральної сукупності

1. Розрахувати генеральну дисперсію, генеральне середнє відхилення і очікуваний розмах варіації ознак R N.Зіставити значення цих показників для генеральної і вибіркової дисперсії.

2. Для досліджуваних ознак розрахувати:

а) середню похибку вибірки;

б) граничні помилки вибірки для рівнів надійності P = 0,683, P = 0,954, P = 0,997 і межі, в яких перебуватимуть середні значення ознаки генеральної сукупності при заданих рівнях надійності.

3. Розрахувати коефіцієнти асиметрії As і ексцесу Ek. На основі отриманих оцінок зробити висновок про особливості форми розподілу одиниць генеральної сукупності.

III. Економічна інтерпретація результатів статистичного дослідження підприємств

У цій частині дослідження необхідно відповісти на ряд питань.

1. Типові чи утворюють вибірку підприємства за значеннями досліджуваних економічних показників?

2. Які найбільш характерні для підприємств значення показників середньорічної вартості основних фондів і випуску продукції?

3. Наскільки сильні відмінності в економічних характеристиках підприємств вибіркової сукупності? Чи можна стверджувати, що вибірка сформована з підприємств з досить близькими значеннями по кожному з показників?

4. Яка структура підприємств вибіркової сукупності за середньорічною вартості основних фондів? Якою є питома вага підприємств з найбільшими, найменшими і типовими значеннями даного показники? Які саме це підприємства?

5. Чи носить розподіл підприємств за групами закономірний характер і які підприємства (з вищою або нижчою вартістю основних фондів) переважають в сукупності?

6. Які очікувані середні величини середньорічної вартості основних фондів і випуску продукції на підприємствах корпорації в цілому? Яка максимальна розбіжність в значеннях показника можна очікувати?

2. Робочий файл з результативними таблицями і графіками

3. Висновки за результатами виконання лабораторної роботи Всі статистичні показники представляються з точністю до 2-х знаків після коми.

I. Статистичний аналіз вибіркової сукупності

Завдання 1. Вказати кількість аномальних одиниць спостереження з посиланням на табл.2.

Аномальні одиниці спостереження Таблиця 2

номер підприємства

Середньорічна вартість основних виробничих фондів, млн.руб.

Випуск продукції, млн. Руб.

11

680,00

1725,00

30

2175,00

575,00

Завдання 2. Розраховані вибіркові показники представлені в двох таблицях - табл.3 і табл.5. На основі цих таблиць формується єдиний ая таблиць а (табл.8) значень вибіркових показників, перерахованих в умови Завдання 2.

Таблиця 8

Описові статистики вибіркової сукупності

Узагальнюючі статистичні показники сукупності з досліджуваних ознаками

ознаки

Середньорічна вартість основних виробничих фондів

Випуск продукції

Середня арифметична ()

1600,00

1500,00

Мода (Мо)

1657,50

1495,00

Медіана (Ме)

1617,25

1489,00

Розмах варіації (R)

1150,00

1380,00

Дисперсія ()

74791,78

106432

Середнє лінійне відхилення ()

220,00

251,30

Середнє квадратичне відхилення (? N)

273,50

326,20

Коефіцієнт варіації (V?)

17,09

21,74

Коефіцієнт асиметрії К.Пирсона (Asп)

-0,21

0,02

Завдання 3.

3а). Ступінь коливання ознаки визначається за значенням коефіцієнта варіації V відповідно до оцінної шкалою коливання ознаки.

Для ознаки Середньорічна вартість основних виробничих фондів показник V = 17,09.

Для ознаки Випуск продукції показник V = 21,74.

Висновок: коефіцієнти варіації V s = 17,09% і V s = 21,74% потрапляють в діапазон 0% s? 40% - коливання ознак незначна.

3б). Однорідність сукупності по досліджуваному ознакою для нормального і близьких до нормального розподілів встановлюється за значенням коефіцієнта варіації V. Якщо його значення невелике (V <33%), то індивідуальні значення ознаки x i мало відрізняються один від одного, одиниці спостереження кількісно однорідні.

Для ознаки Середньорічна вартість основних виробничих фондів показник V = 17,09.

Для ознаки Випуск продукції показник V = 21,74.

Висновок: для ознак Середньорічна вартість основних виробничих фондів і Випуск продукції одиниці спостереження кількісно однорідні, розподіл ознак близько до нормального.

3в). Зіставлення середніх відхилень - квадратического і лінійного дозволяє зробити висновок про стійкість індивідуальних значень ознаки, тобто про відсутність серед них «аномальних» варіантів значень.

В умовах симетричного і нормального, а також близьких до них розподілів між показниками і мають місце рівності 1,25, 0,8, тому ставлення показників і може служити індикатором стійкості даних.

Якщо> 0,8, то значення ознаки нестійкі, в них є «аномальні» викиди. Отже, незважаючи на візуальне виявлення та виключення нетипових одиниць спостережень при виконанні Завдання 1, деякі аномалії в первинних даних продовжують зберігатися. В цьому випадку їх слід виявити (наприклад, шляхом пошуку значень, що виходять за межі ()) і розглядати в якості можливих «кандидатів» на виключення з вибірки.

Для ознаки Середньорічна вартість основних виробничих фондів показник = 0,8043

Для ознаки Випуск продукції показник = 0,77.

Висновок: для ознаки Середньорічна вартість основних виробничих фондів показник = 0,8043 0,8 означає значення ознаки нестійкі, в них є «аномальні» викиди. Виявимо їх: значення, що виходять за інтервал (1053,00; 2147,00) є «кандидатами» на виключення з вибірки.

Для ознаки Випуск продукції показник = 0,770,8, значить немає аномалій.

«Кандидати» на виключення з вибірки: підприємство №5, вартість основних виробничих фондів 1025,00 і підприємство №16, вартість основних виробничих фондів 2175,00.

3г). Для оцінки кількості влучень індивідуальних значень ознак x i в той чи інший діапазон відхилення від середньої, а також для встановлення процентного співвідношення розсіювання значень x i по 3-м діапазонами формується табл.9 (з конкретними числовими значеннями меж діапазонів).

Таблиця 9

Розподіл значень ознаки по діапазонах розсіювання ознаки щодо

межі діапазонів

Кількість значень x i, що знаходяться в діапазоні

Процентне співвідношення розсіювання значень x i за діапазонами,%

перша ознака

Друга ознака

перша ознака

Друга ознака

перша ознака

Друга ознака

[1326,5.; 1873,5.]

[1173,8; 1826,2]

20

19

66,7

63,3

[1053,00.; 2147,00]

[847,6; 2152,00]

28

28

93,3

93,3

[779,5; 2420,5]

[521,4; 2478,6]

30

30

100

100

На основі даних табл.9 процентне співвідношення розсіювання значень ознаки за трьома діапазонами зіставляється з розсіюванням по правилу «трьох сигм», справедливому для нормальних і близьких до нього розподілів:

68,3% значень розташовуються в діапазоні (),

95,4% значень розташовуються в діапазоні (),

99,7% значень розташовуються в діапазоні ().

Якщо отримане в табл. 9 процентне співвідношення розсіювання х - i по 3-м діапазонами незначно розходиться з правилом «3-х сигм», можна припустити, що досліджуване розподіл ознаки близько до нормального.

Розбіжність з правилом «3-х сигм» може бути суттєвим. Наприклад, менш 60% значень х i потрапляють в центральний діапазон () або значно більше 5% значення х i виходить за діапазон (). У цих випадках розподіл не можна вважати близьким до нормального.

Висновок: отримане в табл. 9 процентне співвідношення розсіювання х - i по 3-м діапазонами незначно розходиться з правилом «3-х сигм», можна припустити, що досліджуване розподіл ознаки близько до нормального.

Завдання 4. Для відповіді на питання 4а) - 4г) необхідно скористатися табл.8 і порівняти величини показників для двох ознак.

4а). Для порівняння коливання значень ознак, що мають різні середні, використовується коефіцієнт варіації V.

Висновок: так як V s для першої ознаки менше, ніж V s для другої ознаки, то коливання значень першої ознаки менше коливання значень другої ознаки.

4б). Порівняння кількісної однорідності одиниць.

Чим менше значення коефіцієнта варіації V, тим більш однорідна сукупність.

Висновок: значення коефіцієнта варіації V s <33%, значить сукупність кількісно однорідна.

4 в). Порівняння надійності (типовості) середніх значень ознак.

Чим більш однорідна сукупність, тим надійніше середнє значення ознаки

Висновок: тому що одиниці спостереження кількісно однорідні, отже середня арифметична величина є надійною характеристикою даної сукупності.

4г). Порівняння симетричності розподілів в центральній частині ряду.

У нормальних і близьких до нього розподілах основна маса одиниць (63,8%) розташовується в центральній частині ряду, в діапазоні (). Для оцінки асиметрії розподілу в цьому центральному діапазоні служить коефіцієнт К.Пирсона - Asп.

При правобічної асиметрії Asп> 0, при лівосторонньої - Asп <0. Якщо Asп = 0, варіаційний ряд симетричний.

Висновок: Асиметрія розподілу ознаки Середньорічна вартість основних виробничих фондів в центральній частині ряду є лівосторонньої, так як Asп = -0,21 <0. Асиметрія ознаки Випуск продукції є правобічної, так як Asп = 0,02> 0. . Порівняння абсолютних величин | Аsп | для обох рядів показує, що ряд розподілу ознаки Середньорічна вартість основних виробничих фондів більш асиметричний, ніж ряд розподілу ознаки Випуск продукції.

Завдання 5. Інтервальний варіаційний ряд розподілу одиниць сукупності за ознакою Середньорічна вартість основних виробничих фондів представлений в табл.7, а гістограма і кумулята - на рис.2.

Можливість віднесення розподілу ознаки «Середньорічна вартість основних виробничих фондів» до сімейства нормальних розподілів встановлюється шляхом аналізу форми гістограми розподілу. Аналізується кількість вершин в гістограмі, її асиметричність і вираженість «хвостів», тобто частоти появи в розподілі значень, що виходять за діапазон ().

1. При аналізі форми гістограми насамперед слід оцінити розподіл варіантів ознаки по інтервалах (групам). Якщо на гістограмі чітко простежуються два-три «горба» частот варіантів, це говорить про те, що значення ознаки концентруються відразу в декількох інтервалах, що не відповідає нормальному закону розподілу.

Якщо гістограма має одновершинная форму, є підстави припускати, що вибіркова сукупність може мати характер розподілу, близький до нормального.

Висновок по п.1: гістограма має одновершинная форму, є підстави припускати, що вибіркова сукупність може мати характер розподілу, близький до нормального.

2. Для подальшого аналізу форми розподілу використовуються описові параметри вибірки - показники центру розподілу (, Mo, Me), варіації (), асиметрії в центральній частині розподілу (AsП). Сукупність цих показників дозволяє дати якісну оцінку близькості емпіричних даних до нормальної форми розподілу.

Нормальний розподіл є симетричним, і для нього виконується співвідношення:

= Mo = Me, As п = 0, R n = 6 n.

Порушення цих співвідношень свідчить про наявність асиметрії розподілу. Розподіл з невеликою або помірною асиметрією в більшості випадків відносяться до нормального типу.

Висновок по п.2

Оскільки = 1600, Mо = 1657,5, Ме = 1617,5, = -0,21, = 1150, 6? n = 6 * 273,5 = 1641

Отже, асиметрія незначна, розподіл можна віднести до нормального типу.

3. У нормальному і близьким до нього розподілах крайні варіанти значення ознаки (близькі до хmin і хmax) зустрічаються багато рідше (5-7% всіх випадків), ніж серединні (лежачі в діапазоні ()). Отже, за відсотком виходу значень ознаки за межі діапазону () можна судити про відповідність довжини «хвостів» розподілу нормальному закону.

Висновок по п.3 відсоток виходу значень ознаки за межі діапазону () - 6,7%, «хвости» розподілу відповідають нормальному закону.

Висновок: Гістограма є одновершінной (многовершінной), приблизно симетричною (істотно асиметричною), "хвости" розподілу не надто довгі, тому що 6,7% варіантів лежать за межами інтервалу (), отже, розподіл близько до нормального.

II. Статистичний аналіз генеральної сукупності

Завдання 1. Розраховані генеральні показники представлені в табл.10.

Таблиця 10

Описові статистики генеральної сукупності

Узагальнюючі статистичні показники сукупності з досліджуваних ознаками

ознаки

Середньорічна вартість основних виробничих фондів

Випуск продукції

Стандартне відхилення

278,16

331,82

дисперсія

77370,81

110102,08

асиметричність As

-0,15

0,04

ексцес Ek

-0,34

-0,21

Очікуваний розмах варіації ознак R N

1668,96

1990,2

Величина дисперсії генеральної сукупності може бути оцінена безпосередньо по вибіркової дисперсії.

У математичній статистиці доведено, що при малому числі спостережень (особливо при n 40-50) для обчислення генеральної дисперсії по вибіркової дисперсії слід використовувати формулу

.

- для середньорічної вартості ОПФ

- для випуску продукції

При досить великих n значення поправочного коефіцієнта близьке до одиниці (при n = 100 його значення дорівнює 1,101, а при n = 500 - 1,002 і т.д.). Тому при досить великих n можна наближено вважати, що обидві дисперсії співпадають:

.

Розрахуємо відношення для двох ознак:

Для першої ознаки = 0,97, для другої ознаки = 0,97.

Висновок: Ступінь розбіжності між ознаками оцінюється величиною 0,97, значить розбіжність незначно.

Для нормального розподілу справедливо рівність R N = 6 N.

В умовах близькості розподілу одиниць генеральної сукупності до нормального це співвідношення використовується для прогнозної оцінки розмаху варіації ознаки у генеральній сукупності.

Очікуваний розмах варіації ознак R N:

- для першої ознаки R N = 6 * 278,16 = 1668,96,

- для другої ознаки R N = 6 * 331,82 = 1990,92.

Величина розбіжності між показниками R N і R n:

- для першої ознаки | R N -R n | = 1668,96-1150 = 518,96

- для другої ознаки | R N -R n | = 1990,92-1380 = 610,92

Завдання 2. Застосування вибіркового методу спостереження пов'язано з вимірюванням ступеня достовірності статистичних характеристик генеральної сукупності, отриманих за результатами вибіркового спостереження. Достовірність генеральних параметрів залежить від репрезентативності вибірки, тобто від того, наскільки повно і адекватно представлені у вибірці статистичні властивості генеральної сукупності.

Як правило, статистичні характеристики вибіркової і генеральної сукупностей не збігаються, а відхиляються на деяку величину? , Яку називають помилкою вибірки (помилкою репрезентативності). Помилка вибірки - це різниця між значенням показника, який був отриманий за вибіркою, і генеральним значенням цього показника. Наприклад, різниця

= | - |

визначає помилку репрезентативності для середньої величини ознаки.

Для середнього значення ознаки середня помилка вибірки (її називають також стандартною помилкою) висловлює середнє відхилення вибіркової середньої від математичного очікування M [] генеральної середньої.

Для досліджуваних ознак середні помилки вибірки дані в табл. 3:

- для ознаки Середньорічна вартість основних виробничих фондів

= 50,78,

- для ознаки Випуск продукції

= 60,6

Гранична помилка вибірки визначає межі, в межах яких лежить генеральна середня. Ці кордони задають так званий довірчий інтервал генеральної середньої - випадкову область значень, яка з імовірністю P, близькою до 1, гарантовано містить значення генеральної середньої. Цю ймовірність називають довірчою ймовірністю або рівнем надійності.

Для рівнів надійності P = 0,954; P = 0,997; P = 0,683 оцінки граничних помилок вибірки дані в табл. 3, табл. 4а і табл. 4б.

Для генеральної середньої граничні значення і довірчі інтервали визначаються виразами:

,

Граничні помилки вибірки та очікувані кордону для генеральних середніх представлені в табл. 11.

Таблиця 11 Граничні помилки вибірки та очікувані кордону для генеральних середніх

довірча

ймовірність

Р

коефіцієнт

довіри

t

Граничні помилки вибірки

Очікувані кордону для середніх

для першого

ознаки

для другого

ознаки

для першого

ознаки

для другого

ознаки

0,683

1

51,71

61,68

1548,291651,71

1437,321560,68

0,954

2

105,88

126,30

1494,121705,88

1372,701625,30

0,997

3

164,51

196,25

1435,491764,51

1302,751695,25

Завдання 3 Значення коефіцієнтів асиметрії As і ексцесу Ek дані в табл.10.

Показник асиметрії As оцінює зміщення ряду розподілу вліво або вправо по відношенню до осі симетрії нормального розподілу.

Якщо асиметрія правостороння (As> 0) то права частина емпіричної кривої виявляється довшим лівої, тобто має місце нерівність> Me> Mo, що означає переважне поява в розподілі більш високих значень ознаки. (середнє значення більше серединного Me і модального Mo).

Якщо асиметрія лівостороння (As <0), то ліва частина емпіричної кривої виявляється довша за праву і виконується нерівність що означає, що в розподілі частіше встречаютс я більш низькі значення ознаки (середнє значення менше серединного Me і модального Mo).

Чим більше величина | As |, тим більше асиметрично розподіл. Оціночна шкала асиметрії:

| As | 0,25 - асиметрія незначна;

0,25 <| As | 0.5 - асиметрія помітна (помірна);

| As |> 0,5 - асиметрія істотна.

Висновок: Для ознаки Середньорічна вартість основних виробничих фондів спостерігається незначна лівостороння асиметрія.

Показник ексцесу Ek характеризує крутизну кривої розподілу - її загостреність або положистість в порівнянні з нормальною кривою.

Як правило, коефіцієнт ексцесу обчислюється тільки для симетричних або близьких до них розподілів.

Якщо Ek> 0, то вершина кривої розподілу розташовується вище вершини нормальної кривої, а форма кривої є більш гостровершинності, ніж нормальна. Це говорить про скупчення значень ознаки в центральній зоні ряду розподілу, тобто про переважне появі в д анних значень, близьких до середньої величини.

Якщо Ek <0, то вершина кривої розподілу лежить нижче вершини нормальної кривої, а форма кривої більш полога в порівнянні з нормальною. Це означає, що значення ознаки не концентруються в центральній частині ряду, а досить рівномірно розсіяні по всьому діапазону від xmax до xmin.

Для нормального розподілу Ek = 0. При незначному відхиленні Ek від нуля форма кривої емпіричного розподілу незначно відрізняється від форми нормального розподілу. Ч ем більше абсолютна величина | Ek |, тим істотніше розподіл відрізняється від нормального.

Висновок: Для ознаки Середньорічна вартість основних виробничих фондів Ek <0, що свідчить про те, що вершина кривої розподілу лежить нижче вершини нормальної кривої, а форма кривої більш полога в порівнянні з нормальною. Це означає, що значення ознаки не концентруються в центральній частині ряду, а досить рівномірно розсіяні по всьому діапазону від xmax до xmin.

Для ознаки Випуск продукції Ek <0, що свідчить про те, що вершина кривої розподілу лежить нижче вершини нормальної кривої, а форма кривої більш полога в порівнянні з нормальною.

III. Економічна інтерпретація результатів статистичного дослідження підприємств Висновки повинні розкривати економічний сенс результатів проведеного статистичного аналізу сукупності підприємств, тому відповіді на поставлені питання завдань 1-6, повинні носити економічний характер з посиланнями на результати аналізу статистичних властивостей сукупності (п. 1-5 для вибіркової сукупності і п. 1-3 для генеральної сукупності).

Завдання 1.

Висновок: що утворюють вибірку підприємства типові, тому що з діаграми розсіювання видно, що більшість підприємств мають близькі за значенням економічні показники. Аномальні значення показників представлені в табл. 2.

Завдання 2.

Висновок: найбільш характерні для підприємств значення показників середньорічної вартості основних фондів: = 1600,00 (? = 273,48), випуску продукції = 1500,00 (? = 326,24) (табл. 8). З табл. 9 видно, що більше половини підприємств входять в діапазон значень ().

Завдання 3.

Висновок: V? першого ознаки 17,09? 33%, V? другої ознаки 21,74? 33% (табл.8) - коливання ознак незначна, відмінності в економічних характеристиках підприємств вибіркової сукупності не люті. Можна стверджувати, що вибірка сформована з підприємств з досить близькими значеннями по кожному з показників.

Завдання 4.

Висновок: структура підприємств вибіркової сукупності (ряд розподілі) за середньорічною вартості основних фондів представлена на робочому аркуші в табл. 7. Питома вага підприємств зі значеннями даного показника: найбільшими - 3 (100%), найменшими - 4 (13,33%), типовими - 11 (66,67%).

Завдання 5.

Висновок: розподіл підприємств за групами носить закономірний характер, тому що встановлено, що воно близьке до нормального (візуально це простежується на гістограмі), і підприємства з більш низькою вартістю основних фондів переважають в сукупності, тому що спостерігається незначна лівостороння асиметрія.

Завдання 6.

висновок:

очікувані середні величини середньорічної вартості основних фондів і випуску продукції на підприємствах корпорації в цілому за будь-якої з довірчих ймовірностей представлені в табл. 11.

МІНІСТЕРСТВО ОСВІТИ

Державна освітня установа вищої професійної освіти

ВСЕРОСІЙСЬКИЙ ЗАОЧНИЙ ФІНАНСОВО-ЕКОНОМІЧНИЙ ІНСТИТУТ

ФІЛІЯ У М.Липецьк

КАФЕДРА СТАТИСТИКИ

ЗВІТ

про результати виконання

комп'ютерної лабораторної роботи №2


Автоматизований кореляційно-регресійний аналіз взаємозв'язку статистичних даних в середовищі MS Excel

Варіант № 21



виконав:

Рогатовская Д.М.

перевірив:

Левчегов О.Н.



Липецьк, 2008 р

1. Постановка завдання

Кореляційно-регресійний аналіз взаємозв'язку ознак є складовою частиною проведеного статистичного дослідження і частково використовує результати Лабораторної роботи № 1.

У Лабораторної роботи № 2 вивчається взаємозв'язок між факторингу ознакою Середньорічна вартість основних виробничих фондів (ознака Х) і результативним ознакою Випуск продукції (ознака Y), значеннями яких є вихідні дані Лабораторної роботи № 1 після виключення з них аномальних значень.

У процесі статистичного дослідження необхідно вирішити ряд завдань.

1. Встановити наявність стохастичного зв'язку між факторингу ознакою Х і результативним ознакою Y:

а) графічним методом;

б) методом зіставлення паралельних рядів.

2. Встановити наявність кореляційної зв'язку між ознаками Х і Y методом аналітичної угруповання.

3. Оцінити тісноту зв'язку ознак Х і Y на основі:

а) емпіричного кореляційного відносини? ;

б) лінійного коефіцієнта кореляції r.

Порівняти значення? і r і зробити висновок про можливість лінійного зв'язку між ознаками Х і Y.

4. Побудувати Однофакторні лінійну регресійну модель зв'язку ознак Х і Y, використовуючи інструмент Регресія надбудови Пакет аналізу, і розрахувати довірчі інтервали коефіцієнтів рівняння лінійної регресії.

Побудувати теоретичну лінію регресії.

Дати економічну інтерпретацію коефіцієнта регресії.

Розрахувати коефіцієнт еластичності і дати його економічну інтерпретацію.

5. Знайти найбільш адекватне нелінійне рівняння регресії за допомогою засобів інструменту Майстер діаграм. Побудувати для цього рівняння теоретичну криву регресії.

6. Зробити висновок про можливість практичного використання в якості адекватної моделі взаємозв'язку ознак лінійної моделі, отриманої з використанням інструменту Регресія.

II. Робочий файл з результативними таблицями і графіками.

III. Висновки за результатами виконання лабораторної роботи.

Завдання 1. Встановлення наявності стохастичною зв'язку між факторингу ознакою Х і результативним ознакою Y:

а) графічним методом.

Висновок: На основі аналізу діаграми розсіювання з Лабораторної роботи №1, отриманої після видалення аномальних значень, можна зробити висновок, що має місце стохастична зв'язок. Можливий вид зв'язку: лінійна пряма.

б) методом зіставлення паралельних рядів.

Висновок: Табл.2.1, отримана шляхом ранжирування підприємств по зростанню значення факторної ознаки Х, показує, що зі збільшенням значень факторної ознаки збільшуються значення результативної ознаки, за винятком деяких відхилень від загальної тенденції, що дозволяє зробити висновок про те, що зв'язок між цими ознаками носить закономірний характер і, отже, є статистичною.

Завдання 2. Встановлення наявності кореляційної зв'язку між ознаками Х і Y методом аналітичної угруповання.

Висновок: Результати виконання аналітичної угруповання підприємств по факторному ознакою Середньорічна вартість основних виробничих фондів наведено в табл. 2.2 Робочого файлу, яка показує, що оскільки закономірно змінюється середня величина Y, то статистичний зв'язок кореляційний.

Завдання 3.Оцінка тісноти зв'язку ознак Х і Y:

а) на основі емпіричного кореляційного відносини.

Для аналізу тісноти зв'язку між факторною та результативною ознаками, розраховується показник? - емпіричне кореляційне відношення, що задається формулою

.

Для обчислення? необхідно знати загальну дисперсію і міжгрупова дисперсію результативної ознаки Y - Випуск продукції.

Результати виконаних розрахунків представляються табл. 2.4 Робочого файлу.

Висновок: Величина? = 0,902765617 є близькою до одиниці, що свідчить про наявність тісного і сильного зв'язку.

б) на основі лінійного коефіцієнта кореляції ознак.

У припущенні, що зв'язок між факторною та результативною ознаками прямолінійна, для визначення тісноти зв'язку на основі лінійного коефіцієнта кореляції r був використаний інструмент Кореляція надбудови Пакет аналізу.

Результатом роботи інструменту Кореляції є табл. 2.5 Робочого файлу.

Висновок: Значення коефіцієнта кореляції r = 0,9138826 лежить в інтервалі (0,9-0,99), що відповідно до шкали Чеддока, говорить про те, що тіснота зв'язку вельми висока.

Так як значення коефіцієнта кореляції r позитивне, то зв'язок між ознаками лінійна пряма.

За допомогою показника? вимірюється тіснота зв'язку будь-якої форми, а за допомогою коефіцієнта кореляції r - тільки прямолінійна, отже, значення? і r збігаються тільки при наявності прямолінійною зв'язку. У теорії статистики встановлено, що якщо, то гіпотезу про прямолінійною зв'язку можна вважати підтвердженою.

Висновок: [0,902765617 2 - 0,91318826 2] = 0,018927039? 0,1- гіпотезу про прямолінійною зв'язку можна вважати підтвердженою.

Завдання 4. Побудова однофакторний лінійної регресійної моделі зв'язку досліджуваних ознак за допомогою інструменту Регресія надбудови Пакет аналізу.

Побудова регресійній моделі полягає у визначенні аналітичного вираження зв'язку між факторингу ознакою X і результативним ознакою Y.

Інструмент Регресія проводить розрахунок параметрів а 0 і а 1 рівняння однофакторной лінійної регресії і перевірку його адекватності досліджуваним фактичним даним.

В результаті роботи інструменту Регресія були отримані результативні таблиці 2.6 - 2.9 Робочого файлу.

Висновок: Однофакторна лінійна регресійна модель зв'язку факторного і результативного ознак має вигляд y = 1,089х-242,9

Довірчі інтервали коефіцієнтів рівняння регресії представлені в наступній таблиці:

коефіцієнти

Межі довірчих інтервалів

з надійністю Р = 0,68

з надійністю Р = 0,95

Нижня

Верхня

Нижня

Верхня

а 0

-

-

-

-

а 1

0,93

0,96

0,90

0,97

Зі збільшенням надійності кордону довірчих інтервалів збільшуються.

Економічна інтерпретація коефіцієнта регресії а 1 параметр а 1 показує, наскільки змінюється в середньому результативний ознака Випуск продукції під впливом факторного Вартість основних фондів.

Коефіцієнт еластичності = 1,089 * = 1,16

Економічна інтерпретація коефіцієнта еластичності Е: коефіцієнт еластичності показує, що значення результативної ознаки зміниться в середньому на 1,16% при зміні факторної ознаки на 1%.

Завдання 5. Знаходження найбільш адекватного рівняння регресії за допомогою засобів інструменту Майстер діаграм. Побудова для цього рівняння теоретичної лінії регресії.

Рівняння регресії і їх графіки побудовані для 4-х видів нелінійної залежності між ознаками і представлені на діаграмі 2.1 Робочого файлу.

Рівняння регресії і відповідні їм коефіцієнти детермінації R2 наведені в наступній таблиці:

Регресивні моделі зв'язку Коефіцієнти рівнянь необхідно вказувати не в комп'ютерному форматі, а в загальноприйнятій десятковій формі чисел.

вид рівняння

рівняння регресії

коефіцієнт

детермінації R2

Поліном 2-го порядку

y = 0,000x 2 + 0,672x + 76,76

0,835

Поліном 3-го порядку

y = 6E-07x 3 - 0,002x 2 + 5,015x - 2117

0,838

статечне

y = 0,258x 1,173

0,837

експоненціальне

y = 432,0e 0,000x

0,827

Вибір найбільш адекватного рівняння регресії визначається максимальним значенням коефіцієнта детермінації R2: чим ближче значення R2 до одиниці, тим більш точно регресійна модель відповідає фактичним даним

Висновок: тестування максимальний зафіксований показник детермінації R2 = 0,838

Вид шуканого рівняння регресії - y = 6E-07x3 - 0,002x2 + 5,015x - 2117.

Це рівняння регресії і його графік наведені на окремій діаграмі розсіювання 2.2 Робочого файлу.

Завдання 6. Значення коефіцієнтів детермінації кубічного (R2) і лінійного рівняння (? 2), знайденого за допомогою інструменту Регресія надбудови Пакет аналізу, розходяться дуже незначно (на величину 0,0084). У теорії статистики встановлено, що якщо для показників тісноти зв'язку має місце нерівність, то в якості адекватного вихідними даними рівняння регресії може бути прийнято лінійне рівняння.

Висновок: | 0,833 2 - 0,838 2 | ? 0,1 - лінійне рівняння адекватно вихідними даними.

...........


Головна сторінка


    Головна сторінка



Автоматизований апріорний аналіз статистичної сукупності в середовищі MS Excel

Скачати 49.59 Kb.