• 1. Розрахунок необхідної обсягу вибіркової сукупності
  • 2. Формування вибіркових сукупностей і обробка вибіркових даних
  • 2 . 1 . Основні статистичні характеристики вибірок
  • 3. Поширення результатів вибіркового спостереження на генеральну сукупність
  • 3 . 1 . Результати розрахунку t
  • 4. Перевірка статистичних гіпотез про значення генеральної середньої і про рівність двох вибіркових середніх
  • 4 . 1 . Графічне порівняння результатів суцільного і вибіркового н а блюдения
  • Список використаних джерел


  • Дата конвертації28.05.2017
    Розмір14.75 Kb.
    ТипЛабораторна робота

    Скачати 14.75 Kb.

    Проведення вибіркового спостереження

    Федеральне агентство з освіти

    Державна освітня установа вищої професійної освіти

    «Санкт-Петербурзький державний політехнічний університет»

    Факультет економіки і менеджменту

    Кафедра «Підприємництво і комерція»

    Лабораторна робота №2

    З дисципліни «Статистика»

    На тему

    «Проведення вибіркового спостереження»

    Санкт-Петербург 2008

    Вступ

    Метою лабораторної роботи є освоєння методики організації та проведення вибіркового спостереження; статистичних методів і методів комп'ютерної обробки отриманої інформації; методів оцінки параметрів генеральної сукупності на основі вибіркових даних.

    Вибіркове спостереження - найважливіший вигляд не суцільного спостереження. Теорія вибіркового спостереження, т.зв. вибірковий метод, - сукупність принципів і способів відбору одиниць сукупності, а також способів і методів оцінки параметрів генеральної сукупності на основі вибіркових одиниць. Вибірковий метод в даний час отримав широке практичне застосування, оскільки має цілу низку переваг у порівнянні із суцільним спостереженням та іншими видами несплошного спостереження.

    Переваги вибіркового спостереження в порівнянні з суцільним:

    1. Економія часу, фінансових, трудових, матеріальних ресурсів.

    2. Можливість розширити програму спостереження.

    З іншими видами не суцільний спостереження:

    3. Завдяки добре розробленої теорії вибірки і використовуваних при вибіркових спостереженнях способах формування вибірки з'являється можливість дати оцінку вірогідності параметрів генеральної сукупності.

    Генеральна сукупність - сукупність, яка власне цікавить дослідника і з якої відбираються одиниці в вибіркову сукупність. Вибіркова сукупність - сукупність відібраних одиниць, за якими будуть фіксуватися значення тих чи інших ознак.

    Основний принцип формування вибіркової сукупності - випадковість відбору, тобто всім одиницям генеральної сукупності повинна бути забезпечена рівна ймовірність попадання у вибірку. Цей принцип забезпечує об'єктивність вибіркового спостереження, оскільки дозволяє сформувати репрезентативну вибірку. Репрезентативність сприяє отриманню несмещённой вибірки, тобто структура чи закономірність розподілу в вибіркової сукупності відповідає розподілу одиниць у генеральній сукупності.

    Способи відбору одиниць у вибіркову сукупність:

    1. Випадковий відбір. Реалізують методом жеребкування або з використанням таблиць випадкових чисел.

    2. Механічний відбір - окремий випадок випадкового відбору. Розраховується крок відбору, який дорівнює відношенню обсягу сукупності до обсягу вибірки:.

    Відбір може проводитися за принципом бесповторного відбору, коли, яку видобувають із генеральної сукупності, одиниця назад не повертається, і повторного відбору [1].

    Види вибірки:

    1. Власне випадкова.

    2. Типологічна (стратифікована).

    3. Гніздова (серійна).

    4. Багатоступінчаста.

    5. Багатофазна.

    Лабораторна робота виконана на основі вихідних даних першої лабораторної: дані збірника Росстату Регіони Росії [2], а саме статистична інформація про кількість власних легкових автомобілів на 1000 чоловік населення в різних регіонах Росії в 1990 році. Обсяг вихідної сукупності - 88 одиниць.


    1. Розрахунок необхідної обсягу вибіркової сукупності

    Помилка вибірки - це відмінність у значеннях будь-якого параметра генеральної сукупності і його оцінки, отриманої на основі вибірки. Помилка вибірки присутній завжди, тому що її виникнення пов'язане із самою суттю вибіркового спостереження: по частині судять про ціле. Розподіл одиниць вибіркової сукупності не може в повній мірі відповідати розподілу одиниць генеральної сукупності. Поняттю помилки вибірки та методикою її визначення присвячено багато роботи теорії вибірки (вчені - Я. Бернуллі, П.Л. Чебишев, А.М. Ляпунов, А.А. Марков, А.А. Чупров та ін.).

    Теорема Чебишева. При необмеженому збільшенні числа спостережень в генеральної сукупності з обмеженою дисперсією з імовірністю, близькою до одиниці, можна стверджувати, що величина помилки вибірки не перевищить як завгодно малої позитивної величини?.

    ,

    де - вибіркове середнє, - генеральне середнє, - ймовірність події, укладеного в дужки.

    Теорема Чебишева доводить принципову можливість оцінки параметрів генеральної сукупності на основі вибіркових даних, стверджуючи, що в умовах великої вибірки ймовірність отримати незначну величину помилки близька до 1. Однак, практично не ясно, чому дорівнює ця ймовірність, і яка величина помилки вибірки.

    Теорема Ляпунова. При необмеженому збільшенні числа спостережень в генеральної сукупності з обмеженою дисперсією ймовірність того, що помилка вибірки не перевищить величини t ?, дорівнює нормованої функції Лапласа:

    ,

    де? - середня помилка вибірки,, - середнє вибіркове по i_й вибірці, n - число вибірок.

    Математичною статистикою доведено, що величина? 2 прямо пропорційна дисперсії генеральної сукупності (2) і обернено пропорційна обсягу вибірки (n):.

    Відомо, що (S 2 - дисперсія вибірки). Якщо вибірка великого обсягу, то, отже, на практиці співмножник опускають і.

    Гранична помилка вибірки. Щільність нормального розподілу:, де нормоване відхилення вибіркової середньої від генеральної середньої.

    Дане дослідження проводиться з імовірністю 0,95. Цьому значенню в таблиці Лапласа відповідає t = 1,96, яке на практиці округлюють до 2. У цьому випадку. Тоді.

    Важливим питанням підготовки вибіркового спостереження є визначення обсягу вибіркової сукупності, необхідної і достатньої для оцінки тих чи інших властивостей генеральної сукупності. У практиці економіко-статистичних досліджень, як правило, використовується процедура бесповторного відбору одиниць у вибіркову сукупність. Першим етапом підготовки вибіркового спостереження є розрахунок обсягу вибірки. Розрахунок, як правило, проводиться за такою формулою: [3].

    Розрахунок обсягу вибірки проводиться багаторазово з урахуванням різної величини помилки і з різним рівнем імовірності. За отриманими результатами вибирають оптимальний варіант. У лабораторній роботі буде сформовано три вибірки, об'ємом 70, 25 і 15 одиниць кожна.

    2. Формування вибіркових сукупностей і обробка вибіркових даних

    Методом випадкового бесповторного відбору формуються велика (70 одиниць) і дві малих вибірки (25 і 15 одиниць). Потім, за допомогою ППП Statistica розраховуються основні статистичні характеристики, дані занесені в таблицю нижче.

    Таблиця 2 . 1 . Основні статистичні характеристики вибірок

    У таблиці 2.1 «NewVar1» позначає вибірку розміром 70 одиниць, «NewVar2» - 25 одиниць, «NewVar3» - 15 одиниць. У графі «Mean» вказані значення середніх по кожній вибірці, «Std. Dv. »- стандартне відхилення,« N »- обсяг вибірки,« Std. Err. »- середня помилка вибірки,« Confidence -95,000% »і« Confidence + 95,000% »- відповідно нижня і верхня межі довірчого інтервалу при ймовірності 95%,« Reference »- гіпотетичне значення генеральної середньої величини (відомо з першої лабораторної роботи) , «t-value» - розрахункове значення t_крітерія для перевірки гіпотези про значення генеральної середньої, «df» - число ступенів свободи, «p» - розрахунковий рівень значущості t_крітерія.

    Середнє значення вибірки, що складається з 70 одиниць, так само 53,64286, воно відрізняється від генеральної середньої на 2,06309, величина середньоквадратичного відхилення дорівнює 16,66183. Середня помилка цієї вибірки - 1,991470, а інтервал оптимальності, тобто з імовірністю 95% можна стверджувати, що в середньому по Росії число власних легкових автомобілів на 1000 чоловік населення в 1990 році перебувало в зазначених межах. Розрахункове значення t-критерію становить -1,03596, менше 2, отже, відмінності між генеральною і вибіркової середньої випадкові, і вибіркове середнє є достовірною оцінкою генеральної середньої. Розрахунковий рівень значущості t-критерію також підтверджує це ().


    3. Поширення результатів вибіркового спостереження на генеральну сукупність

    Тепер необхідно провести оцінку суттєвості різниці двох вибіркових середніх. Якщо різниця між середніми величинами статистично значуща, це означає, що відмінність викликано невипадковими факторами, або вибірки не належать одній генеральній сукупності. Інакше це завдання формулюється як перевірка статистичної гіпотези про рівність двох середніх:.

    У лабораторній роботі змістовно гіпотеза формулюється в такий спосіб: взяті вибірки з однієї або з різних генеральних сукупностей? В контексті розв'язуваної задачі відповідь очевидна - вибірки взяті з однієї і тієї ж сукупності. Але слід звернути особливу увагу на прояв ефекту випадкової помилки репрезентативності. Реалізація процедури перевірки гіпотези може дати, в окремих випадках, парадоксальний результат, а саме, показати на основі t_крітерія, що вибірки як би взяті з різних генеральних сукупностей з різними значеннями середніх величин. З дидактичної точки зору такий результат вельми корисний для розуміння істоти статистичних висновків і ступеня їх умовності. Для демонстрації цього ефекту рекомендується взяти такі дві вибірки, з раніше отриманих, для яких різниця між середніми вибірковими значеннями максимальна [3].

    У даній роботі для порівняння взяті вибірки, об'ємом 70 і 25 одиниць. Результати аналізу занесені в таблицю нижче.

    Таблиця 3 . 1 . Результати розрахунку t - до Рітера для вибірок, об'ємом 70 і 25 одиниць

    В отриманій таблиці розраховані наступні показники:

    - Mean - середнє значення з двох вибірках.

    - t-value - t_крітерій, необхідний для оцінки суттєвості різниці двох середніх:, т. К., То.

    - df - число ступенів свободи.

    - p - розрахунковий рівень значущості t_крітерія.

    - t-separ - розрахункове значення t_крітерія з урахуванням різних дисперсій. Очевидно, що в цьому прикладі воно не змінюється, проте програма видає інший результат.

    - df - число ступенів свободи t_крітерія за умови нерівних дисперсій. . Розрахункове значення m округляється до цілого значення в силу того, що число ступенів свободи є ціле число за визначенням.

    - p - розрахунковий рівень значущості t_крітерія за умови невідомих і нерівних дисперсій.

    - Valid N - обсяг кожної вибірки.

    - Std. Dev. - середньоквадратичне відхилення:

    - F-ratio - F_крітерій (дисперсійне відношення), який використовується для оцінки суттєвості відмінності значень двох дисперсій:.

    - p - розрахунковий рівень значущості P_крітерія.

    Гіпотеза приймається, якщо. Тут. Табличне значення t_крітерія одно. Таким чином, отже, випробувана гіпотеза приймається. Аналогічний висновок можна отримати на основі порівняння розрахункового та прийнятого рівнів значущості:.


    4. Перевірка статистичних гіпотез про значення генеральної середньої і про рівність двох вибіркових середніх

    Для наочного і компактного представлення результатів проведеного вибіркового спостереження необхідно скористатися графічними можливостями ППП STATISTICA. Дуже істотним, з дидактичної точки зору, є те, що послідовне виконання розглянутих лабораторних робіт, дає можливість наочного порівняння результатів вибіркового і суцільного спостережень. Цілком очевидно, що, за визначенням, таке порівняння виключено в реальних практичних умовах [3].

    малюнок 4 . 1 . Графічне порівняння результатів суцільного і вибіркового н а блюдения

    Графік наочно показує, що довірчі інтервали, побудовані за всіма вибірками, накривають генеральну середню, що природно. Якби, будь-якої довірчий інтервал, розрахований за результатами вибірки, не включав в себе значення генеральної середньої, то в реальних умовах, це означало б отримання помилкового висновку на основі вибірки.

    Діаграма наочно демонструє можливий результат вибіркового зондування досліджуваної генеральної сукупності і переконливо ілюструє об'єктивну неоднозначність висновків, що формулюються на основі вибіркових даних.


    висновок

    Середнє значення вибірки, що складається з 70 одиниць, так само 53,64286, воно відрізняється від генеральної середньої на 2,06309, величина середньоквадратичного відхилення дорівнює 16,66183. Середня помилка цієї вибірки - 1,991470, а інтервал оптимальності, тобто з імовірністю 95% можна стверджувати, що в середньому по Росії число власних легкових автомобілів на 1000 чоловік населення в 1990 році перебувало в зазначених межах. Розрахункове значення t-критерію становить -1,03596, менше 2, отже, відмінності між генеральною і вибіркової середньої випадкові, і вибіркове середнє є достовірною оцінкою генеральної середньої. Розрахунковий рівень значущості t-критерію також підтверджує це ().

    За результатами перевірки гіпотези про рівність двох вибіркових середніх отримані наступні висновки: розрахункове значення t-критерію менше табличного, отже, з імовірністю 95% можна стверджувати, що дві вибіркових середніх рівні і отримані не випадковим чином (це підтверджує і розрахунковий рівень значущості, більший 0 , 05).

    Графік наочно показує, що довірчі інтервали, побудовані за всіма вибірками, накривають генеральну середню, що природно. Якби, будь-якої довірчий інтервал, розрахований за результатами вибірки, не включав в себе значення генеральної середньої, то в реальних умовах, це означало б отримання помилкового висновку на основі вибірки.

    Список використаних джерел

    1. Лекції з дисципліни статистика. Лектор - доц. О.А. Пономарьова, 2008.

    2. Збірник Росстату Регіони Росії. Соціально-економічні показники. 2006.

    3. Навчальний посібник. Статистика. Методи аналізу розподілів. Вибіркове спостереження. Н.В. Купрієнко, О.А. Пономарьова, Д.В. Тихонов. 132 с. - 2008.