• Тема: Статистичне вивчення взаємозвязку
  • Тема: Вивчення взаємозвязку на основі аналізу таблиць
  • Тема: Варіаційні ряди та їх розподіл
  • Під вирівнюванням варіаційних рядів розуміють заміну емпіричного (фактичного) розподілу близьким до нього за характером теоретичним розподілом (імовірнісним) мають певні аналітичні вирази.
  • Найбільш поширене нормальний розподіл, графік якого має форму колоколообразуещей прямий симетричною відносно х середнього, кінці якої асимптотично наближаються до осі абсцис.
  • Вона має точку перегину на відстані
  • Тема: Вибіркове спостереження


  • Дата конвертації09.05.2017
    Розмір17.5 Kb.
    Типкурс лекцій

    теорія статистики

    а нормальних рівнянь для відшукання параметрів а 0, а 1 і а 2 виражається в такий спосіб
    Вимірювання тісноти зв'язку для всіх форм зв'язку може бути вирішена за допомогою обчислення теоретичного кореляційного відносини (?)

    де

    - факторна дисперсія

    - дисперсія фактичного значення ознаки

    - середній квадрат відхилень розрахункових значень результативної ознаки від середньої фактичної результативної ознаки. Оскільки 2 відображає варіацію в ряду тільки за рахунок варіації фактора х, а дисперсія 2 відображає варіацію у за рахунок факторів то їхнє ставлення, іменоване теоретичним коефіцієнтом детермінації, показує який питома вага в загальній дисперсії ряду у займає дисперсія, яка викликається варіацією фактора х. Квадратний корінь з відношення цих дисперсій дає нам теоретичне кореляційне відношення.

    Якщо 2 = 2 то це означає, що роль інших факторів у варіації зведена нанівець. І ставлення, означає повну залежність варіації у від х.

    Якщо 2 = 0, значить варіація х ніяк не впливає на варіацію у і? = 0

    Т.ч. кореляційне відношення може бути від 0 до 1.

    У разі лінійної залежності

    - лінійний коефіцієнт кореляції

    У разі невеликого числа спостережень n дуже важливо оцінити надійність (значимість) коефіцієнта кореляції. Для цього визначають середню помилку коефіцієнта кореляції за такою формулою:

    Де n-2 - число ступенів свободи при лінійної залежності, потім знаходять відношення коефіцієнта кореляції до його середньої помилку

    , Яке порівнюється з табличним значенням t-критерію Стьюдента. Якщо t фактичного (розрахункове) більше t табличного, то лінійний коефіцієнт кореляції r вважається значимим, а зв'язок м / у х і у реальному.

    Тема: Статистичне вивчення взаємозв'язку

    Для вимірювання тісноти залежності використовують також рангові коефіцієнти кореляції (коефіцієнт кореляції рангів). Корелюються не власними значення показників х і у, а їх ранги, тобто номера їх місць займаних в кожному ряду значень за зростанням або спаданням. Позначаються ранги R або N.

    Коефіцієнт кореляції рангів Спірмена

    де:

    - різниця рангів кожної пари значень х і у

    N - число спостережень

    Коефіцієнт кореляції Кендена

    Порядок розрахунку цих показників

    1 крок

    Значення х і у ранжуються, тобто визначається N x і N y

    2 крок

    Значення N x записуються строго в порядку зростання або зменшення

    3 крок

    Ранги другого показника N y розташовуються в порядку відповідному значенню х у вихідному порядку

    4 крок

    Для кожного значення N х підраховується число наступних за ним рангів вищого порядку. Загальна сума таких випадків правильного проходження враховується для всіх рангів як бали зі знаком «+» і позначаються Р

    5 крок

    Аналогічно для кожного значення N y послідовно підраховується число наступних за ним рангів менших за значенням. Загальна сума таких випадків (інверсій) враховується як бали зі знаком «-» і позначаються Q

    6 крок

    Визначається загальна сума балів, яка позначається S = P + Q

    7 крок

    Отримана сума S зіставляється з максимумом, який дорівнює, в разі якщо в обох рядах ранги слідують строго послідовно від 1 до n.

    Між коефіцієнтом Кендена і Спірмена є чисельне співвідношення

    Інтерпретація значень рангових коефіцієнтів кореляції аналогічна будь-яким іншим, тобто чим ближче з ф до 1, тим тісніше залежність, близькість до 0 - відсутність зв'язку

    Окремий випадок

    Якщо ранги повторюються, тобто ознаки мають повторювані значення. При ранжируванні повторюваним значенням присвоюється ранг, розрахований як середнє арифметичне із суми місць, що вони займають по зростанню

    коефіцієнт конкордації

    Кореляція рангів R може використовуватися не тільки для двох, але і для більшого числа показників, факторів. Обчислюваний для цієї мети показник називається коефіцієнтом конкордації (W)

    де m - кількість корелюється факторів

    n - число спостережень

    S - сума квадратів відхилень суми рангів по m факторів від їх середньої арифметичної

    а)

    б)

    де R i - ранг i-го показника

    Алгоритм розрахунку коефіцієнта конкордації:

    1. ранжуючи кожен з трьох показників R x; R y; R z

    2. Знаходимо суму рангів по кожному рядку і загальну суму рядків.

    3. Будуємо в квадрат суму рангів по кожному рядку і знаходимо загальну суму всіх рядків

    4. Знаходимо S за формулою б)

    Цей же розрахунок можна отримати за формулою а), якщо спочатку визначити середню суму рангів

    5. Розраховуємо коефіцієнт конкордації.

    Коефіцієнт конкордації використовується в експертних оцінках для визначення узгодженості думок експертів (m експертів) в розподілі місць рангів між n досліджуваними факторами або об'єктами за їх пріоритетності.

    Тема: Вивчення взаємозв'язку на основі аналізу таблиць

    взаімосопряженності

    Особливе місце у вивченні взаємозв'язку займають дослідження особливості розподілу одиниць сукупності за двома ознаками. За характером розподілу можна судити випадково воно чи ні, тобто чи є залежність між ознаками покладеними в основні угруповання чи ні.

    Для визначення зв'язку між некількісними ознаками застосовують критерій Пірсона

    де m ij - емпіричні

    m ґ ij - теоретичні

    Число ступенів свободи

    де k 1 і k 2 - число рядків і стовпців

    Дані статистичного спостереження розташовуються в таблиці

    y

    x

    I

    II

    III

    всього

    I

    m11

    m12

    m13

    mi

    II

    m22

    mi

    III

    m33

    mi

    всього

    mj

    mj

    mj

    m

    За допомогою коефіцієнта взаємної спряженості знаходимо взаємозв'язок між некількісними ознаками через число збігів.

    Теоретичні частоти розраховуються по кожному рядку або стовпцю пропорційно загальним підсумками виходячи з гіпотези про випадковість розподілу

    Щоб зробити висновок про випадковість або не випадково розподілу, знаходять табличне (порогове) значення ч 2, допустимий при випадкових розбіжності між емпіричними m ij і теоретичними m ґ ij при певному числі ступенів свободи і рівні значущості. Якщо ч 2 фактичне більше ч 2 табличного, розподіл не випадково і швидше пов'язано з залежністю між ознаками.

    Для вимірювання тісноти залежності між зазначеними ознаками використовуються наступні показники:

    коефіцієнт асоціації

    коефіцієнт контингенции

    Коефіцієнт взаємної спряженості Пірсона

    де

    Коефіцієнт спряженості Чупрова

    де k 1 і k 2 - число рядків і стовпців в таблиці.

    Коефіцієнт асоціації та контингенции можуть використовуватися тільки для чотирьох клітинних таблиць (таблиць чотирьох полів)

    I

    II

    I

    a

    b

    II

    c

    d

    А коефіцієнти спряженості Пірсона і Чупрова для таблиць будь-якої розмірності.

    Тема: Варіаційні ряди та їх розподіл

    Момент розподілу варіаційного ряду

    У математичній статистиці під моментом розподілу k-го порядку розуміється середня арифметична k-го ступеня відхилення окремих варіантів від постійної величини А

    Якщо прийняти А = 0, то моменти розподілу називаються початковими

    Тоді початковий момент 1-го порядку

    Початковий момент 2-го порядку

    Якщо А = x, то моменти називаються центральними

    Центральний момент третього порядку використовується для характеристики асиметричності розподілу. Оскільки для симетричних рядів

    Щоб порівнювати асиметричність в різних рядах м 3 зіставляють із середнім квадратичним в кубі.

    Нормований момент третього порядку

    Показник асиметрії A S

    Якщо r 3> 0 асиметрія правостороння (витягнутість вправо), при r 3 <0 - лівостороння асиметрія.

    Коефіцієнт асиметрії Пірсона

    Центральний момент четвертого порядку м 4 використовується для характеристики крутості ряду (ексцес).Для нормального розподілу характерно таке співвідношення між м 4 і м 2. , але

    Як показник ексцесу E x

    Якщо ексцес E x> 0, то ряд островершінін, якщо E x <0, то ряд нізковершінін.

    Ці характеристики застосовуються для аналізу варіаційних рядів і визначення, типу кривої розподілу і при вирівнюванні варіаційних рядів.

    Вирівнювання варіаційних рядів (Побудова теоретичних розподілів)

    Під вирівнюванням варіаційних рядів розуміють заміну емпіричного (фактичного) розподілу близьким до нього за характером теоретичним розподілом (імовірнісним) мають певні аналітичні вирази.

    Найбільш поширене нормальний розподіл, графік якого має форму колоколообразуещей прямий симетричною відносно х середнього, кінці якої асимптотично наближаються до осі абсцис. Вона має точку перегину на відстані д від центру симетрії.

    Крива виражається рівнянням

    де у - ордината кривої нормального розподілу

    t - нормовані відхилення

    При вирівнюванні по кривій нормального розподілу теоретичні частоти визначаються за формулою

    де N =? f (сума частот) знаходяться як функція від t ц (t)

    h - величина інтервалу в групах

    t - нормовані відхилення

    Основними параметрами відхилення кривої нормального розподілу є середнє арифметичне і середнє квадратичне.

    розподіл Пуассона

    Якщо варіаційний ряд представляє собою розподіл по дискретному ознакою, де зі збільшенням значень х частоти різко зменшаться і де середня арифметична дорівнює або близька до дисперсії, такий ряд можна вирівняти по кривій Пуассона.

    Де P x - Імовірність настання окремих значень х

    a = x -

    Теоретичні частоти визначаються за формулою

    критерії згоди

    Застосовується для оцінки близькості емпіричних (f) і теоретичних (f) частот і перевірки гіпотези про характер розподілу в емпіричному ряду.

    критерій Пірсона

    Сума відносин квадратів розбіжностей між f і f до теоретичних частот.

    Фактичне значення ч 2 порівнюють з критичним по таблиці з урахуванням рівня значущості б і числа ступенів свободи k.

    б = 5% або б = 1%; б = 0.05 або б = 0.01

    k визначається число груп (m-1) - число параметрів емпіричного розподілу використовуваних для знаходження теоретичних частот. При вирівнюванні по кривій нормального розподілу k = m-1-2, отже k = m-3

    Оскільки скільки при розрахунку теоретичних частот використовуються два параметри:

    1. Критерій Романовського

    якщо <3 - розбіжності випадкові

    якщо> 3 - відхилення істотні

    2. Критерій Колмагорова

    d - максимальна величина розбіжностей між накопиченими частості (в%)

    D - максимальна різниця між накопиченими частотами.


    Тема: Вибіркове спостереження

    Вибіркове спостереження застосовується при масових обстеженнях. Воно дозволяє заощадити кошти для проведення дослідження (збору первинної інформації, її обробці і аналізу) шляхом створення досить представницької (репрезентативною) вибіркової сукупності, яка точно відображає (з певним ступенем імовірності і відповідного їй коефіцієнта довіри) генеральну сукупність підлягає дослідженню.

    При проведенні вибіркового спостереження ставитися такі завдання:

    1. правильно відобразити генеральну сукупність в вибіркової сукупності

    2. Правильно визначити обсяг вибіркової сукупності

    3. Правильно визначити середню помилку вибірка, тобто варіативність вибіркового середнього

    Результат вибіркового спостереження поширюється на всю сукупність.

    Розрізняють середню і граничну похибку вибірки

    Середня помилка вибірки

    У 2 - дисперсія досліджуваного показника досліджуваної сукупності

    n - обсяг вибіркової сукупності або обсяг вибірки

    Середня помилка вибіркової частки

    w - вибіркова частка одиниць володіє досліджуваним ознакою

    (1-w) - дисперсія частки альтернативної ознаки

    Вибіркове спостереження проводитися повторним або бесповторного методом

    При бесповторном відборі в формулах під знаком радикала з'являється множник, де N - чисельність генеральної сукупності

    Гранична помилка вибірки (?)

    м - середня помилка вибірки

    t - коефіцієнт довіри - це показник визначає розмір помилки в залежності від того, з якою ймовірністю P вона перебуває. Значення t і P дані в спеціальних таблицях, де P розглядається як функція t. Т.ч. формула граничної помилки () для середньої набуває вигляду

    для повторного відбору

    для бесповторного відбору

    Для частки, відповідно

    для повторного відбору

    для бесповторного відбору

    Формули граничної помилки розрізняються залежно від застосовуваного виду вибірки.

    Види вибірки можуть бути:

    · Власне випадкова або механічна

    · Типова (районированной)

    · Серійної (гніздовий)

    Вище зазначені формули застосовні для власне-випадкової і механічної вибірки

    Для типової (районированной), тобто коли генеральна сукупність ділиться на групи по якомусь суттєвого ознакою (типу), а потім з кожної групи проводиться випадковий відбір і загальна середня величина ознаки (або частка) визначається за груповими вибірковим показниками. У формулі граничної помилки вибірки враховується середня з групових дисперсій

    У цьому випадку помилка вибірки залежить від внутрішньогрупової варіації

    При серійної вибірки, коли з генеральної сукупності, розбитою на рівновеликі серії (незда) випадково відбираються серії, всередині яких проводяться суцільні спостереження

    Величина помилки вибірки залежить не від числа обстежуваних одиниць, а від числа обстежуваних серій і від величини міжгруповий дисперсії

    Серійна вибірка проводитися в основному як бесповторная і формула граничної помилки вибірки має вигляд

    д 2 - межсерийная дисперсія

    s - число відображуваних серій

    S - число серій у генеральній сукупності

    Всі вищевказані формули використовуються при великої вибірки.

    Якщо вибірка вважається малою і при розрахунку середньої помилки вибірки знаменник зменшується на одиницю

    Крім того, під час перебування ймовірності допуску помилки або при визначенні довірчих інтервалів досліджуваних показників у генеральній сукупності, користуються таблицями ймовірності Стьюдента
    ...........