• Побудова вибіркової функції попиту
  • Маркетингові опитування споживачів
  • Вибір методу опитування.
  • Обгрунтування обсягу вибірки і проведення опитування.
  • Біноміальна модель вибірки.
  • ДОСЛІДЖЕННЯ РИНКУ ОСВІТНІХ ПОСЛУГ
  • Б. Загальна вивчення ринку
  • В. Ставлення до платної освіти
  • Г. Про курс "Основи економіки"
  • Перевірка однорідності двох біноміальних вибірок


  • Дата конвертації23.03.2017
    Розмір56.55 Kb.
    Типреферат

    Скачати 56.55 Kb.

    Вибіркові дослідження в економетрики

    РЕФЕРАТ

    за економетрики

    вибіркові дослідження


    Термін "вибіркові дослідження" застосовують, коли неможливо вивчити всі одиниці представляє інтерес сукупності. Доводиться знайомитися з частиною сукупності - з вибіркою, а потім за допомогою економетричних методів і моделей переносити висновки з вибірки на всю сукупність. Як приклад розглянемо вибіркові дослідження переваг споживачів, які часто проводять фахівці з маркетингу.

    Побудова вибіркової функції попиту

    Функція попиту часто зустрічається в економічних підручниках, але при цьому зазвичай не розповідається, як вона отримана. Тим часом оцінити її за емпіричними даними не так уже й важко. Ми часто з'ясовуємо очікуваний попит за допомогою наступного простого прийому - запитуємо потенційних споживачів: "Яку максимальну ціну Ви заплатили б за такий-то товар?" Нехай для визначеності мова йде про конкретний навчальному посібнику з менеджменту. В одному з експериментів вибірка складалася з 20 опитаних. Вони назвали такі максимально допустимі для них ціни (в рублях за станом на вересень 1998 г.):

    40, 25, 30, 50, 35, 20, 50, 32, 15, 40, 20, 40, 45, 30, 50, 25, 35, 20, 35, 40.

    Насамперед названі величини треба впорядкувати в порядку зростання. Результати представлені в табл.1. У першому стовпчику - номера різних чисельних значень (в порядку зростання), названих споживачами. У другому стовпці наведено самі значення ціни, названі ними. У третьому стовпці зазначено, скільки разів назване те або інше значення.


    Табл.1. Емпірична оцінка функції попиту і її використання

    № п / п (i) Ціна pi Ni

    попит

    D (pi)

    прибуток

    (P-10) D (р)

    прибуток

    (P-15) D (р)

    прибуток

    (P-25) D (р)

    1 15 1 20 100 0 -
    2 20 3 19 190 95 -
    3 25 2 16 240 160 0
    4 30 2 14 280 210 70
    5 32 1 12 264 204 84
    6 35 3 11 275 220 110
    7 40 4 8 240 200 120
    8 45 1 4 140 120 80
    9 50 3 3 120 105 75

    Таким чином, 20 споживачів назвали 9 конкретних значень ціни (максимально допустимих, або прийнятних для них значень), кожне з значень, як видно з третього стовпчика, названо від 1 до 4 разів. Тепер легко побудувати вибіркову функцію попиту залежно від ціни. Вона буде представлена ​​в четвертому стовпці, який заповнимо знизу вгору. Якщо ми будемо пропонувати товар за ціною понад 50 руб., То його не купить ніхто з опитаних. При ціні 50 руб. з'являються 3 покупця. Записуємо 3 у четвертий стовпець в дев'ятий рядок. А якщо ціну знизити до 45? Тоді товар куплять четверо - той єдиний, для кого максимально можлива ціна - 45, і ті троє, хто був згоден на велику ціну - 50 руб. Таким чином, легко заповнити стовпець 4, діючи за правилом: значення в клітці четвертого стовпця дорівнює сумі значень в знаходиться зліва клітці третього стовпчика і в лежачої знизу клітці четвертого стовпця. Наприклад, за 30 руб. куплять товар 14 осіб, а за 20 руб. - 19.

    Залежність попиту від ціни - це залежність четвертого стовпця від другого. Табл.1 дає нам дев'ять точок такої залежності. Залежність можна представити на малюнку, в координатах «попит - ціна». Якщо абсциса - це попит, а ордината - ціна, то дев'ять точок на кривій попиту, перераховані в порядку зростання абсциси, мають вигляд:

    (3; 50), (4; 45), (8; 40), (11; 35), (12; 32), (14; 30), (16; 25), (19; 20), (20 ; 15).


    Ці дев'ять точок можна використовувати для побудови кривої попиту яким-небудь графічним або розрахунковим способом, наприклад, методом найменших квадратів (див. Нижче розділ 5). Крива попиту, як і повинно бути згідно з підручником, економічної теорії, убуває, маючи напрямку від лівого верхнього кута креслення до правого. Однак помітні відхилення від гладкого вигляду функції, пов'язані, зокрема, з природним пристрастю споживачів до круглих чисел. Зауважте, всі опитані, крім одного, назвали числа, кратні 5 руб.

    Дані табл.1 можуть бути використані для вибору ціни продавцем-монополістом (або діючому на ринку монополістичної конкуренції). Нехай витрати на виготовлення одиниці товару рівні 10 руб. (Наприклад, оптова ціна книги - 10 руб.). За якою ціною її продавати на тому ринку, функцію попиту для якого ми тільки що знайшли? Для відповіді на це питання обчислимо сумарний прибуток, тобто твір прибутку на одному екземплярі (p-10) на число проданих (точніше, запитаних) екземплярів D (p). Результати наведені в п'ятому стовпці табл.1. Максимальний прибуток, що дорівнює 280 руб., Досягається при ціні 30 руб. за екземпляр. При цьому з 20 потенційних покупців виявляться в стані заплатити за книгу 14, тобто 70%.

    Якщо ж питомі витрати виробництва, що припадають на одну книгу (або оптова ціна), підвищаться до 15 руб., То дані стовпця 6 табл.1 показують, що максимальний прибуток, рівна 220 руб. (Вона, зрозуміло, менше, ніж у попередньому випадку), досягається при більш високій ціні - 35 руб. Ця ціна доступна 11 потенційним покупцям, тобто 55% від усіх можливих покупців. При подальшому підвищенні витрат, скажімо, до 25 руб., Як випливає з даних стовпця 7 табл.1, максимальний прибуток, рівна 120 руб., Досягається при ціні 40 грн. за одиницю товару, що доступно 8 особам, тобто 40% покупців. Відзначте, що при підвищенні оптової ціни на 10 руб. виявилося вигідним збільшити роздрібну лише на 5, оскільки більш різке підвищення привело б до такого скорочення попиту, яке перекрило б ефект від підвищення питомого прибутку (тобто прибутку, що припадає на одну продану книгу).

    Цікавим є аналіз оптимального обсягу випуску при різних значеннях питомих витрат (табл.2).

    Табл.2. Прибуток при різних значеннях витрат

    № п / п (i) Ціна pi

    попит

    D (pi)

    прибуток

    (P-5) D (р)

    прибуток

    (P-20) D (р)

    прибуток

    (P-30) D (р)

    прибуток

    (P-35) D (р)

    прибуток

    (P-40) D (р)

    1 15 20 200 - - - -
    2 20 19 285 0 - - -
    3 25 16 320 80 - - -
    4 30 14 350 * 140 0 - -
    5 32 12 324 144 24 - -
    6 35 11 330 165 * 55 0 -
    7 40 8 280 160 80 * 40 0
    8 45 4 160 100 60 40 20
    9 50 3 135 90 60 45 * 30 *

    У табл.2 зірочками вказані максимальні значення прибутку при тому чи іншому значенні витрат, які не включеному в табл.1. Для легкості огляду результати про оптимальні обсяги випуску і відповідних цінах з табл. 1 і 2 наведені в табл.3.


    Табл.3. Залежність оптимального випуску та ціни від витрат

    витрати 5 10 15 20 25 30 35 40
    оптимальний випуск 14 14 11 11 8 8 3 3
    Ціна 30 30 35 35 40 40 50 50

    Як видно з таблиці 3, з ростом витрат оптимальний випуск падає, а ціна зростає. При цьому зміна витрат на 5 одиниць може викликати, а може і не викликати підвищення ціни. У цьому проявляється мікроструктура функції попиту - невелике підвищення ціни може привести до того, що значні групи покупців відмовляться від покупок, і прибуток впаде.

    Цей ефект нагадує відоме в економічній теорії розділення податкового тягаря між виробником і споживачем. Невірно говорити, що виробник перекладає витрати або, конкретно, податки, на споживача, підвищуючи ціну на їх величину, оскільки при цьому скорочується попит (і випуск), а тому і прибуток виробника.

    Подальше ясно - якщо оптова ціна буде підвищуватися, то і дає максимальний прибуток роздрібна ціна також буде підвищуватися, і все менша частка покупців зможе придбати товар. Крайня точка - оптова ціна, рівна 45 руб. Тоді тільки троє (15%) куплять товар за 50 руб., А прибуток продавця складе тільки 15 руб. Наочно видно, що підвищення витрат виробництва призводить до орієнтації виробника на найбільш багаті верстви населення, але і підвищення цін (до оптимального для монополіста-виробника рівня) не приводить до підвищення прибутку, навпаки, вона знижується, і при цьому більшість потенційних споживачів не в змозі купити товар. Таке вплив інфляції витрат на економічне життя. (Про інфляції ми докладніше поговоримо пізніше.)

    Відзначимо, що ринкові структури не в змозі забезпечити всіх бажаючих - це просто не вигідно.Так, з 20 опитаних лише 14, тобто 70%, можуть розраховувати на покупку, навіть при мінімальних витратах і цінах. Якщо суспільство хоче чимось забезпечити всіх громадян, воно повинно роздавати це благо безкоштовно, як це робиться, наприклад, з підручниками в школах.

    Маркетингові опитування споживачів

    Потенційного покупця цікавить не тільки ціна, але і якість товару, краса упаковки (наприклад, для подарункових наборів цукерок) і багато іншого. Хочеш дізнатися, чого бажає споживач - запитай його. Ця проста думка пояснює популярність маркетингових опитувань.

    Безперечно, що основна мета виробничої та торгової діяльності - задоволення потреб людей. Як отримати уявлення про ці потреби? Очевидно, необхідно опитати споживачів. В американському підручнику по рекламному справі [1] детально розглядаються різні методи опитування споживачів і обробки результатів за допомогою методів економетрики. Розповімо про результати опитування споживачів розчинної кави. Дослідження проведено Інститутом високих статистичних технологій та економетрики на замовлення АТЗТ "Д-2" в квітні 1994 р в Москві.

    Збір даних. Обговоримо постановку задачі. Замовника цікавлять переваги як продавців кави (роздрібних і дрібнооптових), так і безпосередньо споживачів. В результаті спільного обговорення було визнано доцільним використовувати для опитування і тих, і інших одну і ту ж анкету з 14 основних і 4 соціально-демографічних питань з додаванням двох питань спеціально для продавців. Анкета була розроблена спільно представниками замовника і виконавця і затверджена замовником. У табл.4 наведено дещо скорочений варіант цієї анкети.


    Табл.4. Анкета для споживачів розчинної кави

    _____________________________________________________________

    Дорогий споживач розчинної кави,

    Інститут високих статистичних технологій та економетрики просить Вас відповісти на кілька простих запитань про те, яку каву Ви любите. Ваші відповіді дозволять скласти об'єктивне уявлення про смаки російських любителів кави і сприятимуть підвищенню якості цього товару на російському ринку.

    1.Часто Ви п'єте розчинна кава: іноді, кожен день 1 чашку, 2-3 чашки, більше, ніж 3 чашки.

    (Тут і далі підкресліть потрібне.)

    2. Що Ви цінуєте в кава: смак, аромат, фортеця, колір, відсутність шкідливих для здоров'я речовин, що-небудь ще (повідомте нам, що саме).

    3. Як часто купуєте каву: у міру потреби або по можливості?

    4. Чи любите Ви бразильський розчинна кава? Так, ні, не знаю.

    5. Який обсяг упаковки Ви віддаєте перевагу: в пакетиках, маленька банку, середня банку, велика банка, обов'язково скляна банка, все одно.

    6. Де купуєте розчинна кава: в кіосках, в продуктових магазинах, в спеціалізованих відділах та магазинах, все одно, де купити, де-небудь ще (опишіть, будь ласка).

    7. Чи були випадки, коли куплений Вами кави опинявся низької якості? Та ні.

    8. Чи згодні Ви, що за високу і гарантовану якість продукту можна і заплатити трохи дорожче? Та ні.

    9. Який кави Ви надасте перевагу купити: банку невідомої якості за 2000 руб. або продукт того ж ваги, безпеку якого гарантована Міністерством охорони здоров'я Росії, за 2500 руб.? Перший другий.

    10. Чи вважаєте Ви за потрібне, щоб виробник вжив заходів для того, щоб шкідливі для здоров'я речовини, зокрема, іони важких металів, не проникали з матеріалу упаковки безпосередньо в розчинну каву? Та ні.

    Інститут високих статистичних технологій та економетрики передбачає порівняти споживчі переваги різних категорій росіян. Тому просимо відповісти ще на кілька запитань.

    11. Пол: жіночий, чоловічий.

    12. Вік: до 20, 20-30, 30-50, більше 50.

    13. Рід занять: учень, який працює, пенсіонер, інженер, лікар, викладач, службовець, менеджер, підприємець, науковець, робочий, ін. (Будь ласка, розшифруйте).

    14. Вся Ваша родина любить розчинну каву або ж Ви - єдиний любитель цього чудового напою сучасної людини? Вся сім'я, я один (одна).

    15. Чи погодилися б Ви і надалі брати участь в опитуваннях споживачів щодо якості різних харчових продуктів (чай, джем і ін.). Якщо "так", то повідомте свою адресу, телефон, ім'я та по батькові.

    Дякую за Ваше сприяння роботі щодо підвищення якості продуктів на російському ринку!

    Вибір методу опитування. Широко застосовуються процедури опитування, коли респонденти (так соціологи і маркетологи називають тих, від кого отримують інформацію, тобто опитуваних) самостійно заповнюють анкети (роздані їм або отримані поштою), а також особисті та телефонні інтерв'ю. З цих процедур нами було вибрано особисте інтерв'ю з наступних причин.

    Повернення поштових анкет порівняно невеликий (в даному випадку можна було очікувати не більше 5-10%), відтягнуть по часу і спотворює структуру сукупності споживачів (найбільш динамічні люди навряд чи знайдуть час для відповіді на подібну анкету). Крім того, є проблеми з поштовим зв'язком (постійна зміна тарифів ускладнює відшкодування респондентам поштових витрат і ін.).

    Самостійне заповнення анкети, як показали спеціально проведені експерименти, не дозволяє отримати повні відповіді на поставлені питання (респондент втомлюється або відволікається, відмовляється відповідати на частину питань, іноді не розуміє їх або відповідає не по суті). Деякі категорії респондентів, наприклад, продавці в кіосках, відмовляються заповнювати анкети, але готові усно відповісти на питання.

    Телефонне опитування спотворює сукупність споживачів, оскільки найбільш активних індивідуумів важко застати вдома і умовити відповісти на питання анкети. Репрезентативність порушується також і тому, що на один номер телефону може припадати різну кількість продавців і споживачів розчинної кави, а деякі з них не мають телефонів взагалі. Анкета досить довга, і розмова по домашньому і тим більше службовому телефону респондента може бути припинений достроково за його ініціативою. Іногородніх продавців і споживачів розчинної кави, які приїхали в Москву, по телефону опитати практично неможливо.

    Метод особистого інтерв'ю позбавлений перерахованих недоліків. Відповідним чином підготовлений інтерв'юер, отримавши згоду на інтерв'ю, утримує увагу співрозмовника на анкеті, домагається отримання відповідей на всі її питання, контролюючи при цьому відповідність відповідей реальної позиції респондента. Ясно, що успіх інтерв'ювання залежить від особистих якостей і підготовки інтерв'юера. Однак витрати на отримання однієї анкети при використанні цього методу більше, ніж для інших розглянутих методів.

    Формулювання питань. У маркетингових і соціологічних опитуваннях використовують три типи питань - закриті, відкриті і напівзакриті, вони ж напіввідкриті. При відповіді на закриті питання респондент може вибирати лише з сформульованих укладачами анкети варіантів відповіді. Як відповідь на відкриті запитання респондента просять викласти свою думку у вільній формі. Напівзакриті, вони ж напіввідкриті питання займають проміжне положення - крім перерахованих в анкеті варіантів, респондент може додати свої міркування.

    У соціологічних публікаціях триває дискусія з приводу "м'яких" і "жорстких" форм збору даних, тобто фактично про те, якого типу питання доцільніше використовувати - відкриті або закриті (див., наприклад, статтю директора Інституту соціології РАН В.А. Ядова [2]). Перевага відкритих питань полягає в тому, що респондент може вільно висловити свою думку так, як вважатиме за потрібне. Їх недолік - в складності зіставлення думок різних респондентів. Для такого зіставлення та отримання зведених показників організатори опитування змушені самі шифрувати відповіді на відкриті питання, застосовуючи розроблену ними схему шифрування. Перевага закритих питань в тому і полягає, що таку шифровку проводить сам респондент. Однак при цьому організатори опитування уподібнюються давньогрецького міфічного персонажа Прокрустом. Як відомо, Прокруст запрошував подорожніх заночувати у нього. Укладав їх на ліжко. Якщо подорожній був маленький на зріст, він витягав його ноги так, щоб вони діставали до кінця ліжка. Якщо ж подорожній опинявся високим і ноги його стирчали - він обрубував їх так, щоб досягти стандарту: "зростання" подорожнього повинен дорівнювати довжині ліжка. Так і організатори опитування, застосовуючи закриті питання, змушують респондента "витягати" або "обрубувати" свою думку, щоб висловити його за допомогою наведених в формулюванні питання можливих відповідей.

    Ясно, що для обробки даних по групам і порівняння груп між собою потрібні формалізовані дані, і фактично мова може йти лише про те, хто - респондент або маркетолог (соціолог, психолог і ін.) - Буде шифрувати відповіді. У проекті "Споживачі розчинної кави" практично для всіх питань варіанти відповідей можна перерахувати заздалегідь, тобто можна широко використовувати закриті питання. На відміну від опитувань з питаннями типу: "Чи схвалюєте Ви йдуть в Росії реформи?", В яких природно просити респондента розшифрувати, що він розуміє під "реформами" (відкрите питання). Тому в використовуваної в описуваному проекті анкеті використовувалися в основному закриті і напівзакриті питання. Як показали результати обробки, цей підхід виявився правильним - лише в невеликому числі анкет виявилися вписані свої варіанти відповідей. Разом з тим демонструвалася повага до думки респондента, не висувалося вимога обов'язкового вибору із заданої множини відповідей - респондент міг додати своє, але рідко користувався цією можливістю (не більше ніж в 5% випадків).

    В останньому питанні анкети респонденту пропонувалося стати постійним учасником опитувань про якість товарів народного споживання. Ряд респондентів відгукнувся на цю пропозицію, в результаті стало можливим розгортання постійної мережі "експертів з якості", подібної аналогічним в США.

    Обгрунтування обсягу вибірки і проведення опитування. Математико-статистичні імовірнісні моделі вибіркових маркетингових і соціологічних досліджень часто спираються на припущення про те, що вибірку можна розглядати як "випадкову вибірки з кінцевої сукупності" (див. Термінологічне додаток). Типу тієї, коли зі списків виборців за допомогою датчика випадкових чисел відбирається необхідне число номерів для формування журі присяжних засідателів. У даному проекті не можна забезпечити формування подібної вибірки - не існує реєстру споживачів розчинної кави. Однак в цьому і немає необхідності. Оскільки гипергеометрическое розподіл добре наближається біноміальним, якщо обсяг вибірки по крайней мере в 10 разів менше обсягу всієї сукупності (в даному випадку це так), то правомірно використання біноміальної моделі, згідно з якою думка респондента (відповіді на питання анкети) розглядається як випадковий вектор, а всі такі вектора незалежні між собою. Іншими словами, можна використовувати модель простої випадкової вибірки. Таким чином, позиція в давньої дискусії в середовищі фахівців, які вивчають поведінку людини (маркетологів, соціологів, психологів, політологів та ін.) Про те, чи є випадковість в поведінці окремо взятої людини або ж випадковість виявляється лише у відборі вибірки з генеральної сукупності, практично не впливає на алгоритми обробки даних.

    У біноміальної моделі вибірки оцінювання характеристик відбувається тим точніше, ніж обсяг вибірки більше. Часто запитують: "Який обсяг вибірки потрібен?" У математичній статистиці є методи визначення необхідного обсягу вибірки. Вони засновані на різних підходах. Або на завданні необхідної точності оцінювання параметрів. Або на явною формулюванні альтернативних гіпотез, між якими необхідно зробити вибір.Або на обліку похибок вимірювань (методи статистики інтервальних даних, див. Нижче). Жоден з цих підходів не можна застосувати в даному випадку.

    Біноміальна модель вибірки. Вона застосовується для опису відповідей на закриті питання, які мають дві підказки, наприклад, "так" і "ні". Звичайно, пари підказок можуть бути іншими. Наприклад, "згоден" і "не згоден". Або при опитуванні споживачів кондитерських товарів перша підказка може мати такий вигляд: "Більше люблю" Марс ", ніж" Снікерс ". А друга тоді така:" Більше люблю "Снікерс", ніж "Марс".

    Нехай обсяг вибірки дорівнює n. Тоді відповіді опитуваних можна уявити як X 1, X 2,..., X n, де X i = 1, якщо i -й респондент вибрав першу підказку, і X i = 0, якщо i -й респондент обрав другу підказку, i = 1 , 2, ..., n. У ймовірнісної моделі передбачається, що випадкові величини X 1, X 2,..., X n незалежні і однаково розподілені. Оскільки ці випадкові величини приймають два значення, то ситуація описується одним параметром р - часткою вибирають першу підказку у всій генеральної сукупності. тоді

    Р (X i = 1) = р, Р (X i = 0) = 1-р, i = 1,2, ..., n.

    Нехай m = X 1 + X 2 + ... + X n. Оцінкою ймовірності р є частота р * = m / n. При цьому математичне сподівання М (р *) і дисперсія D (p *) мають вигляд

    М (р *) = р, D (p *) = p (1 p) / n.

    За Законом Великих Чисел (ЗБЧ) теорії ймовірностей (в даному випадку - про теоремі Бернуллі) частота р * сходиться (тобто безмежно наближається) до ймовірності р при зростанні обсягу вибірки. Це і означає, що оцінювання проводиться тим точніше, чим більше обсяг вибірки. Точність оцінювання можна вказати. Займемося цим.

    За теоремою Муавра-Лапласа теорії ймовірностей

    де - Функція стандартного нормального розподілу з математичним очікуванням 0 і дисперсією 1,

    де = 3,1415925 ... -отношение довжини окружності до її діаметра, e = 2,718281828 ... - основа натуральних логарифмів. Графік щільності стандартного нормального розподілу

    дуже точно зображений на німецькій грошової банкноті в 10 німецьких марок. Ця банкнота присвячена великому німецькому математику Карлу Гауса (1777-1855), серед основних робіт якого є пов'язані з нормальному розподілу. В даний час немає необхідності обчислювати функцію стандартного нормального розподілу і її щільність за наведеними вище формулами, оскільки давно складені докладні таблиці (див., Наприклад, [3]), а поширені програмні продукти містять алгоритми знаходження цих функцій.

    За допомогою теореми Муавра-Лапласа можуть бути побудовані довірчі інтервали для невідомої економетрику ймовірності. Спочатку зауважимо, що з цієї теореми безпосередньо випливає, що

    Оскільки функція стандартного нормального розподілу симетрична відносно 0, тобто то

    Задамо довірчу ймовірність . нехай задовольняє умові

    тобто

    З останнього граничного співвідношення випливає, що


    На жаль, це співвідношення не можна безпосередньо використовувати для довірчого оцінювання, оскільки верхня і нижня межі залежать від невідомої ймовірності. Однак за допомогою методу наслідування збіжності [4, п.2.4] можна довести, що

    Отже, нижня довірча межа має вигляд

    в той час як верхня довірча межа така:

    Найбільш поширеним (у прикладних дослідженнях) значенням довірчої ймовірності є Іноді вживають термін "95% довірчий інтервал". тоді

    Приклад. Нехай n = 500, m = 200. Тоді p * = 0,40. Знайдемо довірчий інтервал для

    Таким чином, хоча в досить великій вибірці 40% респондентів говорять "так", можна стверджувати лише, що у всій генеральної сукупності таких від 35,7% до 44,3% - крайні значення відрізняються на 8,6%.

    Зауваження. З достатньою для практики точністю можна замінити 1,96 на 2.

    Зручні для використання в практичній роботі маркетолога і соціолога таблиці точності оцінювання розроблені під ВЦИОМ (Всеросійському центрі з вивчення громадської думки). Наведемо тут дещо модифікований варіант однієї з них.

    Табл.5. Допустима величина помилки вибірки (у відсотках)

    обсяг групи

    Частка р *

    1000 750 600 400 200 100
    Близько 10% або 90% 2 3 3 4 5 7
    Близько 20% або 80% 3 4 4 5 7 9
    Близько 30% або 70% 4 4 4 6 9 10
    Близько 40% або 60% 4 4 5 6 8 11
    Близько 50% 4 4 5 6 8 11

    В умовах розглянутого вище прикладу треба взяти другу знизу рядок. Обсягу вибірки 500 немає в таблиці, але є обсяги 400 і 600, яким відповідають помилки в 6% і 5% відповідно. Отже, в умовах прикладу доцільно оцінити помилку як ((5 + 6) / 2)% = 5,5%. Ця величина дещо більше, ніж розрахована вище (4,3%). З чим пов'язана така позиція відмінність? Справа в тому, що таблиця ВЦИОМ пов'язана не з довірчою ймовірністю а з довірчою ймовірністю якої відповідає множник Розрахунок помилки за наведеними вище формулами дає 5,65%, що практично збігається зі значенням, знайденим по табл.5.

    Мінімальний з найчастіше використовуваних обсягів вибірки n в маркетингових або соціологічних дослідженнях - 100, максимальний - до 5000 (зазвичай в дослідженнях, що охоплюють ряд регіонів країни, тобто фактично розбиваються на ряд окремих досліджень - як в ряді досліджень ВЦИОМ). За даними Інституту соціології Російської академії наук [5], середнє число анкет в соціологічному дослідженні не перевищує 700. Оскільки вартість дослідження зростає принаймні як лінійна функція обсягу вибірки, а точність підвищується як квадратний корінь з цього обсягу, то верхня межа обсягу вибірки визначається зазвичай з економічних міркувань. Обсяги пілотних досліджень (тобто проводяться вперше, попередньо або як перші в серіях подібних) зазвичай нижче, ніж обсяги досліджень по обкатаної програмі.

    Нижня межа визначається тим, що в мінімальної за чисельністю аналізованої підгрупи має бути кілька десятків людей (не менше 30), оскільки за відповідями потрапили в цю підгрупу необхідно зробити обґрунтовані висновки про переваги відповідної підгрупи в сукупності всіх споживачів розчинної кави. З огляду на розподіл опитуваних на продавців і покупців, на чоловіків і жінок, на чотири градації за віком і вісім - по роду занять, наявність 5 - 6 підказок у багатьох питаннях, приходимо до висновку про те, що в даному проекті обсяг вибірки повинен бути не менше 400 - 500. Разом з тим істотне перевищення цього обсягу недоцільно, оскільки дослідження є пілотним.

    Тому обсяг вибірки був обраний рівним 500. Аналіз отриманих результатів (див. Нижче) дозволяє стверджувати, що відповідно до цілей дослідження вибірку слід вважати репрезентативною.

    Організація опитування. Інтервьерамі працювали молоді люди - студенти першого курсу економіко-математичного факультету Московського державного інституту електроніки і математики (технічного університету) та ліцею No.1140, що проходили навчання з економіки, всього 40 осіб, які мають спеціальну підготовку з вивчення ринку та проведення маркетингових опитувань споживачів і продавців (в обсязі 8 годин). Опитування продавців проводився на ринках м Москви, що діють в Лужниках, у Київського вокзалу і в інших місцях. Опитування покупців проводився на ринках, в магазинах, на вулицях біля кіосків і ларьків, а також в домашній і службовій обстановці.

    Велика увага приділялася якості заповнення анкет. Інтерв'юери були розбиті на шість бригад, бригадири персонально відповідали за якість заповнення анкет. Другий рівень контролю здійснювала спеціально створена "група організації опитування", третій відбувався при введенні інформації в базу даних. Кожна анкета завірятись інтерв'юера і бригадира, на ній зазначено місце і час інтерв'ювання. Тому необхідно визнати високу достовірність зібраних анкет.

    Обробка даних. Відповідно до мети дослідження основний метод первинної обробки даних - побудова частотних таблиць для відповідей на окремі питання. Крім того, проводилося порівняння різних груп споживачів і продавців, виділених за соціально-демографічними даними, за допомогою критеріїв перевірки однорідності вибірок (див. Нижче). При більш поглибленому аналізі застосовувалися різні методи статистики об'єктів нечислової природи (більше 90% маркетингових і соціологічних даних мають нечислову природу [6]). Використовувалися кошти графічного представлення даних.

    Підсумки опитування.Отже, за завданням однієї з торговельних фірм були вивчені переваги покупців і дрібнооптових продавців розчинної кави. Спільно з представниками замовника був складений опитувальний лист (анкета типу соціологічної) з 16 основних питань і 4 додаткових, присвячених соціально-демографічної інформації. Опитування проводилося у формі інтерв'ю з 500 покупцями і продавцями кави. Місця опитування - ринки, лотки, кіоски, продуктові й спеціалізовані магазини. Іншими словами, були охоплені всі види місць продажів кави. Інтерв'ю проводили більше 40 спеціально підготовлених (приблизно по 8-годинною програмою) студентів, розбитих на 7 бригад. Після ретельної перевірки бригадирами і групою обробки інформація була введена в спеціально створену базу даних. Потім проводилася різноманітна статистична обробка, будувалися таблиці і діаграми, перевірялися статистичні гіпотези і т.д. Заключний етап - осмислення і інтерпретація даних, підготовка підсумкового звіту та пропозицій для замовників.

    Технологія організації та проведення маркетингових опитувань лише незначно відрізняється від технології соціологічних опитувань, багаторазово описаної в літературі. Так, ми вважали за краще використовувати напіввідкриті питання, в яких для опитуваного даний перелік підказок, а при бажанні він може висловити свою думку у вільній формі. Чи не уклалися в підказки виявилося близько 5%, їх думки були внесені в базу даних і аналізувалися додатково. Для підвищення надійності опитування про найбільш важливих з точки зору маркетингу моментах питалося в декількох питаннях. Були питання - пастки, за допомогою яких контролювалася "свідомість" заповнення анкети. Наприклад, в питанні: "Що Ви цінуєте в кава: смак, аромат, фортеця, наявність пінки ..." пасткою є включення "фортеці" - ясно, що фортеця залежить не від кави самого по собі, а від його кількості в чашці. У пастку ніхто з 500 не трапився - ніхто не відзначив "фортеця". Цей факт свідчить про надійність висновків проведеного опитування. Ми вважали недоцільним ставити питання про рівень доходів (оскільки в більшості випадків відповідають "середній", що неможливо пов'язати з певною величиною). Замість такого питання ми запитували: "Як часто Ви купуєте каву: у міру потреби або по можливості?". Оскільки кава не є дефіцитним товаром, перша відповідь свідчив про наявність достатніх коштів, другий - про їхню обмеженість (споживач не завжди мав можливість дозволити собі купити банку розчинної кави).

    Вартість подібних досліджень - 5-10 доларів США на одного обстеженого. При цьому трудомісткість (і вартість) початкової стадії - підготовки анкети та інтерв'юерів, пробне опитування та ін. - 30% від вартості дослідження, вартість безпосередньо опитування - теж 30%, введення інформації в комп'ютер і проведення розрахунків, побудова таблиць і графіків - 20% , інтерпретація результатів, підготовка підсумкового звіту та пропозицій для замовників - 20%. Таким чином, вартість власне опитування в два з гаком рази менше вартості інших стадій дослідження. І у виконанні роботи беруть участь різні фахівці. На першій стадії - в основному потрібні висококваліфіковані аналітики. На другий - численні інтерв'юери, в ролі яких можуть виступати студенти і учні, які пройшли конкретний курс навчання в 8-10 годин. На третій - робота з комп'ютером (треба вміти будувати і обраховувати електронні таблиці або бази даних, використовувати статистичні пакети, складати і друкувати таблиці і діаграми і т.п.). На четвертій - знову в основному потрібні висококваліфіковані аналітики.

    Наведемо деякі з отриманих результатів.

    а) На відміну від західних споживачів, вітчизняні не надавали переваги скляних банках у порівнянні з бляшаними. Оскільки бляшані банки дешевше скляних, то можна було порекомендувати (в 1994 р, коли проходило опитування) з метою зниження витрат закупівлю кави в бляшаних банках.

    б) Вітчизняні споживачі готові платити на 10-20% більше за екологічно безпечний кави більш високої якості, що має сертифікат Мінздраву й символ екологічної безпеки на упаковці.

    в) Середній обсяг споживання розчинної кави - 850 г в місяць (на родину споживача).

    г) Споживачі розчинної кави діляться на класи. Є "просунуті" споживачі, що звертають велику увагу на якість і екологічну безпеку, марку і країну виробництва, терпимо ставляться до зміни ціни. Ці "тонкі цінителі" - в основному жінки від 30 до 50 років, службовці, менеджери, науковці, викладачі, лікарі (тобто особи з вищою освітою), що п'ють каву як вдома, так і на роботі, причому "кавовий ритуал "часто входить в процедуру ділових переговорів або нарад. Протилежний по споживчій поведінці клас складається з чоловіків двох крайніх вікових груп - школярів і пенсіонерів. Для них важлива тільки ціна, що очевидним чином пояснюється браком грошей.

    Результати були використані замовником у рекламній кампанії. Зокрема, зверталася увага на сертифікат Мінздраву й на екологічну безпеку упаковки.

    Наведемо приклад ще однієї анкети з нашого досвіду, призначеної для вивчення попиту на освітні послуги (табл.6).


    Табл.6. Дослідження ринку освітніх послуг

    _____________________________________________________________

    ДОСЛІДЖЕННЯ РИНКУ ОСВІТНІХ ПОСЛУГ

    Анкета студентів першого курсу економіко-математичного факультету МГІЕМ (ту).

    А. Об'єктивні дані

    1. Група

    2. Пол

    3. Рік народження

    4. Одружений (заміжня) - так / ні

    Б. Загальна вивчення ринку

    5. Чому Ви вибрали спеціальність економіста?

    6. Чому Ви вибрали саме МГІЕМ (ту) серед всіх вузів Москви, які готують економістів?

    7. Як Ви уявляєте собі майбутню діяльність після закінчення МГІЕМ (ту)?

    8. Чи є у Вас надія на те, що придбані зараз знання виявляться корисними в практичній роботі? Якщо немає, то навіщо Ви вчитеся?

    В. Ставлення до платної освіти

    9. Якби навчання в МГІЕМ (ту) було платним (близько 1 мільйона руб. В рік в цінах лютого 1994 г.), стали б Ви вступати в МГІЕМ (ту)?

    10. Якщо навчання в МГІЕМ (ту) стане платним, то залишитеся Ви вчитися в МГІЕМ (ту)? (Наприклад, організація оплати за навчання така: деяка фірма укладає контракт зі студентом і оплачує його навчання; студент самостійно шукає таку фірму.)

    11. Чи становить для Вас інтерес можливість паралельно з дипломом МГІЕМ (ту) отримати диплом бакалавра Міжкультурного відкритого університету (штаб-квартира в Нідерландах) за фахом "бізнес адміністрейшн" (навчання заочне, вартість 1780 доларів США за курс)?

    Г. Про курс "Основи економіки"

    12. Чи потрібно розповідати зміст реферату-дайджесту підручника К. Макконнелла і С. Брю "Економікс: Принципи, проблеми і політика" або вважати його загальновідомим і говорити про те, чого в ньому немає?

    13. Чи корисний електронний підручник? Якщо немає, то чому?

    14. Чи потрібні Вам індивідуальні заняття в аудиторії (а не в комп'ютерному класі з електронним підручником) і в якому вигляді?

    15. Які теми Ви вважаєте корисним розглянути додатково?

    16. Сформулюйте інші Ваші зауваження та пропозиції щодо курсу "Основи економіки": по лекціях, практичних та індивідуальних занять.

    Д. Додаткова інформація

    17. Які предмети навчання - найважчі, які - найлегші на першому семестрі?

    18. підробляв Ви? Якщо згодні, вкажіть приблизну (середню) суму в місяць.

    19. Істотна чи для Вас стипендія?

    20. Чи є у Вас вдома комп'ютер?

    21. Чи берете Ви в будь-яких політичних рухах, партіях? Якщо згодні, назвіть.

    Перевірка однорідності двох біноміальних вибірок

    Як порівняти дві групи - чоловіків і жінок, молодих і літніх, і т.п.? У маркетингу це важливо для сегментації ринку. Якщо дві групи не відрізняються за відповідями, значить, їх можна об'єднати в один сегмент і проводити по відношенню до них одну і ту ж маркетингову політику, зокрема, здійснювати одні й ті ж рекламні впливу. Якщо ж дві групи розрізняються, то і ставитися до них треба по-різному. Це - представники двох різних сегментів ринку, які потребують різного підходу при боротьбі за їх завоювання.

    Економетрична постановка така. Розглядається питання з двома можливими відповідями, наприклад, "так" і "ні". У першій групі з n 1 опитаних m 1 людина сказали "так", а в другій групі з n 2 опитаних m 2 сказали "так". У ймовірнісної моделі передбачається, що m 1 і m 2 - біноміальні випадкові величини B (n 1, p 1) і B (n 2, p 2) відповідно. (Запис B (n, p) означає, що випадкова величина m, що має біноміальний розподіл B (n, p) з параметрами n - обсяг вибірки і p - ймовірність певної відповіді (скажімо, відповіді "так"), може бути представлена у вигляді m = X 1 + X 2 + ... + X n, де випадкові величини X 1, X 2,..., X n незалежні, однаково розподілені, приймають два значенія1 і 0, причому р (X i = 1) = р, р ( X i = 0) = 1-р, i = 1,2, ..., n.)

    Однорідність двох груп означає, що відповідні їм ймовірності рівні, неоднорідність - що ці ймовірності відрізняються. У термінах математичної статистики: необхідно перевірити гіпотезу однорідності

    H 0: p 1 = p 2

    при альтернативній гіпотезі

    H 1: p 1 p 2.

    (Іноді представляють інтерес односторонні альтернативні гіпотези і .)

    Оцінкою ймовірності р 1 є частота р 1 * = m 1 / n 1, а оцінкою ймовірності р 2 є частота р 2 * = m 2 / n 2. Навіть при збігу ймовірностей р 1 і р 2 частоти, як правило, відрізняються, як кажуть, "по чисто випадковим причин". Розглянемо випадкову величину р 1 * - р 2 *. тоді

    M 1 * - р 2 *) = р 1 - р 2, D 1 * - р 2 *) = р 1 (1 - р 1) / n 1 + р 2 (1-р 2) / n 2.

    З теореми Муавра-Лапласа і теореми про спадкування збіжності [4, п.2.4] випливає, що

    де - Функція стандартного нормального розподілу з математичним очікуванням 0 і дисперсією 1. Для практичного застосування цього співвідношення слід замінити невідому економетрику дисперсію різниці частот на оцінку цієї дисперсії:

    D * (р 1 * - р 2 *) = р * 1 (1 - р * 1) / n 1 + р * 2 (1-р * 2) / n 2.


    За допомогою зазначеної вище математичної техніки можна показати, що

    При справедливості гіпотези однорідності M 1 * - р 2 *) = 0. Тому правило прийняття рішення при перевірці однорідності двох вибірок виглядає так:

    1. Обчислити статистику

    2. Порівняти значення модуля статистика | Q | з граничним значенням K. Якщо | Q | то прийняти гіпотезу однорідності H 0. Якщо ж | Q |> K, то заявити про відсутність однорідності і прийняти альтернативну гіпотезу H 1.

    Граничне значення До визначається вибором рівня значущості статистичного критерію перевірки однорідності. З наведених вище граничних співвідношень випливає, що при справедливості гіпотези однорідності H 0 для рівня значущості маємо (при

    Отже, граничне значення в залежності від рівня значущості доцільно вибирати з умови

    тут - Функція, обернена до функції стандартного нормального розподілу. У соціально-економічних дослідженнях найбільш поширений 5% рівень значущості, тобто Для нього К = 1,96.

    Приклад. Нехай в першій групі з 500 опитаних відповіли "так" 200, а в другій групі з 700 опитаних сказали "так" 350. Чи є різниця між генеральними сукупностями, представленими цими двома групами, по частці відповідають "так"?

    Приберемо з формулювання прикладу термін "генеральна сукупність".

    Нехай з 500 опитаних чоловіків відповіли "так, я люблю пепсі-колу" 200, а з 700 опитаних жінок 350 сказали "так, я люблю пепсі-колу". Чи є різниця між чоловіками і жінками за часткою відповідають "так" на запитання про любов до пепсі-колі?

    У розглянутому прикладі потрібні для розрахунків величини такі: обчислимо статистику

    оскільки | Q | = 3,45> 1,96, то необхідно відхилити нульову гіпотезу т прийняти альтернативну. Таким чином, чоловіки і жінки відрізняються в ознакою - любові до пепсі-колі.

    Необхідно відзначити, що результат перевірки гіпотези однорідності залежить не тільки від частот, але і від обсягів вибірок. Припустимо, що частоти (частки) зафіксовані, а обсяги вибірок ростуть. Тоді чисельник статистики Q не змінюється, а знаменник зменшується, значить, вся дріб зростає. Оскільки знаменник прагне до 0, то дріб зростає до нескінченності і рано чи пізно перевершить будь-яку межу. Є тільки один виняток - коли в чисельнику стоїть 0. Отже, висновок економетрика повинен виглядати так: "відмінність виявлено" або "відмінність не виявлено". У другому випадку різниця, можливо, було б виявлено при збільшенні обсягів вибірок.

    Як і для довірчого оцінювання ймовірності, у ВЦИОМ розроблені дві корисні таблиці, що дозволяють оцінити викликані чисто випадковими причинами допущення розходження між частотами в групах. Ці таблиці розраховані при виконанні нульової гіпотези однорідності і відповідають ситуацій, коли частоти близькі до 50% (табл.7) або до 20% (табл.8). Якщо спостерігаються частоти - від 30% до 70%, то рекомендується користуватися першою з цих таблиць, якщо від 10% до 30% або від 70% до 90% - то другий. Якщо спостерігаються частоти менше 10% або більше 90%, то теорема Муавра-Лапласа і засновані на ній асимптотичні формули дають не дуже хороші наближення, доцільно застосовувати інші, більш просунуті математичні засоби, зокрема, наближення за допомогою розподілу Пуассона.


    Табл.7.

    Допустимі розбіжності (в%) між частотами в двох групах в разі, коли спостерігаються частоти від 30% до 70%

    обсяги

    груп

    750 600 400 200 100
    750 6 7 7 10 12
    600 7 8 8 11 13
    400 7 8 10 11 14
    200 10 11 11 13 16
    100 12 13 14 16 18

    Табл.8.

    Допустимі розбіжності (в%) між частотами в двох групах в разі, коли спостерігаються частоти від 10% до30% або від 70% до 90%

    обсяги

    груп

    750 600 400 200 100
    750 5 5 6 8 10
    600 5 6 7 8 10
    400 6 7 8 9 11
    200 8 8 9 10 12
    100 10 10 11 12 14

    В умовах розібраного вище прикладу табл.7 дає допустима розбіжність 7%. Дійсно, обсяг першої групи 500 відсутня в таблиці, але рядки, відповідні обсягами 400і 600, збігаються для перших двох стовпців зліва. Ці стовпці відповідають обсягам другої групи 750 і 600, між якими розташований обсяг 700, даний в прикладі. Він ближче до 750, тому беремо величину розбіжності, що стоїть на перетині першого стовпця і другий (і третій) рядків, тобто 7%. Оскільки реальне розбіжність (10%) більше, ніж 7%, то робимо висновок про наявність значимої різниці між групами. Природно, цей висновок збігається з отриманим раніше розрахунковим шляхом.

    допустиме розходження між частотами неважко отримати розрахунковим шляхом. Для цього достатньо скористатися формулою для статистики Q і визначити, при якій максимальній розбіжності частот все ще робиться висновок про те, що вірна гіпотеза однорідності. Отже, допустима розбіжність знаходиться з рівняння

    Таким чином,

    Для даних прикладу = 1,96 0,029 = 0,057, або 5,7%, для рівня значущості 0,05. .

    Для інших рівнів значущості треба використовувати інші коефіцієнти Так, K (0,01) = 2,58 для рівня значущості 1% і K (0,10) = 1,64 для рівня значущості 10%. Для даних прикладу = 2,58 0,029 = = 0,7482 0,075, або 7,5%, для рівня значущості 0,01. Якщо округлити до найближчого цілого числа відсотків, то отримаємо 7%, як при використанні таблиці 7 вище.

    Аналіз таблиць 7 і 8 показує, що для констатації відмінності частоти повинні відрізнятися не менше ніж на 6%, а при деяких обсягах вибірок - більш ніж на 10%, при обсягах вибірок 100 і 100 - на 19%. Якщо частоти відрізняються на 5% або менше, можна відразу сказати, що економетричний аналіз призведе до висновку про те, що різниця не виявлено (для вибірок обсягів не більше 750).

    У зв'язку з цим виникає питання: яке типове відміну частот у двох вибірках з однієї і тієї ж сукупності? Різниця частот в цьому випадку має нульове математичне сподівання і дисперсію

    Величина р (1-р) досягає максимуму при р = 1/2, і цей максимум дорівнює 1/4. Якщо р = 1/2, а обсяги двох вибірок збігаються і дорівнюють 500, то дисперсія різниці частот дорівнює

    Отже, середнє квадратичного відхилення одно 0,032, або 3,2%. Оскільки для стандартної нормальної випадкової величини в 50% випадків її значення не перевищує по модулю 0,67 (а в 50% випадків - більше 0,67), то типовий розкид дорівнює 0,67 , А в розглянутому випадку-2,1%. Наведені міркування дають метод контролю за правильністю проведення повторних опитувань. Якщо частоти надмірно стійкі, це підозріло!

    література

    1. Сендідж Ч., Фрайбургер В., Ротцолл К. Реклама: теорія і практика: Пер. з англ. - М .: Прогрес, 1989. - 630 с.

    2. Ядов В.А. Стратегії та методи якісного аналізу даних. - Журнал "Соціологія: методологія, методи, математичні моделі", 1991, No.1, с.14-31.

    3. Большев Л.Н., Смирнов Н.В. Таблиці математичної статистики. - М .: Наука, 1983. - - 416 с.

    4. Орлов А.І. Стійкість в соціально-економічних моделях. - М .: Наука, 1979. - 296 с.

    5. Досвід застосування ЕОМ в соціологічних дослідженнях. - М .: Інститут соціологічних досліджень АН СРСР, Радянська соціологічна асоціація, 1977. - 158 с.

    6. Орлов А.І. Загальний погляд на статистику об'єктів нечислової природи. - В сб .: Аналіз нечислової інформації в соціологічних дослідженнях (наукові редактори: В.Г. Андреенков, А.І.Орлов, Ю. Н. Толстова). - М .: Наука, 1985. // С.58-92.