• Факультет прикладної математики та інформатики
  • 2.Сущность кластерного аналізу
  • 3. Виконання кластерного аналізу
  • 3.1Формуліровка проблеми
  • 3.2 Вибір способу вимірювання відстані або міри схожості
  • 3.3 Вибір методу кластеризації
  • Метод Варда (Wards procedure)
  • 3.4 Ухвалення рішення про кількість кластерів
  • 3.5 Інтерпретація і профілювання кластерів
  • 3.6 Оцінка надійності і достовірності


  • Дата конвертації01.04.2017
    Розмір19.11 Kb.
    Типдоповіді

    Скачати 19.11 Kb.

    Застосування кластерного аналізу для сегментації ринку

    15

    МІНІСТЕРСТВО АГЕНСТВО ДО ОСВІТИ

    Філія державного освітнього закладу вищої професійної освіти казанського державного університету імені В.І. Ульянова - Леніна в Г. набенежние Челни

    Факультет прикладної математики та інформатики

    Спеціальність: 080116.65: Математичні методи в економіці

    ДОПОВІДЬ

    Застосування кластерного аналізу для сегментації ринку

    виконав:

    студент III курсу

    денного відділення

    групи 40741

    Ужогов А. А.

    набережні Челни

    2009

    Зміст

    • 1. Сегментація р инка
    • 2. Сутність кластерного аналізу
    • 3. Виконання кластерного аналізу
      • 3.1 Формулювання проблеми
      • 3.2 Вибір способу ізмереніярасстоянія або міри схожості
      • 3.3 Вибір методу кластеризації
      • 3.4 Ухвалення рішення про кількість кластерів
      • 3.5 Інтерпретація і профілювання кластерів
      • 3.6 Оцінка надійності і достовірності
    • висновок
    • 1. Сегментація ринку
    • У наш час створення товару не є вже таким безпрецедентним і унікальним подією, як це було раніше. Ще буквально півстоліття тому створення чогось нового виробляло переворот і приносило винахідникам надприбутки. Зараз головним є не створення, а вміле і ефективне просування нового товару. Історії відомі випадки, коли продукція, яка, по суті, не була унікальною або наднової ставала лідером продажів на багато років, завдяки грамотній маркетинговій стратегії фірми.
    • При розробці нового товару необхідно чітко знати, на яку споживчу аудиторію він розрахований. Потрібно знати про своє середньостатистичному потенційного клієнта практично все, починаючи з віку і статі і закінчуючи особистими захопленнями. Саме ці відомості дають можливість розробити товар аж до дрібниць і провести ефективну рекламну кампанію.
    • Одним з основних напрямків маркетингової діяльності є сегментація ринку, що дозволяє акумулювати кошти підприємства на певному напрямку свого бізнесу. Ринок складається з покупців, а покупці відрізняються один від одного по самих різних параметрах. І будь-який з цих змінних можна скористатися як основу для сегментування ринку.
    • До теперішнього часу в економічній літературі досить чітко позначені поняття цільового ринку і цільового сегмента, виділення яких і є основною метою сегментації ринку. Цільовий ринок - це потенційний ринок фірми, що визначається сукупністю людей зі схожими потребами щодо конкретного товару або послуги, достатніми ресурсами, а також готовністю і можливістю купувати. Цільовий сегмент - це однорідна група споживачів цільового ринку фірми, що володіє схожими потребами і купівельними звичками стосовно товару фірми.
    Таким чином, сегментування ринку - це розбивка ринку на чіткі групи покупців, для кожної з яких можуть знадобитися окремі товари і / або комплекси маркетингу.
    Метою сегментування є виділення одного або кількох цільових груп споживачів, під яких "заточується" весь комплекс маркетингових заходів - від розробки продуктів і брендингу до вибору тональності і носіїв маркетингових комунікацій.
    Розбивати ринок на сегменти можна різними способами. Можна використовувати факторний, кластерний, дискримінантний аналізи, можна розбивати і «на око», але цей метод придатний тільки, для досвідчених і багато знають маркетологів. Ми розглянемо тільки кластерний аналіз.

    2.Сущность кластерного аналізу

    Кластерний аналіз являє собою клас методів, використовуваних для класифікації об'єктів або подій у відносно однорідні групи, які називають кластерами (Clusters). Об'єкти в кожному кластері повинні бути схожі між собою і відрізнятися від об'єктів в інших кластерах. На рис. 20.1 показана ідеальна ситуація кластеризації, коли кластери чітко відокремлені один від одного на підставі відмінностей двох змінних: орієнтація на якість (змінна 1), і чутливість до ціни (змінна 2),

    Мінлива 2

    Мал. 20,1. ідеальна ситуація

    кластеризації



    Слід зазначити, що кожен споживач потрапляє в один з кластерів, і перекриваються областей немає. З іншого боку, на рис. 20.2 представлена ​​ситуація кластеризації, яка найчастіше зустрічається на практиці

    Мінлива 2

    Мал. 20.2. Реальна ситуація кластеризації

    На рис. 20.2 кордону деяких кластерів окреслені нечітко, і віднесення деяких споживачів до конкретного кластеру не очевидно, оскільки багато хто з них не можна згрупувати в той чи інший кластер. кластерному аналізі немає необхідності в попередній інформації про кластерної приналежності будь-якого з об'єктів. Групи, або кластери, визначають за допомогою зібраних даних, а не заздалегідь. Кластерний аналіз використовують в маркетингу для різних цілей.

    3. Виконання кластерного аналізу

    Етапи виконання кластерного аналізa:

    1. Формулювання проблеми

    2. Вибір міри відстані

    3. Вибір методу кластеризації

    4. Прийняття рішення про якість кластерів

    5. Інтерпретація та профелірованіе кластерів

    6. Оцінка достовірності кластерів

    3.1Формуліровка проблеми

    Можливо, найважливіша частина формулювання проблеми кластеризації - це вибір змінних, на основі яких проводять кластеризацию. Включення навіть однієї або двох сторонніх (що не мають відношення до гуртування) змінних може спотворити результати кластеризації. Завдання полягає в тому, щоб обраний набір змінних зміг описати схожість між об'єктами з точки зору ознак, що мають відношення до даної проблеми маркетингового дослідження. Змінні слід вибирати, виходячи з досвіду минулих досліджень, теорії або тестируемой гіпотези. Експериментатор повинен мати інтуїцію і вміти робити висновки.

    3.2 Вибір способу вимірювання відстані або міри схожості

    Мета кластеризація - групування схожих об'єктів. Тому для того щоб оцінити, наскільки вони схожі або не схожі, необхідно використовувати якусь одиницю виміру. Найбільш поширений метод полягає в тому, щоб в якості такого заходу використовувати відстані між двома об'єктами. Об'єкти з меншими відстанями між собою більше схожі, ніж об'єкти з великими відстанями. Існує кілька способів обчислення відстані між двома об'єктами.

    Найбільш часто використовувана міра сходства-- евклідова відстань або його квадрат. Евклидова метрика це квадратний корінь з суми квадратів різниць в значеннях для кожної змінної

    Існують і інші способи вимірювання відстані. Відстань міських кварталів) (city-block, або Манхеттенський відстань (Manhattan distance) між двома об'єктами - це сума абсолютних різниць в значеннях для кожної змінної. Відстань Чебишева (Chebychev distance) між двома об'єктами - це максимальна абсолютна різниця в значеннях для будь-якої змінної. Якщо змінні виміряні в різних одиницях, то одиниця вимірювання впливає на рішення кластеризації. У цих випадках перед кластеризацией респондентів ми повинні нормалізувати дані, змінивши шкалу вимірювання кожної змінної таким чином, щоб середнє дорівнювало нулю, а стандартне відхилення - одиниці. Хоча нормалізація може виключити вплив одиниці виміру, вона також зменшує відмінності між групами по змінним, які найкращим чином дискримінують (відрізняють) групи або кластери. Крім того, бажано видалити викиди (тобто випадки з нетиповими значеннями). Використання різних способів вимірювання відстані веде до різних результатів кластеризації. Отже, доцільно використовувати різні міри схожості і потім порівняти результати. Вибравши міру подібності, потім можна вибрати метод кластеризації.

    3.3 Вибір методу кластеризації

    Методи кластеризації можуть бути ієрархічними і неієрархічні. Ієрархічна кластеризація (hierarchical clustering) характеризується побудовою ієрархічної, або деревовидної, структури.

    Ієрархічні методи можуть бути агломеративного (об'єднавчими) і дівізівнимі. Агломеративного кластеризація (agglomerative clustering) починається з кожного об'єкта в окремому кластері. Кластери об'єднують, групуючи об'єкти кожен раз у все більш і болеекрупние кластери. Цей процес продовжують до тих пір, поки всі об'єкти не стануть членами одного єдиного кластера.

    Розділяє, або дівізівная, кластеризація (divisive clustering) починається зі всіх об'єктів, згрупованих в єдиному кластері. Кластери ділять (розщеплюють) до тих пір, поки кожен об'єкт не виявиться в окремому кластері.

    Зазвичай в маркетингових дослідженнях використовують агломеративні методи, наприклад методи зв'язку, дисперсійні та центроїдного методи. Методи зв'язку (linkage methods) включають метод одиночній зв'язку, метод повного зв'язку і метод середньої зв'язку.

    В основі методу одиночній зв'язку (single method) лежить мінімальна відстань, або правило найближчого сусіда. При формуванні кластера першими об'єднують два об'єкти, відстань між якими мінімально. Далі визначають наступне за величиною найкоротшу відстань, і в кластер з першими двома об'єктами вводять третій об'єкт. На кожній стадії відстань між двома кластерами є відстань між їхніми найближчими точками.

    Метод повної зв'язку (complete linkage) аналогічний методу одиночній зв'язку, за винятком того, що в його основі лежить максимальна відстань між об'єктами, або правило далекого сусіда. У методі повного зв'язку відстань між двома кластерами обчислюють як відстань між двома їх найбільш віддаленими точками.

    Метод середньої зв'язку (average linkage) діє аналогічно. Однак в цьому методі відстань між двома кластерами визначають як середнє значення всіх відстаней, виміряних між об'єктами двох кластерів, при цьому в кожну пару входять об'єкти з різних кластерів.

    Широко відомим дисперсійним методом, використовуваним для цієї мети, є Метод Варда (Wards procedure) Дисперсійний метод, в якому кластери формують таким чином, щоб мінімізувати квадрати евклідових відстаней до кластерних середніх. Для кожного кластера обчислюють середні всіх змінних. Потім для кожного об'єкта обчислюють квадрати евклідових відстаней до кластерних середніх. Ці квадрати відстаней підсумовують для всіх об'єктів. На кожній стадії об'єднують два кластери з найменшим приростом в повній внутрікластерной дисперсії.

    У центроїдного методах (centroid method) відстань між двома кластерами є відстань між їх центроїдами (середніми для всіх змінних). Центроїдного метод (centroid method) Дисперсійний метод ієрархічної кластеризації, в якому відстань між двома кластерами є відстань між їх центроїдами (середніми для всіх змінних).Щоразу об'єкти групують і обчислюють новий центр ваги. З усіх ієрархічних методів методи середньої зв'язку та Варда показують найкращі результати в порівнянні з іншими методами.

    До іншого типу процедур кластеризації відносяться неіерахіческіе методи кластеризації (nonhierarchical clustering), часто звані методом k-середніх. Ці методи включають послідовний пороговий метод, паралельний пороговий метод і оптимізує розподіл. У послідовному пороговому методі (sequential threshold method) вибирають центр кластера і всі об'єкти, що знаходяться в межах заданого від центру порогового значення, групують разом. Потім вибирають новий кластерний центр, і процес повторюють для несгруппірованних точок. Після того як об'єкт поміщений в кластер з цим новим центром, його вже не розглядають як об'єкт для подальшої кластеризації.

    Аналогічно працює паралельний пороговий метод (parallel threshold method), за винятком того, що одночасно вибирають кілька кластерних центрів і об'єкти в межах порогового рівня групують з найближчим центром.

    Метод оптимизирующего розподілу (optimizing partitioning method) відрізняється від двох викладених вище порогових методів тим, що об'єкти можна згодом поставити у відповідність іншим кластерам (перерозподілити), щоб оптимізувати сумарний критерій, такий як середнє всередині кластерне відстань для даного числа кластерів. Два головні недоліки неієрархічних методів полягають у тому, що число кластерів визначається заздалегідь і вибір кластерних центрів відбувається незалежно. Більш того, результати кластеризації можуть залежати від обраних центрів. Багато неієрархічні процедури вибирають перші k випадків (k - число кластерів), не пропускаючи жодних значень в якості початкових кластерних центрів. Таким чином, результати кластеризації залежать від порядку спостережень в даних. Неієрархічна кластеризация швидше ієрархічних методів, і її вигідно використовувати при великій кількості об'єктів або спостережень, Висловлено припущення про можливість використання ієрархічних та неієрархічних методів в тандемі. По-перше, початкове рішення по кластеризації отримують, використовуючи такі ієрархічні методи, як метод середньої зв'язку або метод Варда. Отримане цими методами число кластерів і кластерних Центроїд використовують в якості вихідних даних в методі оптимизирующего розподілу. Вибір методу кластеризації і вибір заходи відстані взаємопов'язані. Наприклад, квадрати евклідових відстаней використовують поряд з методом Варда і центроїдного методом. Деякі з неієрархічних методів також використовують квадрати евклідових відстаней.

    3.4 Ухвалення рішення про кількість кластерів

    Головне питання кластерного аналізу - питання про кількість кластерів. Тут немає твердих правил, що дозволяють швидко прийняти рішення, але можна керуватися наступним.

    1. При визначенні кількості кластерів керуються теоретичними і практичними міркуваннями. Наприклад, якщо мета кластеризації - виявлення сегментів ринку, то менеджмент може захотіти отримати конкретне число кластерів.

    2. В ієрархічній кластеризації як критерій можна використовувати відстані, при яких об'єднують кластери /

    3. В ієрархічній кластеризації креслять графік залежності відношення сумарної внутрішньогрупової дисперсії до груповий дисперсії від числа кластерів. Точка, в якій спостерігається вигин або різкий поворот, вказує на прийнятне кількість кластерів. Збільшення числа кластерів за цю точку зазвичай безрезультатно.

    4. Відносні розміри кластерів повинні бути досить виразними.

    3.5 Інтерпретація і профілювання кластерів

    Інтерпретація і профілювання кластерів включає перевірку кластерних Центроїд. Центроїди представляють середні значення об'єктів, що містяться в кластері по кожній із змінних. Вони дозволяють описувати кожен кластер, якщо присвоїти йому номер або мітку. Якщо комп'ютерна програма кластеризації не видасть таку інформацію, її можна отримати через дискримінантний аналіз.

    Часто має сенс профілювати кластери через змінні, які не з'явилися підставою для кластеризації. Ці змінні можуть включати демографічні, психографічні характеристики, використання продукту або інші змінні. Наприклад, кластери можна вивести, виходячи з шуканих переваг. Подальше профілювання здійснюють через демографічні або психографические змінні, щоб визначити маркетингову стратегію для кожного кластера. Змінні, що істотно розрізняються між кластерами, можна ідентифікувати дискримінантний аналізом і однофакторного дисперсійного аналізом.

    3.6 Оцінка надійності і достовірності

    Маючи кілька висновків, виведених з кластерного аналізу, не слід приймати ніякого рішення по кластеризації, не виконавши оцінку надійності та достовірності цього рішення. Формальні процедури оцінки надійності та достовірності рішень кластеризації досить складні і не завжди виправдані тому ми їх опустимо. Однак такі процедури забезпечать адекватну перевірку якості кластерного аналізу.

    1. Виконуйте кластерний аналіз на підставі одних і тих же даних, але з використанням різних способів вимірювання відстані. Порівняйте результати, отримані на основі різних заходів відстані, щоб визначити, наскільки збігаються отримані результати.

    2. Використовуйте різні методи кластерного аналізу і порівняйте отримані результати.

    3. Розбийте дані на дві рівні частини випадковим чином. Виконайте кластерний аналіз окремо для кожної половини. Порівняйте кластерні центроїди двох підвибірок.

    4. Випадковим чином видаліть деякі змінні. Виконайте кластерний аналіз за скороченим набору змінних. Порівняйте результати з отриманими на основі повного набору змінних.

    5. В ієрархічній кластеризації рішення може залежати від порядку випадків в наборі даних. Виконайте аналіз кілька разів, змінюючи порядок випадків, до отримання стабільного рішення.


    висновок

    Кластерний аналіз є дуже зручним засобом для виділення сегментів ринку. Особливо в наш час високих технологій, коли на допомогу людині приходять машини, і такий трудомісткий процес ставати буквально секундним справою.

    Освіта сегментів залежить від наявних даних, а не визначається заздалегідь.

    Змінні, які є підставою для кластеризації, слід вибирати, виходячи з досвіду попередніх досліджень, теоретичних передумов, що перевіряються гіпотез, а також на розсуд дослідника. Крім того, слід вибрати відповідну міру відстані (подібності). Особливість ієрархічної кластеризації - розробка ієрархічної або деревовидної структури. Ієрархічні методи кластеризації можуть бути агломеративного або дівізівнимі. Агломеративні методи включають: метод одиночній зв'язку, метод повного зв'язку і метод середньої зв'язку. Широко поширеним дисперсійним методом є метод Барда. Неієрархічні методи кластеризації часто називають методами k-середніх. Ці методи включають послідовний пороговий метод, паралельний пороговий метод і оптимізує розподіл. Ієрархічні і неієрархічні методи можна застосовувати спільно. Вибір методу кластеризації і вибір заходи відстані взаємопов'язані.

    Рішення про кількість кластерів приймають по теоретичним і практичним міркувань. В ієрархічній кластеризації важливим критерієм прийняття рішення про кількість кластерів є відстані, при яких відбувається об'єднання кластерів. Відносні розміри кластерів повинні бути такими, щоб мало сенс зберегти цей кластер, а не об'єднати його з іншими. Кластери інтерпретують з точки зору кластерних Центроїд. Часто інтерпретувати кластери допомагає їх профілювання через змінні, які не лежали в основі кластеризації. Надійність і достовірність рішень кластеризації оцінюють різними способами.


    Головна сторінка


        Головна сторінка



    Застосування кластерного аналізу для сегментації ринку

    Скачати 19.11 Kb.