Дата конвертації03.04.2017
Розмір23.7 Kb.
Типесе

Економетричний аналіз впливу економічних показників на чисельність користувачів Інтернету

1

Державний університет

вища школа економіки

Нижегородський філія




Есе з економетрики

Тема: «Економетричний аналіз впливу економічних показників на чисельність користувачів Інтернету»







Нижній Новгород

2008 р

В наш час Інтернет набув великого поширення. Користувачами Інтернету в більш розвинених країнах є майже всі верстви населення, в менш економічно успішних державах люди ніколи не чули про комп'ютери та Інтернеті. Мета даної роботи - показати залежність чисельності користувачів Інтернет в конкретній країні від економічних показників, таких як ВВП на душу населення, національний дохід на душу населення, кількість призначених для користувача комп'ютерів, а також ступінь урбанізації населення. Здавалося б, зв'язок ясна: чим більше ВВП і НД, тим більше комп'ютерів в країні і відповідно більше користувачів всесвітньої павутини; чим більше міського населення щодо сільського, тим воно образованней і «просунутий». Однак на практиці це виявляється не зовсім так. Ряд африканських країн взагалі живе за племінними законами.

У цій роботі я спробую довести існування прямого зв'язку між чисельністю користувачів Інтернет і ВВП, НД і ін. Спробую довести, що саме ці фактори впливають на кількість користувачів ПК і Інтернеті більшою мірою, спробую пояснити отримані результати теоретично і підведу підсумок дослідження, зробивши власні висновки на основі проведених досліджень.

Збір даних здійснювався при використанні сайту www.geohive.com GeoHive: Global Statistics. У роботу включено інформацію про вибірку з 172 країн нашої планети. Щоб зробити моє дослідження найбільш ефективним, я постараюся слідувати плану:

1. визначити залежну змінну і вибір регресорів

2. побудувати регресію (модель)

3. протестувати модель, оцінити її «якість»

4. проаналізувати результати

5. зробити власні висновки

В якості методу дослідження я використовую економетричний аналіз, який буду здійснювати за допомогою економетричного пакета EViews 3.1, розробленого спеціально для цих цілей.

Для опису залежності я вибрала 6 змінних:

1. intusers - кількість користувачів Інтернет в країні

2. pc - чисельність призначених для користувача комп'ютерів в країні

3. gdp - Gross Domestic Product - ВВП на душу населення

4. gni - Gross National Income - НД на душу населення

5. urban - чисельність міського населення

6. rural - чисельність сільського населення

Вибравши 172 країни, я занесла дані в EViews і настав час для аналізу даних. В першу чергу перевіряємо дані на помилки.

ВВП на душу населення: немає негативних величин, але коливається змінна значно. Пояснити це легко, так як у вибірці присутні як найбідніші країни, так і багатющі.

Решта змінні також необхідно дивитися на наявність помилок, однак щоб не захаращувати есе, графіки я наводити не буду.

Далі дивимося взаємну кореляцію змінних:

URBAN

GDP

GNI

INTUSERS

PC

RURAL

URBAN

1.000000

0.056682

0.089996

0.736664

0.557379

0.873801

GDP

0.056682

1.000000

0.780379

0.302719

0.331656

-0.068260

GNI

0.089996

0.780379

1.000000

0.400436

0.438161

-0.060708

INTUSERS

0.736664

0.302719

0.400436

1.000000

0.964982

0.426228

PC

0.557379

0.331656

0.438161

0.964982

1.000000

0.211864

RURAL

0.873801

-0.068260

-0.060708

0.426228

0.211864

1.000000


Бачимо, що на чисельність користувачів Інтернет величезний вплив справляє число комп'ютерів в країні. Крім того, важливе значення має чисельність урбанізованого населення.

Чисельність міського населення сильно залежить від національного доходу на душу населення.

Кількість комп'ютерів в країні також пов'язано з числом користувачів Інтернет і ступенем урбанізації населення.

А на число сільського населення впливають ВВП і НД в зворотній залежності, тобто чим менше ВВП і НД, тим більше населення займається ручною працею і сільським господарством. Це є показником відсталості економіки і підтверджує правильність споруджуваної регресії.

Будуємо регресію, в яку включаємо змінні з теоретичної моделі:

Ls intusers c pc gdp gni urban rural

Dependent Variable: INTUSERS

Method: Least Squares

Date: 02/27/08 Time: 2:03

Sample (adjusted): 4 172

Included observations: 132

Excluded observations: 37 after adjusting endpoints

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

-346430.8

250802.2

-1.381291

0.1696

GDP

10.32608

22.95037

0.449931

0.6535

GNI

502.9395

345.3779

1.456201

0.1478

PC

0.719045

0.014848

48.42816

0.0000

URBAN

0.090404

0.010513

8.598902

0.0000

RURAL

0.005584

0.005304

1.052842

0.2944

R-squared

0.989265

Mean dependent var

5812423.

Adjusted R-squared

0.988838

SD dependent var

19682933

SE of regression

2079463.

Akaike info criterion

31.97751

Sum squared resid

5.45E + 14

Schwarz criterion

32.10854

Log likelihood

-2104.515

F-statistic

2322.154

Durbin-Watson stat

2.087052

Prob (F-statistic)

0.000000


Бачимо, що незначною змінної є ВВП, тому приберемо його з регресії. Всі коефіцієнти вийшли з очікуваними знаками, крім величини сільського населення. Передбачалося, що це негативний фактор. Але так як його величина дуже близька до 0, не звертатимемо на це розбіжність уваги. До того ж його вплив незначний.

Будуємо нову регресію:

Dependent Variable: INTUSERS

Method: Least Squares

Date: 02/27/08 Time: 2:09

Sample (adjusted): 4 172

Included observations: 132

Excluded observations: 37 after adjusting endpoints

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

-354918.2

249305.2

-1.423629

0.1570

GNI

618.1578

231.0229

2.675742

0.0084

PC

0.718812

0.014792

48.59489

0.0000

URBAN

0.090582

0.010473

8.649087

0.0000

RURAL

0.005475

0.005282

1.036557

0.3019

R-squared

0.989247

Mean dependent var

5812423.

Adjusted R-squared

0.988909

SD dependent var

19682933

SE of regression

2072923.

Akaike info criterion

31.96396

Sum squared resid

5.46E + 14

Schwarz criterion

32.07316

Log likelihood

-2104.621

F-statistic

2920.986

Durbin-Watson stat

2.087552

Prob (F-statistic)

0.000000


Як видно з таблиці, показник Adjusted R-squared збільшився з 0,988838 до 0,988909. Це означає, що регресія покращилася.

Крім того, регресорів RURAL має незначний вплив на регресанта, тому його можна видалити і побудувати нову регресію:

Dependent Variable: INTUSERS

Method: Least Squares

Date: 02/27/08 Time: 2:12

Sample (adjusted): 4 172

Included observations: 132

Excluded observations: 37 after adjusting endpoints

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

-399859.8

245577.6

-1.628242

0.1059

GNI

630.0480

230.8051

2.729784

0.0072

PC

0.708903

0.011291

62.78241

0.0000

URBAN

0.100670

0.003869

26.01779

0.0000

R-squared

0.989156

Mean dependent var

5812423.

Adjusted R-squared

0.988902

SD dependent var

19682933

SE of regression

2073526.

Akaike info criterion

31.95723

Sum squared resid

5.50E + 14

Schwarz criterion

32.04459

Log likelihood

-2105.177

F-statistic

3892.026

Durbin-Watson stat

2.066310

Prob (F-statistic)

0.000000


Adjusted R-squared незначно, але зменшився. А це означає, що модель стала гірше. Тому повернемося до попередньої моделі:

Estimation Command:

=====================

LS INTUSERS C GNI PC URBAN RURAL

Estimation Equation:

=====================

INTUSERS = C (1) + C (2) * GNI + C (3) * PC + C (4) * URBAN + C (5) * RURAL

Substituted Coefficients:

=====================

INTUSERS = -354918.2484 + 618.1577906 * GNI + 0.7188117239 * PC + 0.09058209539 * URBAN + 0.005474726438 * RURAL

Згідно зі статистикою Durbin-Watson stat (= 2.087552, статистика близька до 2) автокорреляция в моделі відсутня.

Виконаємо тест на гетероскедастичності:

White Heteroskedasticity Test:

F-statistic

7.466570

Probability

0.000000

Obs * R-squared

43.14884

Probability

0.000001

Test Equation:

Dependent Variable: RESID ^ 2

Method: Least Squares

Date: 02/27/08 Time: 2:18

Sample: 4 172

Included observations: 132

Excluded observations: 37

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

-1.19E + 12

1.87E + 12

-0.639594

0.5236

GNI

2.10E + 09

3.83E + 09

0.548274

0.5845

GNI ^ 2

-403321.1

1132324.

-0.356189

0.7223

PC

445574.9

228912.2

1.946488

0.0539

PC ^ 2

-0.002393

0.000829

-2.885490

0.0046

RURAL

74276.26

84150.65

0.882658

0.3791

RURAL ^ 2

-9.97E-05

0.000103

-0.965351

0.3363

URBAN

163878.1

87839.00

1.865665

0.0645

URBAN ^ 2

-0.000216

0.000157

-1.372084

0.1725

R-squared

0.326885

Mean dependent var

4.13E + 12

Adjusted R-squared

0.283105

SD dependent var

1.35E + 13

SE of regression

1.14E + 13

Akaike info criterion

63.03441

Sum squared resid

1.60E + 28

Schwarz criterion

63.23096

Log likelihood

-4151.271

F-statistic

7.466570

Durbin-Watson stat

1.436753

Prob (F-statistic)

0.000000


У описуваної моделі присутня гетероскедастичності, тому що ймовірність помилитися, відкидаючи гіпотезу про відсутність гетероскедастичності, практично рівна нулю. Але це можна пояснити тим, що вибірка велика за розміром і неоднорідна за значеннями. Якщо скоротити обсяг даних, то вийде позбутися гетероскедастичності.

Проведемо тест Вальда:

Тут, в даному тесті нам потрібно визначити, пояснюють чи обрані нами регресорів регресанта краще, ніж константа. У тесті Вальда припустимо все коефіцієнти рівними 0, тобто C (1) = 0, C (2) = 0, C (3) = 0, C (4) = 0, C (5) = 0. Отримаємо, що:

Wald Test:

Equation: Untitled

Null Hypothesis:

C (1) = 0

C (2) = 0

C (3) = 0

C (4) = 0

C (5) = 0

F-statistic

2544.353

Probability

0.000000

Chi-square

12721.76

Probability

0.000000


В результаті даного тесту, ми отримали, що Probability рівний 0.000000, тобто ймовірність помилитися, відхиливши гіпотезу, що всі коефіцієнти пояснюють регресію гірше, ніж константа рівна нулю, значить, пояснюючі змінні добре пояснюють залежну.

висновки:

1. Отримана модель дозволяє дати відповідь на питання про залежність чисельності Інтернет користувачів від економічних показників;

2. Відповідно до цієї моделі, найбільший вплив на число користувачів надають національний дохід на душу населення, ступінь урбанізації населення і кількість персональних комп'ютерів;

3. Хоча виявлені певні закономірності, що визначають чисельність користувачів Інтернет, розкид значень досить великий. На це вказує досить велика величина стандартного відхилення. Це обумовлено тим, що кожна країна унікальна. Населення однієї може при високому доході зовсім не витрачати кошти на електронні пристрої і, відповідно, спілкування через Інтернет, а люди іншої - навпаки, купують всілякі новинки і жити не можуть, якщо вони не на піку популярності технологій. Всіх цих факторів врахувати неможливо, але це і не було моїм завданням. Я шукала загальні закономірності, і мені їх вдалося знайти. Це головне досягнення моєї роботи.


Головна сторінка


    Головна сторінка



Економетричний аналіз впливу економічних показників на чисельність користувачів Інтернету