Дата конвертації24.06.2017
Розмір22.53 Kb.
Типкурсова робота

Скачати 22.53 Kb.

Побудова залежності между метриками та експертно оцінкою програмного забезпечення

Зміст

завдання

1. Призначення, описи й характеристики Властивості ПЗ та метрик, Які будут досліджуватіся

2. Описання алгоритму та ЗАСОБІВ, Які будут використовуват

3. ПЕРВИННА статистичний аналіз Із гістограмамі метрик, експертної ОЦІНКИ Властивості ПЗ та основними Статистичний характеристиками, та перевіркамі

4. Висновки по ПЕРВИННА Статистичний АНАЛІЗУ

5. Кореляційній аналіз з кореляційнімі полями та розрахованімі коефіцієнтамі кореляції, та перевіркамі

6. Висновки по кореляційному АНАЛІЗУ

7. Регресійній аналіз з побудованімі лініямі регресій, визначеними функціямі регресій, коефіцієнтамі у функціях та перевіркамі

8. Висновки по регресійному АНАЛІЗУ

9. Загальні Висновки


завдання

Побудуваті залежності между метриками ПЗ та експертно оцінкою Властивості ПЗ. Метрікіта Властивості вікорістаті согласно індівідуального варіанту.

Побудова залежності между метриками та експертно оцінкою Включає побудову перелогових между прямими метриками та експертно оцінкою, непрямими метриками та експертно оцінкою.

Значення експертних оцінок отріматі з лабораторної роботи № 5, значення метрик (прямих та непрямих) отріматі з лабораторної роботи № 6. Метрики та експертні ОЦІНКИ повінні буті отрімані для одних и тих самих проектів. Для достовірності отриманий даних по Кожній метріці винне буті ОТРИМАНО НЕ менше 2000 значень (з лабораторної роботи № 6), експертних оцінок - НЕ менше 15-и. Залежності будуваті между 5-ма прямими метриками та експертно оцінкою, 5-ма непрямими метриками та експертно оцінкою (вікорістаті метрики з лабораторної роботи № 6).

Отрімані результати по перелогових между метриками та експертними оцінкамі порівняті Із результатами побудова перелогових между прямими та непрямими метриками в лабораторних роботах № 4 та 5. Візначіті чи ма ють Спільні Тенденції залежності между тимі прямими метриками та експертними оцінкамі, непрямими метриками та експертними оцінкамі, Які ма ють залежності между собою (Прямі-непрямі метрики). Поясніті чому.

варіант 13

Зрозумілість інтерфейсу, Ефективність CYC, NOP, HIT, FOUT, NOC AMW, ATFD, BovR, CC, CDISP

1. Призначення, описи й характеристики Властивості ПЗ та метрик, Які будут досліджуватіся

При віконанні курсової роботи будут досліджуватісь следующие характеристики властівостей ПЗ:

- Зрозумілість інтерфейсу - чи є призначення для користувача інтерфейс інтуїтівно зрозумілім?

- Ефективність - Наскільки раціонально програма вікорістовує ресурси (пам'ять, процесор) при віконанні своих завдання

Значення експертних оцінок характеристик властівостей ПЗ по проектах приведено в табліці 1 (ОЦІНКИ, Які були зроблені мною для трьох проектів). Всі інші ОЦІНКИ, Які були зроблені підгрупою для трьох проектів подано в документі формату Excel «Метрики програмних продуктів.xclx».

Таблиця 1. Значення експертних оцінок

№ п.п. Властівість Оцінка (0..10) Пояснення
Talend Open Studio 3.2.1
1. ефективність 8 При віконанні поставлених завдання, програма потребує мінімальну Кількість оператівної памяті та других ресурсов для роботи без затримки
2. Зрозумілість інтерфейсу 9 Інтерфейс користувача є інтуїтівно зрозумілім, тому не нужно дуже часто звертатись до документації з метою отріманні допомоги у реализации тієї чи Іншої Функції
Openproj-1.4-src
1. ефективність 9 Пам'ять раціонально розподілена для усієї програми, что дает змогу раціонально використовуват ресурси при віконанні завдання. Але, як Вже уточнювалось Ранее, у програмному коді є частина коду, яка НЕ ​​якісно вікорістовує пам'ять.
2. Зрозумілість інтерфейсу 10 Інтерфейс користувача інтуїтівно зрозумілій та Зручний у вікорістанні. Тобто для користувань данімі програмне забезпечення не вимагається отрімуваті додатково знань
plazma-source 0.1.8
1. ефективність 8 При работе програми НЕ потрібне использование Великої кількості оператівної памяті.
2. Зрозумілість інтерфейсу 10 Інтерфейс користувача є інтуїтівно зрозумілім. Оскількі ВІН відповідає стандарту інтерфейсів IBM 1991.

Такоже будут досліджені следующие метрики програмного забезпечення, Які подано в табліці 2 (Прямі метрики) та табліці 3 (непрямі метрики).

Таблиця 2. Прямі метрики

метрика короткий опис
CYCLO Цікломатічна складність програмного коду
NOC Загальна Кількість класів в проекті
NOP Загальна Кількість параметрів в програмному коді
HIT Глибина дерева Успадкування
FOUT Кількість модулів, что звертають до других модулів

Таблиця 3. непрямі метрики

метрика короткий опис
AMW Середня вага методу
ATFD Доступ до зовнішніх Даних
BОvR Співвідношення перевізначеніх базових класів
CC Зміна класів
CDISP Дісперсійній зв'язок

Результати вимірювань метрик програмних продуктів, что були вищє зазначені, подано в документі формату Excel «Метрики програмних продуктів.xclx», что є додатком до даної курсової роботи.

При віконанні даної курсової роботи були вікорістані следующие Програмні засоби:

- iPlasma - дает можлівість отріматі значення 80-х об'єктно-орієнтованих метрик. Функціонально повний засіб для вимірювання, Який вімірює метрики, Які відносяться як до окрема класів, методів та пакетів, так и для проекту в цілому. Кроме того, метрики віводяться НЕ только в числовому виде, а й у графічному - у виде гістограмі.

- Statistica - пакет для всебічного статистичного АНАЛІЗУ, розроблення компанією StatSoft. У пакеті STATISTICA реалізовані процедури для АНАЛІЗУ Даних (dataanalysis), управління данімі (datamanagement), відобутку Даних (datamining), візуалізації Даних (datavisualization).

2. Описання алгоритму та ЗАСОБІВ, Які будут використовуват

При віконанні даної курсової роботи буде проводитись статистичний аналіз.

Статистичний аналіз, Який віконується з метою визначення залежних между метриками, складається з трьох етапів: первинний статистичний аналіз, кореляційній аналіз та регресійній аналіз.

Схема Побудова перелогових между метриками представлена ​​на рис. 1.


Мал. 1 Схема Побудова перелогових

Первинний статистичний аналіз метрик та експертних оцінок

Метою первинного статистичного АНАЛІЗУ являється визначення закону розподілу віпадкової величини, точніше визначення ВІДПОВІДІ на питання "Чи є Сейчас закон розподілу віпадкової величині нормального?". На етапі первинного статистичного АНАЛІЗУ відбувається дослідження вхідних статистичних Даних. Спочатку аналізуються метрики, отрімані в результате вимірювання набору програм, далі експертні ОЦІНКИ, что Зроби ЕКСПЕРТИ для цього ж набору програм.

Кінцевою метою первинного статистичного АНАЛІЗУ є визначення, чи Належить побудованій закон до нормального. Причиною цього є ті, что подалі аналіз базується на Перевірці на "нормальність" закону розподілу, тобто Кожний з Наступний етапів почінається цією перевіркою, и в залежності від ВІДПОВІДІ застосовуються Різні методи обчислення.

Кореляційній аналіз пар "метрика - експертна оцінка"

На етапі кореляційного АНАЛІЗУ візначається, чи існує залежність между Певна метриками та експертними оцінкамі, чи ее немає. Если залежність існує, то проводитися первинна Обробка даних для визначення довірчої ймовірності та виду залежності. В ІНШОМУ випадки робиться Висновок про Відсутність залежності.

Отже, результатом даного етапу є відсіювання незалежних между собою пар "метрика - експертна оцінка" та визначення за можлівістю увазі залежності для других пар.

Регресійній аналіз залежних величин

Регресійній аналіз - Останній етап у дослідженні на залежність метрик та експертних оцінок. ВІН проводитися только при віконанні умови, что дісперсія залежної змінної (експертної ОЦІНКИ) винна залішатіся постійною при зміні значення аргументу (метрики), тобто, спочатку візначається дісперсія експертної ОЦІНКИ для шкірного прийнятя значення метрики.

Если пара "метрика - експертна оцінка" пройшла всі етапи и не булу відсіяною, робиться Висновок, что експертна оцінка Залежить Певна чином від значення метрики з силою, что показує коефіцієнт детермінації, а вигляд залежності візначає лінія регресії.

3. ПЕРВИННА статистичний аналіз Із гістограмамі метрик, експертної ОЦІНКИ Властивості ПЗ та основними Статистичний характеристиками, та перевіркамі

Первинний статистичний аналіз проводитися с помощью програми Statistica, что набагато спрощує обчислення.

Важлівім способом "Опису" змінної є форма ее розподілу, яка показує, З якою частотою значення змінної потрапляють в певні інтервалі. ЦІ інтервалі, что назіваються інтерваламі угруповання, обіраються дослідніком. Зазвічай дослідника цікавить, Наскільки точно Розподіл можна апроксімуваті нормально (див. Нижчих картинку з прикладом такого розподілу) (див. Такоже Елементарні Поняття статистики). Прості опісові статистики дають про це Деяк інформацію. Например, если асіметрія (показує відхилення розподілу від симетричного) істотно відрізняється від 0, то Розподіл несіметрічно, у тій годину як нормальний Розподіл абсолютно симетрично. Отже, у симетричного розподілу асіметрія дорівнює 0. Асіметрія розподілу з Довгим правимо хвостом позитивна. Если Розподіл має довгий лівий хвіст, то его асіметрія негативна. Далі, если ексцес (показує "гостроту ПіКу" розподілу) істотно відрізняється від 0, то Розподіл має або более заокруглень пік, чем нормальне, або, навпаки, має більш гостре пік (можливо, є декілька піків). Зазвічай, если ексцес позитивний, то пік обострения, если негативний, то пік заокруглень. Ексцес нормального розподілу дорівнює 0.

Більш точну інформацію про форму розподілу можна отріматі с помощью крітеріїв нормальності (например, крітерію Колмогорова-Смирнова або W крітерію Шапіро-Уїлкі). Однако жоден Із ціх крітеріїв НЕ может замініті візуальну перевірку с помощью гістограмі (графіка, что показує частоту Вчення значень змінної в ОКРЕМІ інтервалі).

Гістограма дозволяє "на око" оцініті нормальність емпірічного розподілу. На гістограму такоже накладається крива нормального розподілу. Гістограма дозволяє якісно оцініті Різні характеристики розподілу. Например, на ній можна Побачити, что Розподіл бімодальному (має 2 ПіКу). Це может буті віклікано, например, тім, что вібірка неоднорідна, можливо, вітяглі з двох різніх популяцій, шкірні з якіх більш-Менш нормальна. У таких сітуаціях, щоб зрозуміті природу спостережуваних змінніх, можна спробуваті найти якісний способ поділу Вибірки на две части.

Кінцевою метою первинного статистичного АНАЛІЗУ є визначення, чи Належить побудованій закон до нормального. Причиною цього є ті, что подалі аналіз базується на Перевірці на "нормальність" закону розподілу, тобто Кожний з Наступний етапів почінається цією перевіркою, и в залежності від ВІДПОВІДІ застосовуються Різні методи обчислення.

Статистичні дані, Які були віміряні с помощью програмного забезпечення Statisticaподано в табліці 4.

Таблиця 4. статистичні дані

Нижчих на малюнках подано побудовані гістограмі по Кожній метріці


4. Висновки по ПЕРВИННА Статистичний аналізі

При проведенні первинного статистичного АНАЛІЗУ Було обчислено статічні характеристики Такі, як математичне Сподівання, Середнє квадратичне відхилення, коефіцієнт ексцесу та асіметрії, довірчі інтервалі та визначили закони розподілу.

У відповідності до отриманий Даних можна сделать следующие Висновки:

Метрики з нормальним розподілом

- CYCLO

- NOP

- FOUT

- AMW

- Ефективність (експертна оцінка)

Метрики з ненормальним розподілом

- HIT

- BOvR

- CC

- CDISP

- ATFD

- Зрозумілість інтерфейсу (експертна оцінка)

ЦІ дані будут в подалі використовуват для кореляційного та регресійного АНАЛІЗУ.

5. Кореляційній аналіз з кореляційнімі полями та розрахованімі коефіцієнтамі кореляції, та перевіркамі

Визначення кореляції. Кореляція представляет собою міру залежності змінніх. Найбільш відома кореляція Пірсона. При обчісленні кореляції Пірсона передбачається, что змінні віміряні, як мінімум, у інтервального шкалою. Деякі інші КОЕФІЦІЄНТИ кореляції могут буті обчіслені для Менш інформатівніх шкал. КОЕФІЦІЄНТИ кореляції змінюються в межах від -1.00 до +1.00. Зверніть увагу на крайні значення коефіцієнта кореляції. Значення -1.00 означає, что змінні ма ють суворо негативну кореляцію. Значення +1.00 означає, что змінні ма ють суворо позитивну кореляцію. Відзначімо, что значення 0.00 означає Відсутність кореляції.

Негативна кореляція. Дві змінні могут буті пов'язані таким чином, что при зростанні значень однієї з них значення Іншої зменшуються. Це и показує негативний коефіцієнт кореляції. Про Такі змінні говорять, что смороду негативно корельовані.

Позитивна кореляція. Зв'язок между двома змінними может буті такою - коли значення однієї змінної зростають, значення Іншої змінної такоже зростають. Це и показує позитивний коефіцієнт кореляції. Про Такі змінні говорять, что смороду позитивно корельовані.

Найбільш часто вікорістовуваній коефіцієнт кореляції Пірсона r назівається такоже лінійної кореляцією, тому что вімірює степень лінійніх зв'язків между змінними.

Проста лінійна кореляція (Пірсона r). Кореляція Пірсона (далі називана просто кореляцією) пріпускає, что две розглянуті перемінні віміряні в інтервальній шкалі. Вона візначає степень, З якою значення двох змінніх "пропорційні" один одному. Важліво, что значення коефіцієнта кореляції НЕ Залежить від масштабу віміру. Например, кореляція между зростанням и вагою буде однієї и тієї ж, Незалежності від того, проводилися виміри в дюймах и чи фунтах у сантиметрах и кілограмах. Пропорційність означає просто лінійну залежність. Кореляція висока, если на графіку залежність "можна представіті" прямою лінією (з позитивним чи негативним кутом Нахил).

Помилкові кореляції. Грунтуючись на коефіцієнтах кореляції, ви не можете строго довести причинного залежності между змінними, однак можете візначіті Помилкові кореляції, тобто кореляції, Які обумовлені впливу "других", что залішаються за межами вашого поля зору змінніх. Найкраще зрозуміті Помилкові кореляції на простому прікладі. Відомо, что існує кореляція между Шкода, завдання Пожежа, и кількістю пожежних, начали гасить пожежа. Однако ця кореляція Нічого не говорити про ті, Наскільки зменшаться Втрата, если буде віклікано менше число пожежних. Причина в тому, что є третя змінна яка впліває як на заподіяній збиток, так и на число вікліканіх пожежніків. Если ви будете "контролюваті" Цю змінну, то віхідна кореляція або знікне, або, можливо, даже змініть свой знак. Основна проблема хібної кореляції Полягає в тому, что ві не знаєте, хто є ее агентом. Тім НЕ менше, если ви добре там, де, де шукати, то можна скористати ПРИВАТНІ кореляції, щоб контролюваті (частково віключена) Вплив питань комерційної торгівлі змінніх.

Кореляційній аналіз проводівся с помощью пакету Statistica. Отрімані результати по кореляційному АНАЛІЗУ подано в табліці 4.

Таблиця 5. Результати кореляційного АНАЛІЗУ для пар Прямі метрики-експертні ОЦІНКИ, непрямі метрики-експертні ОЦІНКИ

6. Висновки по кореліційному АНАЛІЗУ

При проведенні кореляційного АНАЛІЗУ Було с помощью пакету Statisticaобчіслено Коефіцієнти для пар метрика-експертна оцінка.

На Основі Отримання Даних, Які подані в табліці 4, можна сделать следующие Висновки:

- Значення коефіцієнтів кореляції для пар «метрика-експертна оцінка», что зображені червоного кольору вказують на залежність между метриками та експертно оцінкою

- Значення коефіцієнтів кореляції для пар «метрика-експертна оцінка», что зображені чорного кольору НЕ залежні между собою

- КОЕФІЦІЄНТИ кореляції НЕ є дуже великим, что дает змогу Сказати, что залежність между метриками та експертними оцінкамі, Які досліджуються в данії курсовій работе, що не є значний.

Дані, что були отрімані при проведені кореляційного АНАЛІЗУ, будут вікорістані з метою проведення регресійного АНАЛІЗУ.


7. Регресійній аналіз з побудованімі лініямі регресій, визначеними функціямі регресій, коефіцієнтамі у функціях та перевіркамі

Загальне призначення множінної регресії (цею срок БУВ Вперше Використання в работе Пірсона - Pearson, 1908) Полягає в аналізі зв'язку между кількома Незалежності змінними (звання такоже регрессорамі або предикторами) и перелогових змінною. Например, агент з продажу нерухомості МІГ бі вносіті в КОЖЕН елемент реєстру розмір будинку (у квадратних Плівка), Кількість спалень, середній дохід населення в цьом районі відповідно до Даних перепису и суб'єктивну оцінку пріваблівості будинку. Як только ця інформація зібрана для різніх будинків, Було б цікаво подивитись, чи пов'язані и Яким чином ЦІ характеристики будинку з ціною, за Якою ВІН БУВ проданий. Например, могло б віявітіся, что Кількість спальних кімнат є Кращим пророкує фактором (предиктором) для ціни продажу будинку в Деяк спеціфічному районі, чем "пріваблівість" будинку (суб'єктивна оцінка). Могли б такоже віявітіся і "Викиди", тобто будинки, Які могли б буті продані дорожча, з Огляду на їхнє Розташування и характеристики.

Фахівці з кадрів Звичайно Використовують процедури множінної регресії для визначення винагороди за адекватно Виконання роботу. Можна візначіті Деяк Кількість факторів або параметрів, таких, як "розмір відповідальності" (Resp) або "число підлеглих" (No_Super), Які, як очікується, вплівають на ВАРТІСТЬ роботи. Кадровий аналітик потім проводити дослідження Розмірів окладів (Salary) среди порівнянніх компаний на Сайти Вся, запісуючі розмір Платні та відповідні характеристики (тобто значення параметрів) по різніх позіціях.



8. Висновки по регресійному АНАЛІЗУ

Для проведення регресійного АНАЛІЗУ БУВ Використання пакет Statistica. За его помощью Було автоматично побудовали Лінії регресії для пар метрика-експертна оцінка, визначили Функції регресії.

На Основі Отримання Даних можна сделать следующие Висновки:

- В основному присутности лінійна регресія

- З побудованіх графіків можна сделать Висновок, что Переважно більшість пар «метрика-експертна» дуже слабо повязані.


9. Загальні Висновки

При віконанні даної курсової роботи Було засвоєно теоретичні та Практичні навички. На Основі Отримання даних по ПЕРВИННА статичному, кореляційному та регресійному аналізі можна сделать следующие Висновки:

Було визначили:

· Метрики з нормальним розподілом

- CYCLO

- NOP

- FOUT

- AMW

- Ефективність (експертна оцінка)

· Метрики з ненормальним розподілом

- HIT

- BOvR

- CC

- CDISP

- ATFD

- Зрозумілість інтерфейсу (експертна оцінка)

Було оцінено значення отриманий коефіцієнтів кореляції

- КОЕФІЦІЄНТИ кореляції НЕ є дуже великим, что дает змогу Сказати, что залежність между метриками та експертними оцінкамі, Які досліджуються в даній курсовій работе, що не є значними.

На Основі регресійного АНАЛІЗУ можна сделать Висновок, что:

- В основному присутности лінійна регресія

- Переважно більшість пар «метрика-експертна» дуже слабо повязані.


Головна сторінка


    Головна сторінка



Побудова залежності между метриками та експертно оцінкою програмного забезпечення

Скачати 22.53 Kb.