ТЕМА 6. Середні величини та їх застосування у правовій статистиці
Зміст сторінки:
ТЕМА 6. Середні
величини та їх застосування у правовій статистиці
1. Поняття середньої величини
Якби всі
елементи сукупності робили рівні внески
у загальний обсяг ознаки, то одним числом можна було б характеризувати всі
елементи одразу. Але внесок одних більший, інших – менший. Тому ці різні
елементи характеризують умовною величиною – середнім рівнем.
Для свого
розрахунку середня величина вимагає двох конкретних параметрів:
– загального обсягу ознаки по сукупності;
– чисельності сукупності.
ПРИКЛАД – розрахунок середньої зарплати вимагає знання всього фонду оплати праці
(загальний обсяг ознаки) і чисельності працівників. Для розрахунку середньої
величини нам не потрібна інформація про значення ознаки у окремих елементів –
нам потрібна величина загального обсягу ознаки по сукупності і чисельність елементів в сукупності.
Таким чином розрахунок середньої зводиться до відповіді
на наступне питання: якщо загальний
обсяг ознаки порівну (рівномірно) розподілити по всіх елементах сукупності, то
яка величина ознаки припаде на кожний елемент
Середній рівень за своєю
суттю – це результат штучної “урівняловки”. Він дорівнює тій величині, яка
утвориться після виконання вимоги: загальний обсяг ознаки поділити на всіх порівну.
Іноді це ефективний підхід, іноді не дуже.
ПРИКЛАД. Якщо у палаті шпиталю,
де температура повітря складає 23 С лежать чотири пацієнта з температурою 40 С,
а один помер і має температуру
навколишнього середовища, то середня температура у пацієнтів цієї палати буде
дорівнювати 36,6 С.
Таким чином, середньою величиною у статистиці називається узагальнююча характеристика
сукупності однотипних явищ з будь-якої варіаційної ознаки, що показує рівень
ознаки, розрахований на одиницю сукупності.
Разом із методом групувань середні величини у
статистиці є одним з основних методів опрацювання й аналізу масових даних.
Значення середніх
величин у тому, що вони:
•
допомагають в аналізі, даючи змогу кількісно охарактеризувати найважливіші
закономірності суспільного життя, що проявляються у зростанні середньої
продуктивності праці, зниженні середнього рівня злочинності, середніх витрат
сировини та матеріалів, електроенергії та ін.;
•
широко застосовуються у практиці планування діяльності. Планові завдання складаються
на основі середніх норм виробітку, витрат матеріалів тощо;
•
необхідні для вивчення взаємозв’язків між досліджуваними ознаками та діючими на
них факторами.
У правовій статистиці середні величини використовуються для обчислення:
– середнього терміну розгляду справ,
– середньої кількості справ на одного працівника суду,
– середньої чисельності осіб, що припадають на одну
кримінальну справу,
– середнього віку засуджених.
За
допомогою середніх величин можна порівняти судову практику призначення карних
покарань у двох районах (областях), схожих за рівнем і структурою злочинності.
Середні величини дають правильну характеристику сукупності суспільних явищ,
якщо дотримуються такі умови їх застосування:
1.
Середні величини повинні обчислюватися тільки для якісно однорідних сукупностей
стосовно досліджуваної ознаки. Якісна однорідність сукупності визначається
попереднім економічним аналізом.
Чи можна вважати середню заробітну плату правильною,
наприклад, для такого випадку: три чоловіки за місяць заробили 200, 100 і 1200
грн. Середня заробітна плата: (200 + 100 + 1200) : 3 = 500 грн.
Математично обчислено правильно. Але середня величина у
статистиці – це не просто математична величина, а категорія об’єктивної
дійсності. У нашому прикладі за рівнем заробітної плати ці люди належать до
різних категорій працівників, і тому така середня неправильно відображає
об’єктивну дійсність.
2.
Метод середніх величин потрібно поєднувати з методом групувань. Неоднорідну сукупність
необхідно розбити на однорідні групи. Замість загальної середньої величини,
треба обчислити середні для однорідних груп.
3.
Середні для об’єктивнішого аналізу необхідно доповнювати індивідуальними значеннями
ознак, тому що середня гасить будь-які індивідуальні відхилення. За
благополучними середніми приховуються хиби на окремих ділянках роботи або якісь
досягнення.
4.
Середні величини мають обчислюватися не на основі поодиноких фактів, а масових
суспільних явищ відповідно до закону великих чисел. Тоді взаємознищуються
можливі випадкові відхилення і середня величина правильно характеризує типовий
розмір ознаки.
5. Необхідно знайти правильний спосіб обчислення
середньої величини. Статистика використовує багато видів середніх величин. Але
правильну характеристику сукупності з варіюючої ознаки дає тільки один вид
середньої величини.
2. Види середніх величин
Всі середні величини розподіляються на два
класи:
Ступеневі середні залежно від наявної вихідної
інформації можуть бути простими та зваженими.
Проста середня застосовується коли представлені незгруповані дані і має такий вигляд:
—
де х – середня певного
ступеня; m – показник ступеня
середньої, Хі – варіанта
або значення ознаки, яка має різне значення в досліджуваній сукупності, n – число варіант (число одиниць
сукупності); – знак суми (сігма велика).
При розрахунку середнього віку засуджених,
середнього строку позбавлення волі, середнього навантаження на одного суддю
одна і та ж варіанта (Х) може повторюватися декілька разів, декілька десятків
разів або навіть тисяч разів, тобто повторюватися з тією чи іншою частотою.
Тому якщо дані представлені згруповано, то до
вказаної формули вводиться символ f –
частота і розрахунок проводиться за формулою зваженої середньої,
загальний вигляд якої такий:
__
де х – зважена ступенева
середня; Хі – варіанта
усереднюваної ознаки, або середина інтервалу, m – показник ступеня середньої, fі– частота, яка показує скільки разів зустрічається варіанта.
Отже, можна сказати, що вибір звичайної середньої
або зваженої визначається тим статистичним матеріалом, який необхідно
проаналізувати.
Правильну
характеристику сукупності з варіаційної ознаки у кожному окремому випадку дає
тільки один цілком визначений вид середньої. Він зумовлений існуючими зв’язками
між середньою та елементами, від яких вона залежить.
Формально середніх є безкінечно багато, але
практичне застосування мають не більше десятка з них, які по суті є різним
проявом двох: середньої арифметичної, та середньої геометричної.
Крім
ступеневих середніх величин, у правовій статистиці застосовуються структурні середні величини, які є
описовими характеристиками ряду розподілу ознаки – мода(Мо) і медіана(Me).
3. Ступеневі середні
Залежно від мети дослідження обирається вид
ступеневої середньої (арифметичної, геометричної тощо)
Середня арифметична являє собою відношення сумарної величини всіх варіант ознаки до їх чисельності.
Розглянемо
розрахунок середньої арифметичної на
прикладі:
річне навантаження 8
суддів міського суду, що спеціалізуються на розгляді цивільних справ, становило:
20, 40, 55, 70, 40, 20, 70, 40. Необхідно обчислити середнє річне навантаження
на одного суддю. Застосовуємо
Розрахунок
проведений за середньою арифметичною простою. Вона застосовується, коли дані не
згруповані або частоти однакові.
Якщо
б ці дані були представлені у такому вигляді:
При
розрахунку середньої арифметичної часто не обов’язково знати вагу кожного індивідуального
значення (варіант). В офіційній статистичній звітності є сумарні розміри. На
основі цих узагальнених показників можна обчислити середню арифметичну
величину.
В
тому ж самому прикладі, знаючи кількість суддів (8) та їх загальне навантаження
(20 + 40 + 55 + 70 + 40 + 20 + 70 + 40 = 315) можна розрахувати їх середнє навантаження:
315 : 7 = 45 справ
Ускладнюється
розрахунок середньої арифметичної, якщо дані для розрахунку представлені у
вигляді інтервального варіаційного ряду. Для цього інтервальний ряд потрібно
перетворити у дискретний, тобто визначити середину інтервалу як напівсуму
мінімального та максимального значення ознаки у кожній групі. І до формули як Хі підставляється значення
середини кожного інтервалу.
Середня геометрична величина
Деякі явища характеризуються тим, що загальний обсяг
ознаки по сукупності визначається не сумою елементів, а їх добутком.
Наприклад, у районі за
1998 рік було зареєстровано 20913 злочинів, а в 2007р.– 31308 (2007
– 1998 = 9). Середньорічний темп зростання зареєстрованих злочинів становив:
тобто
з 1998 по 2007 р. злочинність щорічно збільшувалася на 4,6 %.
Якщо
відомі темпи динаміки за кожний рік, то розраховується середній темп зростання
за весь період за формулою
де х1, х2, …, хп – ланцюгові темпи динаміки; п – кількість ланцюгових
темпів динаміки.
Наприклад,
кількість зареєстрованих злочинів у місті збільшилася:
у 2002 р. |
на 13,1 %, або в |
1,131 рази; |
у 2003 р. |
на 12%, або в |
1,12 рази; |
у 2004 р. |
на 11,5 %, або в |
1,115 рази; |
у 2005 р. |
на 1 1 %, або в |
1,11 рази; |
у 2006 р. |
на 12%, або в |
1,12 рази; |
у 2007 р. |
на -14,4 %, або в |
0,856 рази. |
Середній
річний темп динаміки зростання за ці роки становить:
Якщо
маємо темпи динаміки явища за певний відомий період, то розрахунок роблять за
першою формулою.
Припустімо,
з 1993 по 2002 р. злочинність у місті зросла в 1,5 раза. Отже, середньорічний
темп зростання злочинності можна обчислити так:
4. Структурні середні
Середні
структурні застосовуються для вивчення внутрішньої побудови рядів розподілу, а
також для оцінки середніх величин ступеневого типу, якщо за представленою
інформацією її розрахунок не може бути виконаний.
Якщо
ми звернемося до таблиці 4, то модою
даного варіаційного ряду буде 40 справ, тому що троє суддів працюють з такою
кількістю цивільних справ.
У дискретному ряду розподілу модою буде варіанта, що має найбільшу частоту.
Якщо
ж дані представлені у вигляді інтервального варіаційного ряду, то визначити найбільшу
варіанту ми зможемо лише для якогось певного інтервалу, а конкретне значення
моди в інтервальному ряду розподілу обчислюється за формулою:
де хо – мінімальна межа модального інтервалу;і – розмір модального інтервалу; fМо– частота модального інтервалу; fМо-1– частота інтервалу, що передує модальному; fMo+1 – частота
інтервалу, що стоїть за модальним.
Якщо у нас є
дані, що строки позбавлення волі:
до 3 років – 10 засуджених;
від 3 до 5 років – 15 засуджених;
від 5 років до 10 – 7 засуджених;
більше 10 років – 2 засуджених
Обчислимо
модальне число строків позбавлення волі. Спочатку визначимо модальний інтервал.
Модальним буде інтервал 3-5 років, тому що він має найбільшу частоту fМо = 15.
Підставимо
значення у формулу:
Отже,
найпоширеніший строк позбавлення волі – 4 роки.
Медіаною у правовій
статистиці називається варіанта, що розташована в середині рангованого ряду і
поділяє його навпіл (Me).
Щоб
визначити медіану в дискретному ряду з
непарною кількістю членів ряду, потрібно суму частот ділити на 2 і додати
0,5. Так визначають номер, під яким стоїть медіана в рангованому ряду (тобто в
ряду, в якому варіанти розташовані від найменшої до найбільшої по порядку).
Якщо
ж в ряду парна кількість членів, то в
цьому випадку медіаною буде середня із двох центральних варіант, порядкові
номера яких n:2 та n:2+1.
Наприклад навантаження 8 суддів
міського суду, що спеціалізуються на розгляді цивільних справ, становило: 20,
40, 55, 70, 40, 20, 70, 40.
Спочатку
слід розташувати всі варіанти від меншої до найбільшої
20 |
20 |
40 |
40 |
40 |
55 |
70 |
70 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
В ряду парна
кількість членів, тому медіаною буде середня з варіант, розташованих під 4 і 5
номером (8:2=4 і 8:2+1=5), тобто 40 справ.
В
інтервальному ряду медіана обчислюється за формулою
де x0 – мінімальна межа
медіанного інтервалу; f – величина
медіанного інтервалу; SMe-1 , – сума накопичених частот, що
передує медіанному інтервалу fMe– частота медіанного
інтервалу.
Спочатку
визначаємо медіанний інтервал. Для цього суму частот ділимо навпіл i додаємо
0,5. Так знаходимо номер, під яким повинна міститися медіана. Щоб знайти
інтервал, який стоїть під цим номером, робимо накопичення частот до потрібного
номера (тобто складаємо частоти кожного інтервалу, поки сума частот не буде
дорівнювати або бути більшою за n:2+0,5, значить в останньому інтервалі,
частоту якого накопичували і знаходиться медіана ряду).
На відміну від середніх, що є своєрідного
статистичною абстракцією, мода і медіана – величини конкретні. На практиці
іноді використовують моду замість середньої арифметичної або разом із нею.
5. Показники варіації
Середні
величини дають узагальнену характеристику варіюючої ознаки досліджуваної
сукупності. Розрахувавши їх, необхідно усвідомити, наскільки вони типові,
надійні та наскільки однорідна сукупність за досліджуваною ознакою.
Статистичні
сукупності можуть мати однакові значення середньої, але значно відрізнятися
коливаннями індивідуальних даних. За характером і ступенем відхилення
(варіації) ознаки можна зробити висновок щодо якісної однорідності статистичної
сукупності та надійності самої середньої.
Нариклад, в одному випадку навантаження 10 суддів міського
суду, що спеціалізуються на розгляді цивільних справ, становило:
20, 40, 55, 70, 40, 20, 70, 40 справ, Х1 =44 справи,
у іншому –
10, 20, 20, 10, 80, 55, 60, 100 справ, Х2 =44 справи.
Таким
чином, середні величини рівні, а ряди істотно різняться між собою: перший ряд
однорідніший, а отже, i середня надійніша, ніж у другому ряду.
Вивчення
варіації ознаки дає можливість визначити, які чинники і якою мірою впливають на
розмір досліджуваних ознак.
Вивчення
варіації ознаки необхідно для наукової організації вибіркового спостереження,
дисперсійного і кореляційного аналізу.
Для
вивчення варіації ознаки використовують такі показники:
• розмах
варіації (R),
• середнє
лінійне відхилення (d),
• дисперсія
і середнє квадратичне відхилення (а2, о),
•
коефіцієнт варіації ( ),
Розмах варіації – це різниця між найбільшим і найменшим значенням ознаки:R = Хтах -Хтіп. Для нашого прикладу:
R1 =70-20 = 50 справ,
R2 =100-10 =90 справ.
Розходження
істотні: R2 R1, в 1,8 рази.
Розмах
варіації відображає відхилення тільки крайніх значень ознаки, які часто бувають
нетиповими або мають випадковий характер. Тому цей показник використовують для
попередньої оцінки варіації.
Набагато
точнішою буде характеристика варіації, якщо показник враховуватиме відхилення
кожної варіанти від середньої. Відхилень при цьому утвориться стільки, скільки
самих варіант. Тому для узагальненої характеристики величини усіх відхилень
необхідно обчислити їх середню величину. Розрахунок ускладнюється тим, що сума
всіх відхилень варіант від середньої величини дорівнює нулю, тому середнє
відхилення варіант від середньої величини не можна обчислити як середню
арифметичну.
У
зв’язку з цим знаходять середню з модулів або з квадратів відхилення, одержуючи
при цьому відповідно середнє лінійне
відхилення або дисперсію.
Середнє лінійне відхилення являє собою
середню арифметичну з абсолютних значень (модулів) відхилень окремих значень
варіаційної ознаки від його середнього значення.
Середнє
лінійне відхилення обчислюється за такими формулами:
для
незгрупованих даних
для
згрупованих даних, коли частоти різні,
Через
ігнорування знака цей показник варіації менш популярний, ніж дисперсія і
середнє квадратичне відхилення.
Дисперсія – це середня величина із квадратів відхилень варіант, від середньої величини ( 2), а корінь квадратний із дисперсії
називається середнім квадратичним
відхиленням ( ).
Дисперсія
та середнє квадратичне відхилення обчислюється за формулами:
Дисперсія
і середнє квадратичне відхилення є найпоширенішими й загальновідомими абсолютними
показниками варіації досліджуваної ознаки.
Усі
розглянуті показники варіації характеризують абсолютний розмір відхилення виражаються
в тих самих одиницях виміру, в яких виражені варіанти і середня. Для
порівняльної характеристики варіації рядів із різними рівнями застосовується
відносний показник варіації – коефіцієнт
варіації.
Коефіцієнт варіації – це відношення середнього квадратичного відхилення до
середньої величини, виражений у відсотках:
Він
більш наочно характеризує варіацію ознаки і є певною мірою критерієм надійності
середньої. Якщо коефіцієнт варіації більший 40 % (а в деяких випадках 33 %), то
це означає, що середня не дуже надійна для даної сукупності і сукупність за
цією ознакою неоднорідна.