Випадкова величина ε, або обурення, включає вплив врахованих в моделі факторів, випадкових помилок і особливостей вимірювання.
Випадкова величина ε, або обурення, включає вплив неврахованих в моделі факторів, що не випадкових помилок і особливостей вимірювання.
9.Какое джерелами обумовлено присутність в моделі регресійного рівняння випадкової величини ε?
Її присутність в моделі обумовлено двома джерелами: специфікацією моделі, вибірковим характером вихідних даних.
Її присутність в моделі обумовлено двома джерелами: вибірковим характером вихідних даних, особливостями виміру змінних.
Її присутність в моделі обумовлено двома джерелами: специфікацією моделі, особливостями виміру змінних.
Її присутність в моделі не обумовлено трьома джерелами: специфікацією моделі, вибірковим характером вихідних даних, особливостями виміру змінних.
10.Относітся чи неврахування в рівнянні регресії якого-небудь істотного фактора до помилок специфікації?
До помилок специфікації не відноситиметься не тільки неправильний вибір тієї чи іншої математичної функції, але і недооблік в рівнянні регресії якого-небудь істотного фактора, наприклад використання парної регресії замість множинною.
До помилок специфікації буде ставитися тільки неправильний вибір тієї чи іншої математичної функції, але і недооблік в рівнянні регресії якого-небудь істотного фактора, наприклад використання парної регресії замість множинною.
До помилок специфікації буде ставитися не тільки неправильний вибір тієї чи іншої математичної функції, але і обов'язкове врахування в рівнянні регресії якого-небудь істотного фактора, наприклад використання парної регресії замість множинною.
До помилок специфікації буде ставитися не тільки неправильний вибір тієї чи іншої математичної функції, але і недооблік в рівнянні регресії якого-небудь істотного фактора, наприклад використання парної регресії замість множинною.
До помилок специфікації буде ставитися не тільки неправильний вибір тієї чи іншої математичної функції, але і недооблік в рівнянні регресії якого-небудь істотного фактора, наприклад невикористання парної регресії замість множинною.
11.Когда рівняння регресії не має практичного сенсу і що роблять, щоб отримати практичний сенс від рівняння регресії?
Якщо сукупність даних неоднорідна, то рівняння регресії не має практичного сенсу. Для отримання хорошого результату зазвичай виключають із сукупності дані з аномальними значеннями досліджуваних ознак.
Якщо сукупність даних неоднорідна, то рівняння регресії не має практичного сенсу. Для отримання хорошого результату зазвичай виключають із сукупності дані з аномальними значеннями досліджуваних ознак.
Якщо сукупність даних неоднорідна, то рівняння регресії має практичний сенс. Для отримання хорошого результату зазвичай виключають із сукупності дані з аномальними значеннями досліджуваних ознак.
Якщо сукупність даних неоднорідна, то рівняння регресії не має практичного сенсу. Для отримання поганого результатузазвичай виключають із сукупності дані з аномальними значеннями досліджуваних ознак.
Якщо сукупність даних неоднорідна, то рівняння регресії не має практичного сенсу. Для отримання хорошого результату зазвичай не виключають із сукупності дані з аномальними значеннями досліджуваних ознак.
12.Як небезпеку в практичному використанні методів регресії представляють помилки вимірювання?
" |
статистична сукупність-
сукупність називається однорідною,
різнорідної.
Питання 2. Ознаки та їх класифікація
ознака- це якісна особливість одиниці сукупності. За характером відображення властивостей одиниць досліджуваної сукупності ознаки діляться на дві основні групи;
ознаки, які мають безпосереднє кількісне вираження,наприклад вік, стаж роботи, середній заробіток і т. д. Вони можуть бути дискретними і безперервними;
ознаки, що не мають безпосереднього кількісного вираження.У цьому випадку окремі одиниці сукупності розрізняються своїм змістом (наприклад, галузі - деревина, мінеральні продукти, продтовари і т. Д.). Такі ознаки зазвичай називають атрибутивними(В філософії «атрибут» - невід'ємна властивість предмета).
Особливістю статистичного дослідження є те, що в ньому вивчаються тільки варіюють ознаки, т. Е. Ознаки, які беруть різні значення(Для атрибутивних ознак) або мають різні кількісні рівні в окремих одиниць сукупності.
варіація -це зміна величини або значення ознаки при переході від одного об'єкта (або групи об'єктів) до іншого; точніше кажучи - від однієї одиниці сукупності до іншої. Зазвичай під варіацією ми розуміємо обумовлене перехрещуються впливом різних факторів на дане явище зміна величин тільки в межах однорідної сукупності.
Якщо ж зміни досліджуваного явища відбуваються в різні періоди часу, причому носять характер закономірності, то говорять вже не про варіації ознаки, а про його динаміці.
Питання 3. Статистичний показник, система статистичних показників
Статистичний показник - цепоняття (категорія), що відображає кількісні характеристики (розміри) співвідношення ознак суспільних явищ. Статистичні показники можуть бути об'ємними (чисельність населення, обсяг продажів, товарообіг) і розрахунковими (середні величини). Вони можуть бути плановими, звітними і прогностичними (тобто виступати в якості прогнозних оцінок). Статистичні показники слід відрізняти від статистичних даних. Статистичні данні- це конкретні чисельні значення статистичних показників. Вони завжди визначені не тільки якісно, але і кількісно і залежать від конкретних умов місця і часу.
Завданнями статистики в цьому напрямку є:
а) правильне визначення змісту статистичного показника (валового національного продукту, Національного доходу, експорту, імпорту та інші аналогічні. П.);
б) розробка методології розрахунку статистичного показника.
Атрибути статистичного показника:
1. Якісна сторона: об'єкт, його властивість, категорія.
2. Кількісна сторона: число і одиниці вимірювання.
3. Територіальні, галузеві та інші межі об'єкта.
4. Інтервал або момент часу.
Система статистичних показників- це сукупність статистичних показників, яка відображає взаємозв'язки, які об'єктивно існують між явищами. Для кожної суспільно-економічної формації характерна певна система взаємозв'язку суспільних явищ. Тому утворюють систему і статистичні показники.
Система статистичних показників охоплює всі сторони життя суспільства на різних рівнях: країни, регіону - макрорівень; підприємств, фірм, об'єднань і т. д. - мікрорівень.
Системи статистичних показників мають такі особливості:
1) вони носять історичний характер - змінюються умови життя населення, суспільства, змінюються і системи статистичних показників;
2) методологія розрахунку статистичних показників безперервно удосконалюється.
Питання 4. Статистична закономірність. Закон великих чисел
статистична закономірність
- причинно-наслідкові зв'язки, які проявляються в послідовності, повторюваності, регулярності масових явищ і процесів суспільного життя, що відносяться до певного простору і часу.
Закономірності, в яких необхідність нерозривно пов'язана в кожному окремому явищі з випадковістю і лише в безлічі явищ виявляє себе як закон, називаються статистичними.
Статистичні закономірності мають властивість стійкості, тобто стабільності і повторюваності при повторних спостереженнях.
Статистичні закономірності вивчають розподіл одиниць статистичного безлічі за окремими ознаками під впливом всієї сукупності факторів.
Статистична закономірність виступає як об'єктивна закономірність складного масового процесу і є формою причинного зв'язку. Вона виявляється в результаті масового статистичного спостереження. Цим обумовлюється її зв'язок з законом великих чисел.
Статистична закономірність з певною ймовірністю гарантує стійкість середніх величин при збереженні постійного комплексу умов, що породжують дане явище.
Властивість статистичних закономірностей- проявлятися лише в масі явищ при узагальненні даних по досить великому числу одиниць, отримало назву закон великих чисел.
Закон великих чиселв найбільш простій формі свідчить, Що кількісні закономірності масових явищ виразно проявляються лише в досить великому їх числі.
сутність- в числах, які утворюються в результаті масового спостереження, виступають певні правильності, які не можуть бути виявлені в невеликому числі фактів.
Закон великих чисел висловлює діалектику випадкового і необхідного. В результаті Взаємопогашення випадкових відхилень середні величини, обчислені для величини одного і того ж виду, стають типовими, що відображають дії постійних і істотних фактів в даних умовах місця і часу.
Тенденції та закономірності, розкриті за допомогою закону великих чисел, мають силу лише як масові тенденції, але не як закони для кожного окремого випадку.
він характеризує лише одну з форм прояву закономірностей в масових кількісних відносиних.
Так, ціни на окремі товари можуть знижуватися, на інші - підвищуватися, але сукупна зміна цін на всі споживчі товари і послуги свідчить про неухильне зростання цін. Статистичні сукупності часто називають масовими явищами.
Питання 7. Класифікація стат.сводкі і угруповання.
Класифікація зведення
від глибини обробки первинної інформації, Отриманої в результаті статистичного спостереження:
· Просту;
· Складну.
проста зведенняпередбачає підрахунок загальних підсумків по всій сукупності одиниць статистичного спостереження. При цьому визначається загальний обсяг досліджуваного явища.
складна зведенняявляє собою комплекс процедур, які включають угруповання одиниць сукупності, підрахунок підсумків характеристик одиниць сукупності по кожній групі і за сукупністю в цілому, а також представлення отриманих результатів у вигляді статистичних таблиць.
За ознакою форми обробки інформації:
· Централізовану;
· Децентралізовану.
централізована зведенняпередбачає концентрацію всієї вихідної статистичної інформації в одному органі (Росстат, ФТС ..), в якому він повністю обробляється При децентралізованої зведенніузагальнення вихідних даних проводиться послідовними етапами знизу доверху по ієрархічній системі (статистична звітність).
Залежно від техніки виконання:
· автоматизованої
· Ручний.
Класифікація угруповання
Залежно від числа покладених в їх основу ознак:
· прості
· Багатовимірні (складні)
Угруповання, виконана за однією ознакою, називається простий.
Багатовимірна (складна) угруповання проводиться за двома і більше ознаками. Окремим випадком багатовимірної угруповання є комбінаційна угруповання, що базується на двох і більше ознаках, взятих у взаємозв'язку, в комбінації.
За відносинам між ознаками:
· ієрархічні
· неієрархічні
Ієрархічні угрупування виконуються за двома і більше ознаками, при цьому значення другої ознаки визначаються областю значень першого (наприклад, класифікація галузей промисловості за підгалузями, товарних груп - за товарними позиціями і т.д.).
Неієрархічні (наприклад, угруповання за товарними групами в розрізі митниць або країн і т.д.).
За черговості обробки інформації:
· первічние (складені на основі первинних даних)
· І вторинні, що є результатом перегрупування раніше вже згрупованих даних.
Статистичні угрупування і класифікації ділять по переслідуваним цілям:
· типологічна,виділення якісно однорідних сукупностей
· структурна,вивчення структури сукупності
· аналітична (факторна) дослідження існуючих залежностей
Питання 9. Ряди розподілу. Атрибутивні і варіаційні ряди розподілу
Результати зведення або угруповання стат.наблюденія представляють собою статистичні ряди розподілу.
При цьому ряди розподілу утворені за якісним ознакою називають атрибутами. (Наприклад, розподіл експорту або імпорту за товарними групами, по митницях, характеру угоди, категоріям учасників ЗЕД).
Якщо в якості угруповання виступає кількісний ознака, то виходить варіаційний ряд розподілу.
Атрибутивні ряди розподілу
Вивчення структури в розрізі атрибутивних ознак доцільно проводити по об'ємним показниками, таким як експорт, імпорт. Так, експорт (імпорт) можна поділяти за всіма тими ознаками, які відображені в ВМД (товарні групи, країни, галузі промисловості, митні режими тощо).
Елементом структури атрибутивного ряду є групи значень, об'єднаних за якісною ознакою (структура галузей промисловості, країна, товарна позиція). Для більш наочного опису структури ряду розподілу використовують відносні величини (частки,%). Ще більш наочним є графічне зображення.
Предмет вивчення варіаційних рядів - підрахунок частоти народження значень досліджуваного показника і аналіз частоти характеристик
Будь-варіаційний ряд складається з елементів: варіантів і частот.
Варіантами (х) називаються окремі значення ознаки, які він приймає в варіаційному ряду, тобто значення варьирующего ознаки.
Частоти (/) - це чисельність окремих варіантів або кожної групи варіаційного ряду, тобто це числа, що показують, як часто зустрічаються ті чи інші варіанти в ряду розподілу. Сума всіх частот визначає чисельність сукупності, Її обсяг. Наприклад, при дослідженні середньої ціни товару, частотою буде кількість кілограмів товару, ціна якого потрапляє в певний інтервал.
Частість, або відносна частота (м) -це відношення частоти до обсягу всієї сукупності, тобто частота, виражена у відсотках до підсумку.
При проведенні варіаційного аналізу вихідні дані групуються у вигляді ряду розподілу, розраховуються статистичні характеристики, Що описують форму розподілу, будується його графік. Потім робиться висновок про співвідношення закономірності і випадковості.
~ У статистиці варіаційні ряди діляться на дискретні, в яких значення ознаки виражені у вигляді ізольованих величин (найчастіше цілих), і інтервальні (безперервні), де значення ознаки задані певним інтервалом. Наприклад, учасники ЗЕД по товарообігу розділені на групи: 1000-10000 дол., 10000-20000 дол.
Статистичний розподіл дискретного варіаційного ряду- це перелік варіантів у зростаючому порядку і відповідних їм частот (відносних частот).
Статистичний розподіл безперервного варіаційного ряду- це послідовність інтервалів в порядку зростання і відповідних їм частот (як частоти, що відповідає інтервалу, беруть суму варіантів, які потрапили в цей інтервал)
прості таблиці
Прості таблиці мають в підметі перелік одиниць сукупності, часу або територій.
групові таблиці
Груповими називаються таблиці, мають в підметі угруповання одиниць сукупності за однією ознакою.
комбінаційні таблиці
Комбінаційні таблиці мають в підметі угруповання одиниць сукупності за двома або більше ознаками.
За характером розробки показників присудка розрізняють:
§ таблиці з простою розробкою показників присудка, в яких має місце паралельне розташування показників присудка.
§ таблиці зі складною розробкою показників присудка, в яких має місце комбінування показників присудка: всередині груп, утворених за однією ознакою, виділяють підгрупи за іншою ознакою.
Для досягнення найбільшої виразності статистичної таблиці необхідно при її оформленні дотримуватися певних правил
1 Форма статистичної таблиці повинна бути узгоджена з раніше існуючими таблицями для забезпечення можливості порівняння даних за ряд відрізків часу
2 Назва таблиці (загальний заголовок) повинна коротко і точно характеризувати основний її зміст Ця вимога в рівній мірі стосується і назв підмета і присудка таблиці Якщо загальний заголовок недостатньо детально сформульований, то можна зробити примітки до нього.
3 В таблиці повинно бути вказано, який території або якого періоду або моменту часу до наведені дані, а також характер цих даних (фактич, норматив., Розрахункові і т д.).
4 Показники таблиці повинні мати одиниці виміру
5 Всі числові значення даного показника відзначаються з однаковою точністю і ін.
відносні величини
відносні величиниявляють собою частку від ділення двох величин і характеризують кількісне співвідношення між ними.
При розрахунку відносних величин слід мати на увазі, що в чисельнике завжди знаходиться показник, що відображає те явище, яке вивчається, а в знаменнику- показник, з яким проводиться порівняння, що приймається за основу або базу порівняння.
У завис-ти від бази порівняння-результатвідносини може бути виражений у формі коефіцієнта або%.
Якщо значення підстави або бази порівняння приймається за одиницю (прирівнюється до одиниці), то відносна величина (результат порівняння) є коефіцієнтом і показує, у скільки разів яка вивчалася величина більше підстави. (Тільки якщо порівнювана величина істотно більше тієї, з якою вона порівнюється.) Якщо значення підстави або базу порівняння прийняти за 100%, результат обчислення відносної величини виражатиметься також в%.
За своїм значенням вони поділяються на відносні величини структури, порівняння, динаміки, інтенсивності, координації.
відносні величини структурихарактеризують склад досліджуваних сукупностей, обчислюються як відношення абсолютної величини кожного з елементів угруповання до загального обсягу, тобто як відношення частини до цілого. Порівнюючи відносні величини структури за різні періоди можна простежити структурні зміни. (Удел.вес (частку) експорту і імпорту в обсязі зовнішньоторговельного обороту .... А на частку експорту - 3: 4 * 100 = 75%).
відносні величини порівняннявідображають кількісне співвідношення однойменних показників, тобто показують у скільки разів (або на скільки%) один показник більше (менше) іншого. (Коефіцієнт покриття імпорту експортом. - експорт перевищує імпорт в. = 3 рази.)
відносні величини динамікихарактеризують зміну досліджуваного явища в часі, тобто показують у скільки разів або на скільки%, рівень звітного періоду більше або менше рівня базисного періоду. (Базис або ланцюгової)
інтенсивності- скільки одиниць однієї сукупності припадає на одиницю іншої. Розраховуються розподілом абсолютної величини однієї сукупності досліджуваного явища на величину, що характеризує обсяг середовища. (На 1 співробітника в рік довелося - 500 декларацій).
координації- співвідношення між окремими частинами стат. сукупності, і показує у скільки разів порівнювана частина більше або менше частині, яка приймається за базу порівняння. Відносна величина координації розраховується наступним образом.650 6500 = 10%, тобто на 10 осіб з вищою освітоюприпадає 1 чол. із середньою технічною.
Середні величини
згладжування відмінностей у величині ознаки, які виникають з тих чи інших причин. Середня величина - один з найпоширеніших способів узагальнень кількісних показників.
Розглянемо ознака x(осередненою ознака), по якому необхідно знайти середнє значення . Значення осредняемого ознаки представлені поруч індивідуальних значень або варіант (х 1, х 2, х 3 ... .х n) (Наприклад, варіаційним рядом) з частотамиіндивідуальних значень (f 1, f 2, f 3, ... f n).
Серед. величина вимір-ся в тій же розмір-ти, що і ознака.
Кожна середня величина характеризує досліджувану сукупність за будь-якою однією ознакою.
сумарні
* Середня арифметична;
* Середня геометрична;
* Середня гармонійна;
Середня арифметичнавикористовується для характеристики абсолютних величин.
1. Якщо кожне значення ознаки в ряду зустрічається по одному разу, розрахунок проводиться за формулою простої (сума всіх значень, поділена на число цих значень ,
де x 1, x 2–
знач-я ознаки (ціна)
n -кількість значень.
2. Якщо один і той же значення ознаки зустрічається кілька разів, використовують формулу середньої арифметичної зваженої. ,
f i- частота повторення цієї ознаки (вага товару).
Середнє арифметичне розраховується по різному в дискретних та інтервальних варіаційних рядах.
У дискретних рядах варіанти ознаки множаться на частоти, ці твори підсумовуються і отримана сума творів ділиться на суму частот.
В інтервальних рядах значення ознаки задано у вигляді інтервалів, тому потрібно перейти до дискретного. Як варіанти X i використовується середина відповідних інтервалів. - як полусумма нижньої і верхньої меж.
середньої гармонійноївелічінойназивают величину, розраховану з зворотних значень варьирующего ознаки. Вона застосовується і як узагальнююча характеристика відносних величин.
Середня гармонійна проста:
Середня гармонійна зважена:
,
середньої геометричноїприйнято називати величину, що обчислюється як корінь n-ної ступеня з добутку nокремих варіантів ознаки.
Вона також зазвичай використовується для характеристики відносних величин і розраховується за формулою:
,
У випадках, коли деякі або всі варіанти (коефіцієнти темпів зростання, наприклад) відносяться до періодів, що не однаковим за тривалістю:
, (10.6)
де х - варіанти; f i - ваги; - сума ваг.
Визначити довжину інтервалу
(Хmаx - Хmin) / к
де Хmаx, Хmin - максимальне і мінімальне значення показника, відповідно;
до - число інтервалів.
Питання 1. Статистична сукупність. однорідність сукупності
статистична сукупність- це сукупність соціально-економічних об'єктів або явищ суспільного життя, об'єднаних якоюсь якісної основою, загальною зв'язком, але відрізняються один від одного окремими ознаками. Такі, наприклад, сукупність домогосподарств, сукупність сімей, сукупність підприємств, фірм, об'єднань і т. П .. сукупності можуть бути однорідними і різнорідними.
сукупність називається однорідною,якщо один або декілька досліджуваних істотних ознак її об'єктів є загальними для всіх одиниць. Сукупність виявляється однорідної саме з точки зору цих ознак.
Сукупність, до якої входять явища різного типу, вважається різнорідної.Сукупність може бути однорідною в одному відношенні і різнорідна в іншому. В кожному окремому випадку однорідність сукупності встановлюється шляхом проведення якісного аналізу, з'ясування змісту досліджуваного соціального явища. Статистична сукупність складається з окремих одиниць(В статистиці зовнішньої торгівлі - окремих партій товарів), що мають свої властивості, особливості.
Одиниця сукупності- це первинний елемент статистичної сукупності, який є носієм ознак, що підлягають реєстрації, і основою ведеться при обстеженні рахунку.
Здійснити перевірку статистичної сукупності на однорідність з використанням коефіцієнта варіації за ознакою обсяг товарної продукції.
Варіація - коливання, зміна величини ознаки у статистичній сукупності, тобто прийняття одиницями сукупності або їх групами різних значень ознаки.
Коефіцієнт варіації є відносною мірою варіації і являє собою відношення середнього квадратичного відхилення до середньої величини варьирующего ознаки, обчислюється за формулою:
Середнє квадратичне відхилення;
Середнє значення ознаки.
Середнє квадратичне відхилення в рамках даного завдання розраховується за формулою:
Чим менше величина коефіцієнта варіації, тим однорідний вважається статистична сукупність. Сукупність вважається однорідною, якщо коефіцієнт варіації не перевищує 33%.
Розрахуємо коефіцієнт варіації для всієї сукупності підприємств за ознакою обсяг товарної продукції.
Розрахунки представлені в таблиці 6.
Таблиця 6.
номер підприємства | Q - x порівн. | (Q - x пор.) 2 | |||
163,3 | -757,156 | 573285,208 | |||
236,5 | -683,956 | 467795,810 | |||
843,3 | -77,156 | 5953,048 | |||
1005,9 | 85,444 | 7300,677 | |||
696,3 | -224,156 | 50245,912 | |||
1031,3 | 110,844 | 12286,392 | |||
1361,2 | 440,744 | 194255,274 | |||
1712,9 | 792,444 | 627967,493 | |||
538,9 | -381,556 | 145584,981 | |||
350,4 | -570,056 | 324963,843 | |||
2149,9 | 1229,444 | 1511532,549 | |||
352,8 | -567,656 | 322233,334 | |||
1187,1 | 266,644 | 71099,023 | |||
262,4 | -658,056 | 433037,699 | |||
438,8 | -481,656 | 231992,502 | |||
1150,5 | 230,044 | 52920,242 | |||
249,4 | -671,056 | 450316,155 | |||
655,3 | -265,156 | 70307,704 | |||
2549,5 | 1629,044 | 2653784,354 | |||
536,8 | -383,656 | 147191,926 | |||
311,2 | -609,256 | 371192,874 | |||
809,7 | -110,756 | 12266,892 | |||
166,7 | -753,756 | 568148,108 | |||
2185,1 | 1264,644 | 1599324,447 | |||
2066,2 | 1145,744 | 1312729,314 | |||
Разом: | 12217715,762 | ||||
920,456 | |||||
488708,630 | |||||
699,077 | |||||
Коффициент Варіації | 0,759 | ||||
З таблиці ми бачимо, що коефіцієнт варіації дорівнює 48,7%. Це означає, що сукупність є неоднорідною, тому що сукупність вважається однорідною, якщо коефіцієнт варіації не перевищує 33%.
Розрахуємо коефіцієнт варіації за ознакою обсяг товарної продукції, отримані в результаті простий угруповання (п. 3.1.).
Результати розрахунків представимо в таблицях 7,8,9 і 10.
Таблиця 7.1-ая група.
номер підприємства | Обсяг товарної продукції (Q), млн.р. | Q - x порівн. | (Q - x пор.) 2 | ||
163,3 | -218,146 | 47587,744 | |||
236,5 | -144,946 | 21009,388 | |||
696,3 | 314,854 | 99132,944 | |||
538,9 | 157,454 | 24791,714 | |||
350,4 | -31,046 | 963,864 | |||
352,8 | -28,646 | 820,602 | |||
262,4 | -119,046 | 14171,987 | |||
438,8 | 57,354 | 3289,464 | |||
249,4 | -132,046 | 17436,187 | |||
655,3 | 273,854 | 74995,929 | |||
536,8 | 155,354 | 24134,818 | |||
311,2 | -70,246 | 4934,522 | |||
166,7 | -214,746 | 46115,911 | |||
Разом: | 0,000 | 379385,072 | |||
381,446 | |||||
34489,552 | |||||
185,714 | |||||
Коффициент Варіації | 0,487 | ||||
Таблиця 8.2-ая група.
номер підприємства | Обсяг товарної продукції (Q), млн.р. | Q - x порівн. | (Q - x пор.) 2 | ||
843,3 | -161,333 | 26028,44 | |||
1005,9 | 1,266667 | 1,604444 | |||
1031,3 | 26,66667 | 711,1111 | |||
1187,1 | 182,4667 | 33294,08 | |||
1150,5 | 145,8667 | 21277,08 | |||
809,7 | -194,933 | ||||
Разом: | 119311,3 | ||||
1004,633 | |||||
19885,222 | |||||
141,015 | |||||
Коффициент Варіації | 0,140 | ||||
Таблиця 9.3-тя група,
номер підприємства | Обсяг товарної продукції (Q), млн.р. | Q - x порівн. | (Q - x пор.) 2 | ||
1361,2 | -175,850 | 30923,223 | |||
1712,9 | 175,850 | 30923,223 | |||
Разом: | 61846,445 | ||||
1537,050 | |||||
20615,482 | |||||
143,581 | |||||
Коффициент Варіації | 0,093 | ||||
Таблиця 10. 4-а група.
номер підприємства | Обсяг товарної продукції (Q), млн.р. | Q - x порівн. | (Q - x пор.) 2 | ||
2149,9 | -87,775 | 7704,451 | |||
2549,5 | 311,825 | 97234,83 | |||
2185,1 | -52,575 | 2764,131 | |||
2066,2 | -171,475 | 29403,68 | |||
Разом: | 137107,1 | ||||
2237,675 | |||||
68553,544 | |||||
261,827 | |||||
Коффициент Варіації | 0,117 | ||||
Висновки за даними:
У 1-ій групі коефіцієнт варіації дорівнює 48,7%. Це означає, що сукупність є не однорідною.
У 2-ої групи коефіцієнт варіації дорівнює 14%. Це означає, що сукупність є однорідною.
У 3-ій групі коефіцієнт варіації дорівнює 9,3%. Це означає, що сукупність є однорідною.
У 4-ої групи коефіцієнт варіації дорівнює 11,7%. Це означає, що сукупність є однорідною.
Відомо, що наявність в сукупності двох груп індивідуумів (наприклад, чоловіків і жінок), середні значення досліджуваних ознак яких розрізняються між собою, може привести до помилкової кореляції. Хибна кореляція виникає тоді, коли неоднорідність проявляється за тими ознаками, між якими визначають зв'язок. На проблему неоднорідності вказував Коллер. Кореляція може бути викликана, наприклад, відмінністю між статями, хоча при розгляді груп, що складаються тільки з чоловіків або з жінок, зв'язок між досліджуваними ознаками відсутній. На рис. 8.4 схематично зображено цей випадок. Неоднорідність даних може, навпаки, затушувати кореляцію або змінити її знак.
Мал. 8.4. Схематичний приклад виникнення кореляції через неоднорідність даних. Між досліджуваними ознаками і у як для групи чоловіків, так і для групи жінок не існує зв'язку. Але так як у групи чоловіків все значення ознак і у більше, ніж у жінок, то коефіцієнт кореляції, обчислений в цілому по обох групах, виходить значним за величиною
Так як факторний аналіз виходить з кореляцій між змінними, то неоднорідність даних впливає також на факторний рішення. На це звертав увагу вже Терстоун. Далі на кількох прикладах, сконструйованих як моделі, показується вплив неоднорідності на факторну структуру. Для цього залучається числовий приклад, З яким ми вже раніше мали справу (табл. 7.5 і 7.6).
До матриці даних розглянутого прикладу додається друга матриця з даними, що представляють результат спостереження над тими ж самими 10 змінними у 200 індивідуумів. Визначається кореляційна матриця за всіма даними. При цьому змінні і 2-ї групи спостережень наводяться до стандартної форми. Середнє значення стандартизованих змінних дорівнює нулю, а стандартне відхилення - одиниці. Коефіцієнти кореляції між цими змінними рівні коефіцієнтам кореляції, зазначеним в табл. 7.6, т. Е. Факторная структура двох кореляційних матриць відома, і вони ідентичні. Якщо до всіх значень змінних другої групи даних додати постійну величину, то їх середні значення стануть рівними цієї постійної величини. Коефіцієнти кореляції між змінними для цієї групи даних не зміняться.
Якщо прийняти цю постійну величину а дорівнює 3, то об'єднана сукупність даних буде відрізнятися своєю неоднорідністю. Можна показати, що якщо початковий коефіцієнткореляції між двома змінними, що належать двом групам даних, дорівнює, то коефіцієнт кореляції, обчислений за об'єднаної сукупності даних при зазначених вище умовах, буде дорівнює
де є постійними, на величину яких зміщуються середні значення змінних х і у. Через X і У позначені змінні об'єднаної сукупності данйих. Введемо нову змінну, позначивши її через Y. Причому вона буде приймати значення, що дорівнює нулю, для індивідуума, що належить до першої групи даних, і приймати значення, що дорівнює одиниці, для індивідуума, що належить до другої групи даних. Коефіцієнт кореляції між цією новою змінною Y і змінної X для об'єднаної сукупності даних дорівнює:
За допомогою цих двох формул були обчислені відповідні коефіцієнти кореляції за елементами кореляційної матриці, наведеної в табл. 7.6, причому вводилися різні умови, що викликають неоднорідність даних. Потім за отриманими кореляційним матрицями було проведено факторний аналіз, що включає в себе варимакс-обертання, і було проведено порівняння з результатом варимакс-рішення в табл. 7.5.
Приклад 1. Додаємо до всіх значень першої змінної в другій групі даних постійну. Коефіцієнти кореляції між нею та іншими змінними змінюються в порівнянні зі значеннями, наведеними в табл. 7.6. У табл. 8.1 представлені лише ті коефіцієнти кореляції, величина яких змінилася в порівнянні з вказаними в табл. 7.6.
Приклад 2. Включаємо в матрицю даних 11-ю змінну, щоб простежити вплив неоднорідності даних на факторний рішення. Маркувальна змінна приймає значення, рівне нулю, для індивідуума, що належить до першої групи даних, і значення, рівне одиниці, для індивідуума, що належить до другої групи даних.
Таблиця 8.1. Коефіцієнти кореляції, що змінилися в порівнянні з наведеними в табл. 7.6 через неоднорідність даних
Коефіцієнти кореляції між цією змінною і іншими змінними, обчисленими за вибіркою, що складається з 400 індивідуумів, також вказані в табл. 8.1. Результати факторизації кореляційних матриць цих двох прикладів із застосуванням варимакс-обертання наведені в табл. 8.4, де вони протиставлені початкового факторному рішенням, отриманого за однорідними даними. Якщо причиною неоднорідності є перетворення однієї змінної, то факторний відображення змінюється лише остільки, оскільки спільність цієї змінної зменшується. Лише у другому прикладі маркировочная змінна 11 викликає поява третього фактора, фактора неоднорідності, і значно його навантажує. У той час як окремі коефіцієнти кореляції при введенні неоднорідності зменшилися, факторний відображення змінилося незначно. Неоднорідність, обумовлена нової змінної, викликала поява нового фактора.
Приклад 3. До значенням перших трьох змінних другуматриці вихідних даних додаємо постійну, т. Е. Підсилюємо неоднорідність даних.
Приклад 4. Додатково до умов прикладу 3 вводимо маркувальну змінну 11.
Кореляційна матриця цих двох прикладів наведена в нижньому кутку табл. 8.2. При порівнянні з табл. 7.6. кидається в очі, що через неоднорідність даних деякі коефіцієнти кореляції змінюються дуже сильно (наприклад, коефіцієнт кореляції між 2-й і 3-й змінними змінив своє значення - 0,546 на + 0,524!). Незважаючи на це, факторний відображення змінилося мало, що видно з табл. 8.4, так як поряд з неоднорідністю ще діють початкові зв'язки між змінними і факторами. Але навантаження змінних 1-3 на перший фактор зменшилися. В обох останніх прикладах виникає третій фактор, викликаний неоднорідністю даних. Він має значні навантаження від змінних 1-3, а також 11.
Приклади 5 і 6. До значенням перших п'яти змінних додаємо постійну величину. Ці змінні навантажують перший фактор. Отже, неоднорідність притаманна тим змінним, які визначають перший фактор. Така ситуація ускладнює виявлення впливу неоднорідності на цей фактор. У прикладі 6 додатково вводиться маркировочная змінна. Кореляційна матриця для цих двох прикладів наведена в правому верхньому куті табл. 8.2.
Таблиця 8.2. Кореляційні матриці для прикладів 3 і 4 (в нижньому лівому кутку) і для прикладів 5 і 6 (у верхньому правому куті)
(Див. Скан)
З табл. 8.4 видно, що в результаті процедур факторного аналізу -деляются три фактори. Третій фактор визначається змінними 1-5 і його поява викликана введенням неоднорідності. У порівнянні з вихідним факторним відображенням навантаження другого чинника залишаються практично без зміни, а у деяких навантажень першого фактора змінюються знаки. Навантаження факторів I і III від змінних 1-5 позитивні і носять протилежний характер. Змістовна інтерпретація першого фактора в даному прикладі викликала б значні труднощі. Маркувальна змінна в прикладі 6 показує, що неоднорідність даних зіграла певну роль у зміні навантажень першого фактора.
Приклади 7 і 8. До значенням 1-й і 3-й змінних додається постійна до значень 2-й змінної - постійна Кореляційна матриця приведена в лівому нижньому кутку табл. 8.3. Деякі коефіцієнти кореляції в цій матриці значно змінилися в порівнянні з елементами вихідної матриці і матриці прикладів 3 і 4. У прикладі 7 неоднорідність даних повністю зумовлює появу третього фактора, який має високі позитивні навантаження від 1-й і 3-й змінних і високу негативну навантаження від 2-ї змінної. Отже, неоднорідність тут виступає як окремий фактор - фактор неоднорідності 1. Маркувальна змінна показує, що неоднорідність даних майже не вплинула на фактори I і II.
Приклади 9 і 10. До значенням 1, 3 і 5-й змінних додається постійна а до значень 2-й і 4-й змінних - постійна Кореляційна матриця приведена в верхньому правому куті табл. 8.3. У цьому випадку фактор неоднорідності збігається з першим фактором. Наслідком цього є посилення зв'язку перших п'яти змінних з першим фактором, і його навантаження від цих змінних збільшуються в порівнянні з вихідними. Структура фактора і знаки його навантажень не змінюються. Факторний рішення прикладу 10 після застосування процедури варимакс-обертання збігається в основному з факторним рішенням прикладу 9 і через відсутність місця в таблиці не наводиться 2.
Наведені приклади, в яких моделювалася неоднорідність, дозволяють зробити наступні висновки:
1. Неоднорідність даних може привести до появи фактора, обумовленого тільки цієї неоднорідністю Якщо він збігається з будь-яким фактором, то навантаження цього фактора збільшується порівняно з вихідними.
Таблиця 8.3. Кореляційні матриці для прикладів 7 і 8 (в нижньому лівому кутку) і для прикладів 9 та 10 (у верхньому правому куті)
(Див. Скан)
Таблиця 8.4. Варімакс-рішення, отримані для різних прикладів
(Див. Скан)
Введення маркувальної змінної допомагає виявити вплив фактора неоднорідності.
2. Неоднорідність даних змінює факторний відображення. При великих змінах в кореляційної матриці в факторном відображенні абсолютно несподівано можуть відбутися лише незначні зміни. Факторний аналіз менш чутливий до впливу неоднорідності, ніж окремі коефіцієнти кореляції, тому що неоднорідність може з'явитися в факторном вирішенні як окремий фактор і його можна виключити. Але в деяких випадках фактор неоднорідності може збігатися з будь-яким чинним фактором. Тоді відображення цього фактора зміниться.
3. Фактори, які виділяються по матриці коефіцієнтів кореляцій між змінними за допомогою техніки R, можуть бути наслідком як кореляції між змінними, так і неоднорідностей в матеріалі дослідження. Це слід пам'ятати при інтерпретації чинників. Отже, є два типи факторів: фактори, які визначаються дією зв'язків між змінними, і фактори, причиною яких є неоднорідність даних. Крім того, є змішані фактори. У наших прикладах процедури факторного аналізу здійснювалися наосліп, але ми змогли виявити всі типи факторів і визначити вплив неоднорідності в кожному випадку.
Якби аналізувалися зв'язку між індивідуумами за вибіркою змінних (т. Е. Використовувалася б техніка Q для визначення незалежних один від одного угруповань індивідуумів), то результати були б аналогічні, а саме отримали б чинники, що характеризують різні угруповання, і фактор, викликаний неоднорідністю даних . Такий результат не є несподіваним, так як матриця вихідних даних для обох технік одна і та ж. Залежно від постановки завдання неоднорідність може розглядатися як фактор, що спотворює результати дослідження, який потрібно виключати, або, навпаки, як фактор, що вводиться спеціально для того, щоб простежити зміну факторного рішення. У будь-якому випадку неоднорідність в даних не є перешкодою проведення факторного аналізу. Неоднорідність якраз може бути виявлена завдяки факторному аналізу і виключена з рішення, особливо якщо для ознаки неоднорідності підібрати маркувальну змінну. В принципі обидва типи факторів завжди присутні в експериментальному матеріалі.
апріорний аналіз статистичний сукупність розподіл
Для оцінки однорідності сукупності використовують різні методи, такі як: угруповання, розрахунок показників варіації (дисперсія, коефіцієнт варіації), аналіз аномальних спостережень на основі - і q-статистик.
На основі угруповання та його графічного зображення (рис.1.1 - рис.1.9) можна припустити, що ряди розподілу за трьома ознаками не є однорідними. Але разом з тим, слід мати на увазі, що при незначному обсязі вибірки (n< 50) слишком углубленный анализ гистограммы может привести к неверным выводам, поскольку слабо выраженные «горбики и ямы» частот могут быть обусловлены не основными факторами, определяющими распределение единиц по группам, а просто случайными отклонениями вариантов от.
Після аналізу аномальних спостережень на основі - статистики, виявляється аномальність значень, що відповідають 13 підприємству, а також аномальність показників виручки і витрат 9 підприємства.
У даній роботі подальший аналіз буде проводиться з урахуванням аномальність, викликаної об'єктивно існуючими причинами.
Причини появи в сукупності аномальних спостережень можуть бути:
1) зовнішні, що виникають в результаті технічних помилок;
2) внутрішні, об'єктивно існуючі.
Для подальшого аналізу форми розподілу використовують показники варіації.Показники варіації діляться на абсолютні і відносні. До абсолютних відносяться розмах коливань, середнє лінійне відхилення, дисперсія, середньоквадратичне відхилення і квартильное відхилення. Коефіцієнт осциляції, відносне лінійне відхилення, коефіцієнт варіації і відносний показник квартильное варіації - відносні показники.
У даній курсової роботідля характеристики однорідності сукупності розраховувалися такі показники, як дисперсія, середньоквадратичне відхилення і коефіцієнт варіації.
Дисперсія - це середній квадрат відхилень індивідуальних значень ознаки від середньої величини. Дисперсія не тільки є основним заходом коливання ознаки, але також використовується для побудови показників тісноти кореляційної зв'язку, при оцінці результатів вибіркових спостережень і т.д.
Для згрупованих даних вона обчислюється за формулою (1.3):
де x i - i-ий варіант осредняемого ознаки;
Вибіркова середня величина або середня агрегатна;
n i - частота, тобто число, що показує скільки разів зустрічаються варіанти з даного інтервалу, або вага i-го варіанта;
n - число об'єктів сукупності.
Для оцінки впливу різних чинників, які обумовлюють варіацію ознаки, розраховується дисперсія по кожному з показників. Для цього будуються розрахункові таблиці:
Таблиця 1.5
Розрахункова таблиця для обчислення дисперсії за величиною виручки від продажу товарів, продукції, робіт, послуг
Групи підприємств по виручці від продажу, тис. Руб. |
Число підприємств n i |
Середина інтервалу x i |
|||
Середня вибіркова обчислюється за формулою (1.4):
Звідси = 177166,1.
По таблиці 1.5 видно, що значення ознаки відхиляються від середньої вибіркової в основному в негативну сторону.
За допомогою формули (1.3) знаходиться дисперсія, у 2 = 3422825485.
Таблиця 1.6
Розрахункова таблиця для обчислення дисперсії за величиною собівартості проданих товарів, продукції, робіт, послуг
Групи підприємств за собівартістю проданих товарів, продукції, робіт, послуг, тис. Руб. |
Число підприємств n i |
Середина інтервалу x i |
|||
у 2 = 2096102493
Значення собівартості в основному не перевищують середню вибіркову.
Таблиця 1.7
Розрахункова таблиця для обчислення дисперсії за величиною комерційних і управлінських витрат
Групи підприємств за величиною комерційних і управлінських витрат, тис. Руб. |
Число підприємств n i |
Середина інтервалу x i |
|||
у 2 = 183131024,9
По таблиці видно, що значення ознаки відхиляються від середньої вибіркової також в основному в негативну сторону.
Найбільш часто застосовується показник відносної коливання - коефіцієнт варіації (формула (1.5)):
Середнє квадратичне відхилення у = 58504,92, тобто величина виручки в середньому відхиляється на 58504,92 тис. Руб.
Виходячи з цього, коефіцієнт варіації дорівнює:
V в = (58504, 92 / 177166,1) * 100% = 33%
Величина V в оцінює інтенсивність коливань варіантів щодо їх середньої величини. Прийнята наступна оціночна шкала коливання ознаки:
0% < V в?40% - колеблемость незначительная;
40% < V в? 60% - колеблемость средняя (умеренная);
V в> 60% - коливання значна.
Для нормальних і близьких до нормального розподілів показник V в служить індикатором однорідності сукупності: прийнято вважати, що при здійсненності нерівності
сукупність є кількісно однорідною за цією ознакою. Так як коефіцієнт варіації не перевищує 33%, то можна вважати сукупність підприємств по виручці досить однорідною.
Коефіцієнт варіації для інших ознак дорівнює:
1) Для групи підприємств за собівартістю проданих товарів, продукції, робіт, послуг V в = 33,4%. Коливання незначна.
2) Для групи підприємств за величиною комерційних і управлінських витрат V в = 32,7%. Коливання незначна. Сукупність можна вважати однорідною.
Так як коефіцієнт варіації угруповання підприємств за собівартістю незначно перевищує 33%, то можна сказати, що сукупність досить однорідна, а перевищення можна пояснити невеликим обсягом вибірки, аномальністю деяких значень і впливом зовнішніх і внутрішніх факторів.