Вторичные группировки. Формула Стерджесса


Группировки, построенные за один и тот же период времени, но для разных объектов или, наоборот, для одного объекта, но за два разных периода времени могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов.
Вторичная группировка, или перегруппировка сгруппированных данных применяется для лучшей характеристики изучаемого явления (в случае, когда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности), либо для приведения к сопоставимому виду группировок с целью проведения сравнительного анализа.
Вторичная группировка - операция по образованию новых групп на основе ранее осуществленной группировки.
Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является изменение (чаще укрупнение) первоначальных интервалов. Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности. Проиллюстрируем методику вторичной группировки на следующем примере.
Пример:
Распределение сотрудников предприятия по уровню дохода

Произведем перегруппировку данных, образовав новые группы с интервалами до 5, 5-10, 10-20, 20-30, свыше 30 тыс. руб.
В первую новую группу войдет полностью первая группа сотрудников и часть второй группы. Чтобы образовать группу до 5 тыс. руб., необходимо от интервала второй группы взять 1,0 тыс. руб. Величина интервала этой группы составляет 6,0 тыс. руб. Следовательно, необходимо взять от нее 1/6 (1,0:6,0) часть. Аналогичную же часть во вновь образуемую первую группу надо взять и от численности работающих, то есть
20 х1 = 3 чел. Тогда в первой группе будет работающих: 16+3 = 19 чел.
6
Вторую новую группу образуют работающие второй группы за вычетом отнесенных к первой, то есть 20-3 = 17 чел. Во вновь образованную третью группу войдут все сотрудники третьей группы и часть сотрудников четвертой. Для определения этой части от интервала 18-30 (ширина интервала равна 12) нужно добавить к предыдущему 2,0 (чтобы верхняя граница интервала была равна 2,0 тыс. руб.). Следовательно, необходимо взять часть интервала, равную . В этой группе 74 человека, значит надо взять 74х(1:6) = 12 чел. В новую третью группу войдут 44+12 = 56 чел. Во вновь образованную четвертую группу войдут 74-12 = 62 чел., оставшихся от прежней четвертой группы. Пятую вновь образованную группу составят работающие пятой и шестой прежних групп: 37+9 = 46 чел.
В результате получим следующие новые группы:

Еще по теме Сравнимость статистических группировок. Вторичная группировка:

  1. 1.3. Статистическое наблюдение и сводка. Группировка материалов статистического наблюдения.
  2. 10.2. СТАТИСТИЧЕСКОЕ НАБЛЮДЕНИЕ И УЧЕТ В ОРГАНИЗАЦИЯХ РАЗЛИЧНЫХ ОТРАСЛЕЙ. ИНФОРМАЦИОННО-АНАЛИТИЧЕСКИЕ ВОЗМОЖНОСТИ СТАТИСТИЧЕСКОЙ ОТЧЕТНОСТИ

Группировки, построенные за один и тот же период времени, но для разных объектов или, наоборот, для одного объекта, но за два разных периода времени могут оказаться несопоставимыми из-за различного числа выделенных групп или неодинаковости границ интервалов.

Вторичная группировка, или перегруппировка сгруппированных данных применяется для лучшей характеристики изучаемого явления (в случае, когда первоначальная группировка не позволяет четко выявить характер распределения единиц совокупности), либо для приведения к сопоставимому виду группировок с целью проведения сравнительного анализа.

Вторичная группировка - операция по образованию новых групп на основе ранее осуществленной группировки.

Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является изменение (чаще укрупнение) первоначальных интервалов. Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности. Проиллюстрируем методику вторичной группировки на следующем примере.

Распределение сотрудников предприятия по уровню дохода

Произведем перегруппировку данных, образовав новые группы с интервалами до 5, 5-10,10-20,20-30, свыше 30 тыс. руб.

В первую новую группу войдет полностью первая группа сотрудников и часть второй группы. Чтобы образовать группу до 5 тыс. руб., необходимо от интервала второй группы взять 1,0 тыс. руб. Величина интервала этой группы составляет 6,0 тыс. руб. Следовательно, необходимо взять от нее 1/6 (1,0:6,0) часть. Аналогичную же часть во вновь образуемую первую группу надо взять и от численности работающих, то есть 20 х 1/6 = 3 чел. Тогда в первой группе будет работающих: 16+3 = 19 чел.

Вторую новую группу образуют работающие второй группы за вычетом отнесенных к первой, то есть 20-3 = 17 чел. Во вновь образованную третью группу войдут все сотрудники третьей группы и часть сотрудников четвертой. Для определения этой части от интервала 18-30 (ширина интервала равна 12) нужно добавить к предыдущему 2,0 (чтобы верхняя граница интервала была равна 2,0 тыс. руб.). Следовательно, необходимо взять часть интервала, равную . В этой группе 74 человека, значит надо взять 74х(1:6) = 12 чел. В новую третью группу войдут 44+12 = 56 чел. Во вновь образованную четвертую группу войдут 74-12 = 62 чел., оставшихся от прежней четвертой группы. Пятую вновь образованную группу составят работающие пятой и шестой прежних групп: 37+9 = 46 чел.

Вторичная группировка

Вторичная группировка - это образование новых групп на ос­нове ранее произведенной группировки. Применяют два способа об­разования новых групп на основе ранее произведенной группировки.

Первый способ состоит в укрупнении первоначальных интерва­лов. Это наиболее простой и распространенный способ.

Второй способ принято называть методом долевой перегруппировки и состоит в том, что за каждой группой закрепляется определœенная до­ля единиц совокупности. Рассмотрим два способа на примере.

Имеется группировка сотрудников двух управлений одного из московских банков по размеру месячной заработной платы (цифры условные).

Таблица 3.6

Кредитное управление Валютное управление
№ груп­пы Число работ­ников, чел. № группы Размер зарплаты, руб. в мес. Число работ­ников, чел.
2000 - 2500 2000 - 3000
2500 - 3000 3000 - 5000
3000 - 4000 5000 - 7000
4000 - 5000 7000 и более
5000 и более - -
Итого Итого

Приведенные данные не позволяют сравнить распределœение работников по размеру месячной заработной платы, так как величины интервалов различны, в связи с этим крайне важно привести эти ряды распределœения к сопоставимому виду.

Произведем вторичную группировку, образовав группы с новыми укрупненными интервалами.

Таблица 3.7

При вторичной группировке методом долевой перегруппировки устанавливаем новые интервалы распределœения работников по размеру месячной заработной платы, при этом за каждым интервалов закрепляем определœенную долю единиц совокупности. В нашем примере одну из группировок (по кредитному управлению) оставляем без изменений. А по валютному управлению производим перегруппировку следующим образом. В первой группе с интервалом от 2000 до 3000 руб. частота равна 2. Применительно к группировке по кредитному управлению данный интервал крайне важно разбить на два равных интервала: от 2000 до 2500 руб. и от 2500 до 3000 руб., при этом исходная частота делится поровну. Следующий интервал от 3000 до 5000 руб. соответственно нужно разделить на два равных интервала: от 3000 до 4000 руб. и от 4000 до 5000 руб., при этом исходная частота делит­ся поровну (6:2 = 3). Последние две группы крайне важно объединить в одну с интервалом 5000 руб. и выше.

Таблица 3.8

№ группы Размер зарплаты, руб. в мес. Кредитное число управления работников Валютное число управления работников
чел. в % к ито­гу чел. в % к итогу
2000 - 2500 8,33 3,33
2500 - 3000 16,67 3,33
3000 - 4000 25,00 10,00
4000 - 5000 33,33 10,00
5000 и выше 16,67 73,34
Итого 100,00 100,00

Контрольные вопросы

(выберите правильный ответ)

1. Статистическая сводка включает в себя:

а) только подсчет итогов в данных;

б) группировку данных и подсчет итогов;

в) группировку данных, подсчет итогов и расчет обобщаю­щих показателœей.

2. Группировка, в которой изучается структура совокупности, принято называть:

а) типологической; б) структурной; в) аналитической.

3. Группировочный признак может быть:

а) количественный;

б) качественный;

в) и количественный, и качественный.

4. Величина интервала определяется:

а) верхней границей интервала;

б) нижней границей интервала;

в) разностью верхней и нижней границ.

5. Вариационный ряд распределœения строится:

а) по качественному признаку;

б) по количественному признаку.

6. Частоты - это:

а) абсолютные числа;

б) относительные числа.

7. Частости - это:

а) абсолютные числа;

б) относительные числа.

8. В дискретном вариационном ряду значения признака выражены:

а) в виде чисел;

б) в виде интервалов.

9. Интервальный вариационный ряд графически изображается в виде:

а) полигона распределœения;

б) гистограммы;

в) кумуляты.

10. Вторичная группировка осуществляется методом:

а) уменьшения интервалов;

б) укрупнения интервалов;

в) и уменьшения, и укрупнения интервалов;

г) долевой перегруппировки.

Вторичная группировка

На практике иногда приходится пользоваться уже имеющимися группировками, которые могут быть несопоставимы из-за неодинаковых границ интервалов или различного количества выделяемых групп. Для приведения таких группировок к сопоставимому виду используется метод вторичной группировки.

Вторичная группировка заключается в образовании новых групп на основе ранее произведенной группировки.

Во вторичной группировке применяются два способа образования новых групп:

  • § Первый способ состоит в укреплении первоначальных интервалов. Это наиболее простой и распространенный способ вторичной группировки.
  • § Второй способ называется методом долевой перегруппировки и состоит в том, что за каждой группой закрепляется определенная доля единиц совокупности.

Ряды распределения

Группировка может быть построена на основе ряда распределения. В то же время построение рядов может осуществляться на основе группировки. Всестороннее изучение статистического явления наиболее плодотворно, если в его основе лежит система группировок. Система группировок - это ряд взаимосвязанных статистических группировок по наиболее существенным признакам, всесторонне отражающим важнейшие стороны явления.

Рядом распределения называется упорядоченное распределение единиц совокупности на группы по какому-либо признаку.

Виды рядов распределения:

  • - атрибутивный;
  • - вариационный - дискретный и интервальный.

Иными словами, ряд распределения - результат группировки.

Под атрибутивным рядом понимается ряд распределения по атрибутивному признаку, не имеющему количественной меры. Например, атрибутивный ряд можно составить по признаку «Социальное положение», «Профессия», «Пол» и т.д.

Любой ряд, представленный в табличном виде, состоит из двух колонок. В первой колонке указываются значения изучаемого признака (атрибутивные или количественные). Во второй колонке фиксируется число единиц наблюдения, обладающих данным значением. Таким образом, построение вариационного ряда сводится к определению значения признака в каждой классификационной группе и определению количества элементов, попавших в эту группу.

Каждое индивидуальное значение признака в ряду распределения называется вариантой.

Количество элементов в каждой классификационной группе или количество элементов в совокупности с данной вариантой называется частотой, или, иначе, число единиц наблюдения, содержащееся в каждой отдельной группе, принято называть частотой ряда распределения.

Удельный вес данной группы в совокупности называется частостью. Частость или структура, показывает долю совокупности данной классификационной группы.

Частость - отношение частоты к общему количеству исследуемых элементов, то есть объему совокупности.

Частоту обозначим n или f , частость - p или j.

Пример дискретного ряда.

Успеваемость в группе студентов-экономистов из 15 человек по одному из предметов.

Сложные группировки. Группировки по одному признаку называются простыми . Для того же, чтобы полнее и глубже изучить сложное общественное явление, необходимо сгруппировать данные по двум или более признакам. Такие группировки называют сложными .

Наиболее распространенным видом сложных группировок являются комбинированные группировки , когда группы, образованные по одному признаку, делятся затем на подгруппы по второму и т.д. признакам. Обычно в основание группировки кладется от 2 до 4 признаков.

Одновременное использование нескольких группировочных признаков позволяет выявить и сравнить такие различия и связи между исследуемыми признаками, которые нельзя обнаружить на основе изолированной группировки по ряду группировочных признаков.

При изучении влияния большого числа признаков применение комбинированных группировок становится невозможным, поскольку чрезмерное дробление информации затушевывает проявление закономерностей и тем самым не позволяет выявить одновременное влияние всего комплекса факторных признаков на исследуемый показатель.

Вторичная группировка. Особым видом группировок в статистике является вторичная группировка , под которой понимается образование новых групп на основе ранее выделенной (первичной) группировки .

Обычно новые группы получают путем укрупнения первоначальных интервалов. Вторым способом образования новых групп является долевая перегруппировка единиц совокупностей.

К вторичной группировке прибегают в целях решения ряда задач, в частности для: 1) создания более укрупненных групп, в которых яснее проступает характер распределения; 2) образования качественно однородных групп (типов); 3) приведения двух (или более) группировок с различными интервалами к единому виду в целях сравнимости.

Предприятие 1 Предприятие 2
группы рабочих по размеру зарплаты, тенге удельный вес рабочих по группам, % к итогу
12000–14000
14000–16000 13000–16000
16000–18000 16000–19000
18000–20000 19000–22000
20000–22000 22000–25000
22000–24000 25000–28000
24000–26000 28000–31000
26000–28000
Итого Итого

Поскольку распределение рабочих на этих двух предприятиях имеет различные интервалы, то сравнить их непосредственно невозможно. Однако с помощью вторичной группировки можно привести их к сравнимому виду. Возьмем, к примеру, интервал в 4000 тенге:

Распределение рабочих по размеру месячной заработной платы

(группировка единая)

Группы рабочих по размеру зарплаты, тенге Удельный вес рабочих по группам, % к итогу
предприятие 1 предприятие 2
12000–16000 17 (5+12)
16000–20000 44 (18+26) 37 (30+1/3×21)
20000–24000 32 (25+7) 24 (2/3×21+2/3×15)
24000–28000 7 (4+3) 21 (1/3×15+16)
28000–32000
Всего

Ряды распределения.

Определение ряда распределения. В результате сводки статистических материалов образуются ряды статистических данных, раскрывающих либо изменение объемов совокупностей в динамике (будут рассмотрены в отдельной главе), либо распределение совокупностей по тем или иным признакам в статике.

Распределение может быть по признакам, не имеющим количественной меры (атрибутивным), и по признакам, в которых изменяется их количественная мера (вариационные ряды).

Атрибутивные ряды распределения. Примерами подобных распределений служат распределение населения на городское и сельское, мужское и женское, товарооборота на продовольственные и непродовольственные товары, занятого населения по отраслям и профессиям, взрослого населения по уровню образования.

Вариационные ряды. Например, к таким рядам относятся распределения рабочих по размеру среднемесячной заработной платы и предприятий по объемам производства или численности работающих.

В вариационном ряду различают два элемента: варианты и частоты. Варианты это отдельные значения группировочного признака, которые он принимает в вариационном ряду. Частотами называют числа, показывающие, как часто встречаются те или иные варианты.

Сумма всех частот образует объем ряда распределения, или его численность . Частоты, выраженные в виде относительных величин (долях единицах, процентах), называют частостями .

Вариационные ряды по способу построения бывают интервальными и дискретными. Интервальные вариационные ряды – ряды, в которых значения вариант даны в виде интервалов (например, численность населения по группам возрастов). Дискретные вариационные ряды – ряды, в которых значения вариант имеют значения целых или фиксированных чисел (например, общее число семей по числу человек).

Характер вариационного ряда (интервальный или дискретный) определяется характером вариации. Вариация может быть непрерывной (интервальный ряд) и прерывной (дискретный ряд).

Примерами непрерывной вариации служат урожайность сельскохозяйственных культур, заработная плата, объемы производства.

К дискретной вариации могут относиться число членов семьи, тарифный разряд рабочего, число комнат в квартире, число рабочих на предприятии.

Если дискретная вариация проявляется в широких пределах (например, численность рабочих на предприятии), то строятся интервальные вариационные ряды.

Примеры построения и графического изображения рядов распределения (Тарифный разряд и стаж работы рабочих-слесарей). Построим первоначальный дискретный ряд распределения рабочих по тарифным разрядам. Характер вариации признака здесь определен шестью группами – по числу разрядов. Подсчет числа рабочих в каждом разряде легко провести непосредственно по первичным данным. В результате получим таблицу.