1. Виды группировок. Основы группировки. Расчет интервала

Группировка - это распределение множества единиц исследуемой совокупности по группам в соответствии с существенным для данной группы признаком. Благодаря группировке появляется возможность сравнивать, анализировать причины различий между группами, изучать взаимосвязи между признаками.

Виды группировок зависят от целей и задач, которые они выполняют. Выделяют типологические, структурные и аналитические группировки.

Метод типологической группировки заключается в выявлении в качественно разнородной совокупности однородных групп. Типологические группировки широко применяются в исследовании социально- экономических явлений. Примерами такого вида группировок могут быть группы предприятий по формам собственности, социальные группы населения и т.д. В типологических группировках часто используются специализированные интервалы.

Метод структурной группировки есть разделение однородной совокупности на группы по тому или иному варьирующему группировочному признаку. Примерами такого вида группировок могут быть группы населения по полу, возрасту, месту проживания, доходу и т.д.

Метод аналитической группировки заключается в исследовании взаимосвязей между факторными признаками в качественно однородной совокупности. С помощью аналитических группировок удается выявлять признаки, которые могут выступать или причиной, или следствием того или иного явления. В аналитических группировках чаще всего используются неравные интервалы.

Результаты группировочного материала оформляются в виде таблиц, где он излагается в наглядно-рациональной форме. Не всякая таблица может быть статистической. Табличные формы календарей, тестовых и опросных листов, таблица умножения не являются статистическими.

Статистическая таблица - это цифровое выражение итоговой характеристики всей наблюдаемой совокупности или ее составных частей по одному или нескольким существенным признакам. Статистическая таблица содержит два элемента: подлежащее и сказуемое.

Подлежащее статистической таблицы есть перечень групп или единиц, составляющих исследуемую совокупность единиц наблюдения.

Сказуемое статистической таблицы – это цифровые показатели, с помощью которых дается характеристика выделенных в подлежащем групп и единиц.

Интервал - разница между максимальным и минимальным значениями признака в каждой группе. Он определяет количественные границы групп.

Каждый интервал имеет нижнюю (наименьшее значение признака) и верхнюю (наибольшее значение признака) границы или одну из них. Поэтому величина интервала есть разность между верхней и нижней границами интервала. Если у интервала указана лишь одна граница (у первого – верхняя, у последнего – нижняя), то речь идет об открытых интервалах. Если у интервала имеются и нижняя, и верхняя границы, то речь идет о закрытых интервалах. Закрытые интервалы подразделяются на равные и неравные (прогрессивно возрастающие, прогрессивно убывающие), а также специализированные и произвольные.

Группировку с равными интервалами строят тогда, когда исследуются количественные различия в величине признака внутри групп одинакового качества.

где i – величина равного интервала; xmax, xmin - наибольшее и наименьшее значения признака; n - число групп.

В статистической практике чаще применяются неравные интервалы. При этом исследуемая совокупность делится на группы примерно равного заполнения с большим числом единиц.

В статистической практике используются также специализированные интервалы. Интервалы называют специализированными, если речь идет об установлении границ интервала в группах, схожих по типу и по признаку, но имеющих отношение, скажем, к разным отраслям производства.

2. Виды средних

Средняя величина – это обобщающая характеристика единиц совокупности по какому–либо варьирующему признаку. Средние величины позволяют сравнивать уровни одного и того же признака в различных совокупностях и находить причины этих расхождений.

Средние величины делятся на два больших класса: степенные средние и структурные средние

Степенные средние:

Арифметическая

Гармоническая

Геометрическая

Квадратическая

Структурные средние:

Мода

Медиана

Выбор формы средней величины зависит от исходной базы расчета средней и от имеющейся экономической информации для ее расчета.

Простая средняя арифметическая — Равна отношению суммы индивидуальных значений признака к количеству признаков в совокупности

Средняя гармоническая — используется в тех случаях когда известны индивидуальные значения признака и произведение , а частоты неизвестны.

Среднегеометрическая величина дает возможность сохранять в неизменном виде не сумму, а произведение индивидуальных значений данной величины. Ее можно определить по следующей формуле:

Среднегеометрические величины наиболее часто используются при анализе темпов роста экономических показателей.

Среднеквадратические величины используются для расчета некоторых показателей, например коэффициент вариации, характеризующего ритмичность выпуска продукции. Здесь определяют среднеквадратическое отклонение от планового выпуска продукции за определенный период по следующей формуле:

Мода — это наиболее часто встречающийся вариант ряда. Модой для дискретного ряда является варианта, обладающая наибольшей частотой. При вычислении моды для интервального вариационного ряда необходимо сначала определить модальный интервал (по максимальной частоте), а затем — значение модальной величины признака по формуле:

где:

 — значение моды

 — нижняя граница модального интервала

 — величина интервала

 — частота модального интервала

 — частота интервала, предшествующего модальному

 — частота интервала, следующего за модальным

Медиана — это значение признака, которое лежит в основе ранжированного ряда и делит этот ряд на две равные по численности части.

При вычислении медианы для интервального вариационного ряда сначала определяют медианный интервал, в пределах которого находится медиана, а затем — значение медианы по формуле:

где:

 — искомая медиана

 — нижняя граница интервала, который содержит медиану

 — величина интервала

 — сумма частот или число членов ряда

 - сумма накопленных частот интервалов, предшествующих медианному

 — частота медианного интервала

3. Показатели ряда динамики

Анализ интенсивности изменения во времени осуществляется с помощью показателей, получаемых в результате сравнения уровней. К таким показателям относятся: абсолютный прирост, темп роста, темп прироста, абсолютное значение одного процента. Для расчета показателей анализа динамики на постоянной базе, каждый уровень ряда сравнивается с одним и тем же базисным уровнем. Исчисляемые, при этом, показатели называются базисными. Для расчета показателей анализа динамики на переменной базе, каждый последующий уровень ряда сравнивается с предыдущим. Вычисленные таким образом показатели анализа динамики называются цепными. Важнейшим статистическим показателем анализа динамики является абсолютный прирост (сокращение), т.е. абсолютное изменение, характеризующее увеличение или уменьшение уровня ряда за определенный промежуток времени. Абсолютный прирост с переменной базой называют скоростью роста

Абсолютный прирост: 

базисный 

  ∆y=yi-y0

цепной

  ∆y=yi-yi-1

Для оценки интенсивности, т.е. относительного изменения уровня динамического ряда за какой-либо период времени, исчисляют темпы роста (снижения). Темп роста всегда представляет собой положительное число.

Коэффициент роста:

базисный:  

  

цепной: 

  

Темп роста:

базисный: 

  

цепной: 

  

Таким образом,  

  Tp=Kp*100

Темп прироста (сокращения) показывает, на сколько процентов сравниваемый уровень больше или меньше уровня, принятого за базу сравнения и вычисляется как отношение абсолютного прироста к абсолютному уровню, принятому за базу сравнения. Темп прироста может быть положительным, отрицательным или равным нулю, выражается он в процентах или в долях единицы (коэффициенты прироста).

Темп прироста:

базисный:

  

цепной:

  

Темп прироста (сокращения) можно получить, если из темпа роста, выраженного в процентах, вычесть 100%: Tnp=Tp-100

  

Коэффициент прироста получается вычитанием единицы из коэффициента роста:

  Knp=Kp-1

При анализе динамики развития следует также знать, какие абсолютные значения скрываются за темпами роста и прироста. Результат выражают показателем, который называют абсолютным значением (содержанием) одного процента прироста и рассчитывают как отношение абсолютного прироста к темпу прироста за этот период времени, %:

  A%=

4. Коэффициент корреляции

корреляционная зависимость — статистическая взаимосвязь двух или нескольких случайных величин  При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин. Математической мерой корреляции двух случайных величин служит корреляционное отношение , либо коэффициент корреляции  (или ).

Коэффициент корреляции – это величина которая варьироваться в приделах от +1 до -1

5. Виды ошибок корреляции

ошибка коэффициента корреляции, вычисленного методом квадратов (Пирсона):

ошибка коэффициента корреляции, вычисленного ранговым методом (Спирмена):

6. Выборка

Выборка или выборочная совокупность — это необходимый для социологического исследования минимум результатов (случаев, испытуемых, объектов, событий, образцов) отобранных с помощью определённой процедуры из генеральной совокупности.

Характеристики выборки:

Качественная характеристика выборки – что именно мы выбираем и какие способы построения выборки мы для этого используем.

Количественная характеристика выборки – сколько случаев выбираем, другими словами объём выборки.

7. Доля выборки

Доля выборки есть отношение числа единиц выборочной со-вокупности к числу единиц генеральной совокупности:

При правильной научной организации выборки ошибки репрезентативности можно свести к минимальным значениям, в результате — выборочное наблюдение становится достаточно точным.

Применяя выборочный метод в статистике, обычно используют два основных вида обобщающих показателей: среднюю величину ко-личественного признака и относительную величину альтернативного признака(долю или удельный вес единиц в статистической совокупности, которые отличаются от всех других единиц этой сово-купности только наличием изучаемого признака).

Выборочная доля (w), или частость, определяется отношением числа единиц, обладающих изучаемым признаком т, к общему числу единиц выборочной совокупности п:

w=m/n.

8. Средний прирост (значение)

Абсолютный прирост выражает абсолютную скорость изменения ряда динамики и определяется как разность между данным уровнем и уровнем, принятым за базу сравнения.

Абсолютный прирост (базисный)

где yi – уровень сравниваемого периода; y0 – уровень базисного периода.

Абсолютный прирост с переменной базой (цепной), который называют скоростью роста,

где yi – уровень сравниваемого периода; yi-1 – уровень предшествующего периода.

Средний абсолютный прирост (средняя скорость роста) определяется как средняя арифметическая из показателей скорости роста за отдельные периоды времени:

где yn – конечный уровень ряда; y1 – начальный уровень ряда.

Темп роста 

Темп прироста ТП определяется как отношение абсолютного прироста данного уровня к предыдущему или базисному.

Темп прироста базисный  

Темп прироста цепной

Темп прироста можно рассчитать и иным путем: как разность между темпом роста и 100 % или как разность между коэффициентом роста и 1 (единицей): 1) Тп = Тр – 100%; 2) Тп = Ki – 1.

Средний темп роста, %. Это средний коэффициент роста, который выражается в процентах:

Средний темп прироста , %. Для расчета данного показателя первоначально определяется средний темп роста, который затем уменьшается на 100%. Его также можно определить, если уменьшить средний коэффициент роста на единицу: 

Абсолютное значение одного процента прироста Ai. Этот показатель служит косвенной мерой базисного уровня. Представляет собой одну сотую часть базисного уровня, но одновременно представляет собой и отношение абсолютного прироста к соответствующему темпу роста.

Среднее абсолютное значение 1% прироста