Внимание! Studlandia не продает дипломы, аттестаты и иные документы об образовании. Наши специалисты оказывают услуги консультирования в области образования: в сборе информации, ее обработке, структурировании и оформления в соответствии с ГОСТом. Все услуги на сайте предоставляются исключительно в рамках законодательства РФ.
Нужна индивидуальная работа?
Подберем литературу
Поможем справиться с любым заданием
Подготовим презентацию и речь
Оформим готовую работу
Узнать стоимость своей работы
Дарим 200 руб.
на первый
заказ

Дипломная работа на тему: Коэффициент корреляции. Выбор формы уравнения тренда. Статистические показатели социальной работы и

Купить за 600 руб.
Страниц
29
Размер файла
132.24 КБ
Просмотров
14
Покупок
0
Один из иболее общих законов объективного мира - закон всеобщей связи и зависимости между явлениями. Естественно, что, исследуя явления в самых различных областях, статистика неизбежно сталкивается с

Введение

Один из наиболее общих законов объективного мира - закон всеобщей связи и зависимости между явлениями. Естественно, что, исследуя явления в самых различных областях, статистика неизбежно сталкивается с зависимостями как между количественными, так и между качественными показателями, признаками. Ее задача - обнаружить (выявить) такие зависимости и дать им количественную характеристику.

Среди взаимосвязанных признаков (показателей) одни могут рассматриваться как определенные факторы, влияющие на изменение других (факторные), а вторые (результативные) - как следствие, результат влияния первых.

Существует 2 вида связи между отдельными признаками: функциональная и стохастическая (статистическая), частным случаем которой является корреляционная [1].

Связь между двумя переменными x и y называется функциональной, если определенному значению переменной x строго соответствует одно или несколько значений другой переменной y, и с изменением значения x значение y меняется строго определенно. Такие связи обычно встречаются в точных науках. Например, известно, что площадь квадрата равна квадрату его стороны (S = а2). Это соотношение характерно для каждого единичного случая (квадрата), это так называемая жестко детерминированная связь. Такие связи можно встретить и в области экономических явлений. Например, при простой сдельной оплате труда связь между оплатой труда y и количеством изготовленных изделий x при фиксированной расценке за одну деталь, например 5 руб., легко выразить формулой . Для изучения функциональных связей применяется индексный метод.

Существуют и иного рода связи, где взаимно действуют многие факторы, комбинация которых приводит к вариации значений результативного признака (показателя) при одинаковом значении факторного признака. Например, при изучении зависимости величины таможенных платежей, поступающих в федеральный бюджет, от количества товаров, перемещаемых через таможенную границу государства, (или от стоимостного товарооборота) последние будут рассматриваться как факторный признак, а величина таможенных платежей - как результативный.

Между ними нет жестко детерминированной связи, т.е. при одном и том же количестве перемещенных через таможенную границу товаров (или стоимости товарооборота) величина таможенных платежей, перечисленных разными таможнями будет различной, так как кроме количества товаров, перемещаемых через таможенную границу государства, (или стоимость товарооборота) на величину таможенных платежей влияет много других факторов (различная номенклатура товаров, для которых применяются различные таможенные пошлины, сборы и льготы; различные таможенные режимы перемещения товаров через таможенную границу и др.), комбинация которых вызывает вариацию величины таможенных платежей.

Там, где взаимодействует множество факторов, в том числе и случайных, выявить зависимости, рассматривая единичный случай, невозможно. Такие связи можно обнаружить только при массовом наблюдении как статистические закономерности. Выявленная таким образом связь именуется стохастической.

Корреляционная связь - понятие более узкое, чем стохастическая связь, это ее частный случай. Именно корреляционные связи являются предметом изучения статистики.

Корреляционная связь - это связь, проявляющаяся при большом числе наблюдений в виде определенной зависимости между средним значением результативного признака и признаками-факторами. Другими словами, корреляционную связь условно можно рассматривать как своего рода функциональную связь средней величины одного признака (результативного) со значением другого (или других). При этом, если рассматривается связь средней величины результативного показателя y с одним признаком-фактором x, корреляция называется парной, а если факторных признаков 2 и более (x1, x2, …, xm) - множественной.

По характеру изменений x и y в парной корреляции различают прямую и обратную связь. При прямой связи значения обоих признаков изменяются в одном направлении, т.е. с увеличением (уменьшением) значений x увеличиваются (уменьшаются) и значения y. При обратной связи значения факторного и результативного признаков изменяются в разных направлениях.

Изучение корреляционных связей сводится в основном к решению следующих задач [1]:

1) выявление наличия (отсутствия) корреляционной связи между изучаемыми признаками;

2) измерение тесноты связи между двумя (и более) признаками с помощью специальных коэффициентов (эта часть исследования именуется корреляционным анализом);

) определение уравнения регрессии - математической модели, в которой среднее значение результативного признака у рассматривается как функция одной или нескольких переменных - факторных признаков (эта часть исследования именуется регрессионным анализом).

Для выявления наличия и характера корреляционной связи между двумя признаками в статистике используется ряд методов [1]:

. Рассмотрение параллельных данных (значений x и y в каждой из n единиц). Единицы наблюдения необходимо расположить по возрастанию значений факторного признака х и затем сравнить с ним (визуально) поведение результативного признака у.

. Графический метод - это графическое изображение корреляционной зависимости. Для этого, имея n взаимосвязанных пар значений x и y и пользуясь прямоугольной системой координат, каждую такую пару изображают в виде точки на плоскости с координатами x и y. Совокупность полученных точек представляет собой корреляционное поле, а соединяя последовательно нанесенные точки отрезками, получают ломаную линию, именуемую эмпирической линией регрессии.

3. Метод аналитических группировок используется при большом числе наблюдений для выявления корреляционной связи между двумя количественными признаками. Чтобы выявить наличие корреляционной связи между двумя признаками, проводится группировка единиц совокупности по факторному признаку х и для каждой выделенной группы рассчитывается среднее значение результативного признака . Если результативный признак у зависит от факторного х, то в изменении среднего значения будет прослеживаться определенная закономерность.

. Метод корреляционных таблиц предполагает комбинационное распределение единиц совокупности по двум количественным признакам. Такая таблица строится по типу "шахматной", т.е. в подлежащем (строках) таблицы выделяются группы по факторному признаку х, а в сказуемом (столбцах) - по результативному у (или наоборот), а в клетках таблицы на пересечении х и у показано число случаев совпадения каждого значения х с соответствующим значением у.

. Коэффициент корреляции знаков (Фехнера) - простейший показатель тесноты связи, основанный на сравнении поведения отклонений индивидуальных значений каждого признака (x и y) от своей средней величины. При этом во внимание принимаются не величины отклонений () и (), а их знаки ("+" или "-"). Определив знаки отклонений от средней величины в каждом ряду, рассматривают все пары знаков и подсчитывают число их совпадений (С) и несовпадений (Н). Тогда коэффициент Фехнера рассчитывается как отношение разности чисел пар совпадений и несовпадений знаков к их сумме, т.е. к общему числу наблюдаемых единиц [1]:

Очевидно, что если знаки всех отклонений по каждому признаку совпадут, то КФ=1, что характеризует наличие прямой связи. Если все знаки не совпадут, то КФ=-1 (обратная связь). Если же С=Н, то КФ=0. Итак, как и любой показатель тесноты связи, коэффициент Фехнера может принимать значения от 0 до 1. Однако, если КФ=1, то это ни в коей мере нельзя воспринимать как свидетельство функциональной зависимости между х и у.

6. Линейный коэффициент корреляции - самый популярный измеритель тесноты линейной связи между двумя количественными признаками x и y. Он основан на предположении, что при полной независимости признаков x и у отклонения значений факторного признака от средней () носят случайный характер и должны случайно сочетаться с различными отклонениями (). При наличии значительного перевеса совпадений или несовпадений таких отклонений делается предположение о наличии связи между x и y.

В отличие от КФ в линейном коэффициенте корреляции учитываются не только знаки отклонений от средних величин, но и значения самих отклонений, выраженные для сопоставимости в единицах среднего квадратического отклонения t [1]:

Линейный коэффициент корреляции r представляет собой среднюю величину из произведений нормированных отклонений для x и у [1]:

или:

Числитель формулы (4), деленный на n, представляющий собой среднее произведение отклонений значений двух признаков от их средних значений, называется коэффициентом ковариации - это мера совместной вариации факторного x и результативного y признаков [1]:

Недостатком коэффициента ковариации является то, что он не нормирован, в отличие от линейного коэффициента корреляции. Очевидно, что линейный коэффициент корреляции представляет собой частное от деления ковариации между х и у на произведение их средних квадратических отклонений [1]:

Путем несложных математических преобразований можно получить и другие модификации формулы линейного коэффициента корреляции, например [1]:

Линейный коэффициент корреляции может принимать значения от -1 до +1, причем знак определяется в ходе решения.

Например, если , то r по формуле (7) будет положительным, что характеризует прямую зависимость между х и у, в противном случае (r<0) - обратную связь. Если , то r=0, что означает отсутствие линейной зависимости между х и у, а при r=1 - функциональная зависимость между х и у. Следовательно, всякое промежуточное значение r от 0 до 1 характеризует степень приближения корреляционной связи между х и у к функциональной.

Существует эмпирическое правило (шкала Чэддока) для оценки тесноты связи, представленное в таблице 1 [1].

Таблица 1 - Шкала Чэддока

Теснота связи

менее 0,1

отсутствует линейная связь

слабая

умеренная

заметная

более 0,7

сильная (тесная)

Таким образом, коэффициент корреляции при линейной зависимости служит как мерой тесноты связи, так и показателем, характеризующим степень приближения корреляционной зависимости между х и у к линейной. Поэтому близость значения r к 0 в одних случаях может означать отсутствие связи между х и у, а в других свидетельствовать о том, что зависимость не линейная.

1.2 Выбор формы уравнения тренда

Динамика уровней ряда может иметь основную тенденцию (тренд). Это весьма характерно для экономических показателей. Тренд является результатом совместного длительного действия множества, как правило, разнонаправленных факторов на динамику исследуемого показателя. Довольно часто динамика уровней ряда подвержена циклическим колебаниям, которые зачастую носят сезонный характер. Иногда не удается выявить тренд и циклическую компоненту. Правда нередко в этих случаях каждый следующий уровень ряда образуется как сумма среднего уровня ряда и некоторой случайной компоненты.

В очень многих случаях уровень временного ряда представляется в виде суммы тренда, циклической и случайной компонент или в виде произведения этих компонент. В первом случае это аддитивная модель временного ряда, во втором - мультипликативная модель.

Исследование временного ряда заключается в выявлении и придании количественного выражения каждой из этих компонент, после чего удается использовать соответствующие выражения для прогнозирования будущих значений ряда. Можно также решать задачу построения модели взаимосвязи двух или нескольких временных рядов.

Для выявления трендовой, циклической компонент можно использовать коэффициент автокорреляции уровней ряда и автокорреляционную функцию. Автокорреляционная функция - это последовательность коэффициентов автокорреляции уровней первого, второго и последующих порядков. Соответственно график зависимости значений автокорреляционной функции от величины лага (порядка коэффициента автокорреляции) - коррелограмма. Анализ автокорреляционной функции и коррелограммы позволяет определить лаг, при котором автокорреляция наиболее высокая, а следовательно, и лаг, при котором связь между текущим и предыдущими уровнями ряда наиболее тесная.

Несколько более гибок и опирается на количественные (аналитические) инструменты анализа метод скользящей средней, или скользящего окна. В нем последовательно рассчитывается вместо одного полного среднего для всех наблюдений ряд так называемых частных средних для трех, пяти наблюдений или более, номера которых постоянно сдвигаются вправо (в сторону увеличения). Таким образом, получается последовательность частных средних, которая отсеивает несущественные флуктуации и способна легче обнаружить тренд, чем данные исходного ряда.

Основным способом моделирования и изучения таким образом основной тенденции временного ряда (ряда динамики) является аналитическое выравнивание временного ряда. При этом строится аналитическая функция, характеризующая зависимость уровней ряда динамики от времени. Эта функция называется также трендом. Сам такой способ выявления основной тенденции называется аналитическим выравниванием. Ранее были описаны различные способы определения типа тренда. В целом построение модели тренда включает следующие основные этапы [1]:

) выравнивание исходного ряда методом скользящей средней;

) расчет сезонной компоненты;

) устранение сезонной компоненты из исходных уровней ряда и получение выровненных данных в модели;

) аналитическое выравнивание уровней и расчет значений тренда с использованием полученного уравнения тренда;

) расчет полученных по модели значений, генерируемых трендом и сезонной компонентой;

) расчет абсолютных и относительных ошибок.

Кроме сезонных и циклических колебаний весьма важную роль играют единовременные изменения характера тенденции временного ряда. Эти (относительно) быстрые однократные изменения тренда (его характера) вызываются структурными изменениями в экономике либо мощными глобальными (внешними) факторами. Прежде всего выясняется, значимо ли повлияли общие структурные изменения на характер тренда. При условии значимости такого влияния (структурных изменений) на характер тренда используется кусочно-линейная модель регрессии. Кусочно-линейная модель означает представление исходной совокупности данных ряда в виде двух частей. Одна часть данных моделируется просто линейной моделью с одним коэффициентом регрессии (углом наклона прямой) и представляет данные до момента (периода) структурных изменений. Вторая часть данных - это тоже линейная модель, но уже с иным коэффициентом регрессии (углом наклона).

После построения двух таких моделей (подмоделей) линейной регрессии получают уравнения двух соответствующих прямых. Если структурные изменения незначительно повлияли на характер тенденции ряда, то вместо построения точной кусочно-линейной модели вполне можно использовать единую аппроксимирующую модель, т.е. одну общую линейную зависимость (одну прямую), тоже вполне приемлемо представляющую данные в целом. Незначительное ухудшение в отдельных данных при этом непринципиально.

Если строится кусочно-линейная модель, то снижается остаточная сумма квадратов по сравнению с единым для всей совокупности уравнением тренда. В то же время разделение исходной совокупности на две части ведет к потере числа наблюдений и тем самым к снижению числа степеней свободы в каждом уравнении кусочно-линейной модели. Единое уравнение для всей совокупности данных позволяет сохранить число наблюдений исходной совокупности. Остаточная сумма квадратов по этому уравнению в то же время выше, чем такая же сумма для кусочно-линейной модели.

Выбор конкретной - кусочно-линейной или просто линейной - модели, т.е. единого уравнения тренда, зависит от соотношения между снижением остаточной дисперсии и потерей числа степеней свободы при переходе от единого уравнения регрессии к кусочно-линейной модели.

Оглавление

- Коэффициент корреляции, его значение и характеристика. Выбор формы уравнения тренда

- Коэффициент корреляции, его значение и характеристика

- Выбор формы уравнения тренда Статистические показатели социальной работы и методы их анализа

- Задачи

- Список использованных источников

Список литературы

1. Едронова В.Н., Малафеева М.В. Общая теория статистики: Учебник для вузов Изд. 2-е, перераб., доп. Издательство: Магистр, 2007.

2. Ефимова М.Р., Аброскин А.С., Бычкова С.Г.: Социально-экономическая статистика. Издательство: Высшее образование, 2011.

. Социально-экономическая статистика. Учебник. Под редакцией профессора Б. И. Башкатова. Издательство: Юнити-Дана, 2002.

Как купить готовую работу?
Авторизоваться
или зарегистрироваться
в сервисе
Оплатить работу
удобным
способом
После оплаты
вы получите ссылку
на скачивание
Страниц
29
Размер файла
132.24 КБ
Просмотров
170
Покупок
0
Коэффициент корреляции. Выбор формы уравнения тренда. Статистические показатели социальной работы и
Купить за 600 руб.
Похожие работы
Сумма к оплате
500 руб.
Купить
Заказать
индивидуальную работу
Гарантия 21 день
Работа 100% по ваши требованиям
от 1 000 руб.
Заказать
Прочие работы по предмету
103 972 студента обратились
к нам за прошлый год
2049 оценок
среднее 4.9 из 5
Сергей Хороший автор. принял заказ и выполнил в срок. Спасибо!
Сергей Работу сделали быстро, в срок, спасибо большое!!
Сергей Спасибо за работу!
Сергей Отличная работа
Сергей Автор всегда на связи, работа выполнена в срок, буду обращаться еще)
Сергей Спасибо за работу)
Сергей Благодарю за работу!
Сергей Благодарю за оперативное выполнение
Сергей Спасибо за работу! Очень грамотный специалист
Сергей Спасибо за качественную работу!