Разработка прогноза продуктивности на примере сельскохозяйственного предприятия ЗАО "Троицкое"

3.4 Корреляционно-регрессионный анализ оценки факторов влияющих на молочную продуктивность скота в ЗАО «Троицкое»

Корреляционный-регрессионный анализ - это совокупность методов обнаружения так называемой корреляционной-регрессионной зависимости между случайными величинами.

Для двух случайных величин Х и Y корреляционный анализ состоит из следующих этапов:

построение корреляционного поля и составление корреляционной таблицы;

вычисление выборочного коэффициента корреляции;

проверка статической гипотезы о значимости корреляционной связи.

Рассмотрим подробнее каждый из указанных этапов на примере составления прогноза продуктивности молочного скота в ЗАО «Троицкое» на 2014 год.

Корреляционное поле и корреляционная таблица являются исходными данными при корреляционном анализе. Пусть , , - результаты парных наблюдений над случайными величинами Х и Y. Изображая полученные результаты в виде точек в декартовой системе координат, получим корреляционное поле. По характеру расположения точек поля можно составить предварительное представление о форме зависимости случайных величин (например, о том, что одна из них в среднем возрастает или убывает с возрастанием другой).

Проведем исследование зависимости между среднемесячным удоем на одну корову в ЗАО «Троицкое» и расходами на содержание одной коровы в условных единицах.Данные представлены в таблице 13.

Таблица 13. Таблица зависимости данных удоя, ц и затрат, руб на содержание коров в ЗАО «Троицкое»

Построим корреляционное поле и сделаем предварительный вывод о форме зависимости случайных величин.Данная таблица необходима для проведения проверки зависимости данных,в нашем случае зависимость можно заметить на рис 2.

Корреляционное поле, построенное по статистическим данным, приведено на рис. 2.

Анализ рис. 2 позволяет сделать вывод о наличии сильной линейной статистической связи между среднемесячным удоем на одну корову и затратами на её содержание. При этом связь имеет положительную тенденцию, т.е. с ростом переменной X наблюдается увеличение отклика Y.

Рис.2 Корреляционное поле

При большом объеме выборки результаты группируются и представляются в виде корреляционной таблицы.

Предположим, что на двадцать коров ЗАО «Троицкое» установлены затраты на содержание X и размер удоя Y.В таблице 14 коровы ранжированы по величине затрат на их содержание. Значения удоя взяты по среди двадцатки самых продуктивных коров ЗАО «Троицкое»

Таблица 14.Корелляционная таблица

Порядковый номер	Затраты на содержание, руб	Среднемесячный удой, ц
1	8	8
2	8	8,5
3	8	7,2
4	9	8,5
5	9	8
6	9	8,8
7	9	9,5
8	9	8,2
9	10	9
10	10	10
11	10	9,2
12	10	10,6
13	10	9,5
14	11	9
15	11	12
16	11	11,5
17	11	10
18	12	12
19	12	11
20	12	10

Исходные данные, ранжированные по величине затрат на содержание одной коровы, уже могут быть использованы при ответе на вопрос о наличии или отсутствии корреляционной связи. Этот простейший прием обнаружения связи называется сопоставлением двух параллельных рядов. Согласно этому приему, значения факторного признака X располагают в неубывающем порядке и затем прослеживают направление изменения результативного признака Y.

По таблице 14 можно увидеть, что в целом для всей совокупности коров ЗАО «Троицкое» увеличение затрат на их содержание приводит к увеличению объема удоя. Хотя в отдельных случаях наличие такой зависимости может не усматриваться. Например, сопоставим данные по коровам с порядковыми номерами 7 и 11. Здесь можно увидеть даже обратное соотношение: у коровы 11 объем удоя меньше, чем у коровы 7, хотя затраты на содержание выше. В каждом отдельном случае объем удоя, будет зависеть не только от размера затрат на содержание коровы, но и от того, как сложатся прочие факторы, определяющие величину результативного признака.

Однако наличие большого числа различных значений результативного признака, соответствующих одному и тому же значению признака-фактора, затрудняет восприятие таких параллельных рядов. Особенно это сказывается при большом числе единиц, составляющих изучаемую совокупность. В таких случаях целесообразнее воспользоваться для установления факта наличия связи корреляционной таблицей. Построение корреляционной таблицы начинают с группировки значений факторного и результативного признаков. Поскольку в приводимом примере факторный признак представлен всего пятью вариантами повторяющихся значений, достаточно в первом столбце корреляционной таблицы выписать эти результаты. Для результативного признака необходимо определить величину интервала группировки. Это можно сделать с помощью формулы Стержэсса:

В корреляционной таблице факторный признак X, как правило, располагают в строках, а результативный признак Y - в столбцах таблицы. Числа, расположенные на пересечении строк и столбцов таблицы, означают частоту повторения данного значения X и Y:

Таблица 15.Кореляционная таблица(Стержэсса)

Середина j-го интервала по Y	7,68	8,65	9,62	10,59	11,56
группы по Y группы по X	7,2; 8,16	8,17; 9,13	9,14; 10,1	10,11; 11,07	11,08; 12,07
8 9 10 11 12	2 1	1 3 1 1	1 3 1 1	1 1	2 1	3 5 5 4 3	800 865 962 1035 1059
	3	6	6	2	3	20

Данная корреляционная таблица уже при общем знакомстве дает возможность выдвинуть предположение о наличии или отсутствии связи, а также выяснить ее направление. Если частоты в корреляционной таблице расположены на диагонали из левого верхнего угла в правый нижний угол (т.е. бульшим значениям фактора соответствуют бульшие значения функции), то можно предположить наличие прямой корреляционной зависимости между признаками. Если же частоты расположены по диагонали из правого верхнего угла в левый нижний, то предполагают наличие обратной связи между признаками.

Необходимо подчеркнуть, что при рассмотрении корреляционной таблицы важно установить расположение основной части частот. Возможны варианты, когда все клетки корреляционной таблицы окажутся заполненными. Однако это обстоятельство еще не означает, что корреляционная связь между признаками отсутствует. Нужно установить, как расположена в таблице основная масса частот. Для того, чтобы сделать восприятие корреляционной таблицы более доступным и в целях более четкого выявления основной тенденции связи, можно для каждой строки рассчитать средние значения результативного признака Y, соответствующие определенному значению признака-фактора X. Так, в рассматриваемом примере среднее число удоя для первой группы, состоящей из трех коров, на содержание которых ЗАО «Троицкое» тратит 8 усл. ден. ед., будет равно 8 центнеров. Для следующей группы, состоящей из пяти коров, на которых затраты на содержание 9 усл. ден. ед. будет равно 8,65 центнера.

Итак, увеличение средних значений результативного признака с увеличением значений факторного признака еще раз свидетельствует о возможном наличии прямой корреляционной зависимости объема удоя, от затрат на содержания коров.

Корреляционная таблица позволяет сжато,доступно, компактно изложить материал.

Содержание