Название: Основы математической статистики - Методические указания (К.П. Кадомская)

Жанр: Экономика

Просмотров: 1283


3.4.4. определение параметров линейной регрессии

 

Поставим задачу определения статистических оценок параметров линейной регрессии случайной величины  Y  на  Х:

                                                M [Y/x] = .                                    (3.24)

Статистическая оценка регрессии запишется в виде:

                                                          ,                                           (3.25)

где  b0  и  b1 – статистические оценки коэффициентов линейной регрессии;

            – статистическая  оценка  условного  математического  ожидания

                        СВ Y.

          Коэффициенты b0 и b1 могут быть определены с помощью метода наименьших квадратов: значения этих коэффициентов должны минимизировать сумму квадратов отклонений эмпирических значений yj от прямой, описываемой уравнением (3.25). На рис. 3.3 эмпирические значения yj обозначены дискретными значками, линия регрессии – сплошной линией.

 

 

 

 

 

 

Рис. 3.3.  К пояснению метода наименьших квадратов

 

Согласно методу наименьших квадратов коэффициенты b0 и b1 определяются из выражений:

                                                                                     (3.26)

где .

Условиям (3.26) отвечают следующие выражения для коэффициентов:

                                    ,                               (3.27)

где          ,     .

Статистическая значимость построенной линии регрессии может быть оценена с помощью двустороннего критерия Фишера. В рассматриваемой задаче критерий Фишера при условии, что  , формируется как

                                              ,                                                  (3.28)

 – остаточная дисперсия (показатель ошибки предсказания уравнением регрессии результатов опыта);

 

 – дисперсия выборки  .

Уровень значимости гипотезы о правомочности построенной линии регрессии зависит от величины критерия F и чисел степеней свободы сумм числителя n1 = (n–1) и знаменателя n2 = (n–2) в выражении (3.28). В рассматриваемом расчетном задании n = 20. Значения уровня значимости в этом случае, заимствованные из [3], приведены в табл. 3.3  и на рис. 3.4.

 

Т а б л и ц а  3.3

q = j(F, n1 =19,  n2 = 18)

 

q

0.05

0.1

0.20

0.50

1.0

F

2.581

2.206

1.847

1.379

1.004

 

Так, например, в случае выборки, для которой построена линейная регрессия, приведенная на рис. 3.3, F = 1.3  и  q = 0.58. Следовательно, гипотеза о линейности регрессии Y  на  X  не противоречит располагаемому статистическому материалу с уровнем значимости  q = 0.58.

 

 

 

 

 

 

       

 

Рис. 3.4   Уровни значимости при