Дисперсионный анализ как средство оценки полученных результатов.

Автор:  Лазарева Н.Ю., технолог по птицеводству «Коудайс МКорма», канд.сх наук, член ВНАП.

В предыдущей статье «Оценка результатов испытаний в условиях птицефабрики» мы обсуждали вопрос оценки достоверности влияния какого-либо фактора на рост и развитие цыплят. При этом речь шла о сравнении двух выборок или двух групп, например, птичников – контрольных и опытных. Но на практике часто мы имеем дело с несколькими выборками одновременно, когда исследуемый фактор имеет разные градации, как количественные, так и качественные. Например, это могут быть разные дозы лекарства (количественные градации) или ряд разных лекарств (качественная градация). Выборки можно объединить в единый статистический комплекс при следующих условиях: 1) факторы воздействия должны быть независимы друг от друга, 2) выборки должны производиться способом случайного отбора из нормально распределяющейся совокупности. В дисперсионном анализе принято называть признаки, которые меняются под действием факторов – результативными. В птицеводстве это как правило показатели выращивания (зоотехнические и ветеринарные) – сохранность, выбраковка, прирост живой массы, конверсия корма и т.п. При этом они (результативные признаки) могут быть выражены в различных условных единицах – процентах, индексах и т.п.

С математической точки зрения суть дисперсионного анализа заключается в разложении общей дисперсии всего статистического комплекса на ее составляющие и сравнении их друг с другом. Если на результативный признак действует один фактор в нескольких градациях (однофакторный дисперсионный анализ), составляющих общей дисперсии будет две: внутригрупповая (остаточная) и межгрупповая (факториальная). Для их расчета используют так называемые девиаты (D) и зависимость между ними выражается следующим равенством: Dy=Dx+De. При этом Dx – межгрупповая девиата (сумма квадратов отклонений групповых средних от общей средней комплекса), De- внутригрупповая девиата (сумма из сумм квадратов отклонений отдельных вариант от их групповых средних), Dy-общая девиата (сумма квадратов отклонений вариант от общей средней). Отношении девиаты к соответствующему числу степеней свободы и будет составлять выборочную дисперсию – факториальную или остаточную или общую.

Формулы, по которым рассчитываются девиаты, следующие:

Dy=∑х² - H, Dx= – H, De=Dy-Dx, где H.

Рассмотрим следующий пример. На птицефабрике N испытывали разные дозировки антибиотика, который должен был способствовать лучшей сохранности цыплят. Всего было 4 разных дозировки препарата. Поэтому можно считать, что на птицу влиял регулируемый фактор в четырех градациях. В каждом варианте опыта (градации) было 5 птичников, то есть общее количество наблюдений равнялось 20 (объем дисперсионного комплекса).

Таблица 1. Результаты применения кормового антибиотика – сохранность бройлеров за период выращивания.

Дозы препарата

(фактор А)

Сохранность цыплят по птичникам

Средняя сохранность, %

1

2

3

4

5

50 г/т

93

94

92

94

96

93,8

65 г/т

95

96

95

97

96

95,8

80 г/т

95

95,5

96,5

96

94,5

95,5

100 г/т

95,5

97

97,5

94,5

95,5

96,0

Получаем таблицу, в которой а – это количество градаций фактора, действие которого оценивается, n – количество повторов ( в нашем примере – птичников), ∑х – сумма значений (вариант) по каждой градации (варианту опыта), (∑х)² – квадрат этой суммы, ∑х² – сумма квадратов каждого значения, входящего в данную градацию (вариант опыта), N – общее число наблюдений или объем дисперсионного комплекса. В правой колонке в нижних строчках также даны суммы ∑х, (∑х)² и ∑х² по всем градациям фактора. Для удобства расчетов отнимаем от каждой цифры 90, на конечный результат это не повлияет. Данные по сохранности по птичникам располагаем по вертикали, каждая колонка цифр соответствует одной из четырех градаций фактора воздействия (табл.5). Рассчитываем величины ∑х, (∑х)2 , ∑х2 по каждой градации, а также суммы этих величин по всем четырем градациям.

Таблица 2. Расчет дисперсионного комплекса.

Сохранность по птичникам, %

Варианты опыта (градации фактора воздействия)

Суммы

50 г/т

65 г/т

80 г/т

100 г/т

Х-90

3

5

5

5,5

а=4

4

6

5,5

7

2

5

6,5

7,5

4

7

6

4,5

6

6

4,5

5,5

N

5

5

5

5

N=20

∑х

19

29

27,5

30

105,5

(∑х)2

361

841

756,25

900

2858,25

∑х2

81

171

153,75

186

591,75

Далее рассчитываем девиаты:

Dy=591,75 – 105,52/20=591,75 – 556,51=35,24

DA=2858,25/5 – 556,5125=571,65 – 556,51=15,14

De=35,24-15,14=20,1

И дисперсии:

SA2===5,0458, Se2===1,25625.

Полученные результаты сводим в заключительную таблицу и определяем соотношение дисперсий:

FA=SA2/Se2=5,0458/1,25625=4,02

Таблица 3. Результаты анализа дисперсий.

Варьирование

k

D

S2

Fфакт

Уровень значимости

(F статист.)

0,05

0,01

По фактору A

3

15,14

5,04583

4,02

2,85

4,44

Остаточное

16

20,1

1,25625

-

Общее

19

35,24

1,8547

-

Для того, чтобы сделать вывод о том, повлияла или нет доза антибиотика на сохранность цыплят, сравниваем полученную величину соотношения факториальной и остаточной дисперсий – 4,02 с критическими (Fстатист.) для двух уровней значимости (берем из таблицы, см.Приложение 3). Как видим, полученная нами в ходе расчетов цифра больше значения для 95%-го уровня доверительной вероятности, но меньше 99%-го. Поэтому можно сделать вывод, что дозировка антибиотика повлияла на увеличение сохранности цыплят с вероятностью 95%.

Очень часто на практике мы сталкиваемся с действием на организм не одного, а сразу нескольких факторов. В таком случае стоит вопрос не только о достоверности влияния каждого из факторов , но и о доле влияния каждого фактора на результативный признак. Алгоритм дисперсного двухфакторного анализа в принципе не отличается от однофакторного, но более громоздкий, поскольку приходится оценивать не один, а два фактора, а также их совместное действие. Это можно изобразить в виде следующей схемы:

Общая сумма квадратов отклонений Dy содержит четыре компонента варьирования: Dy=Da+Db+Dab+De, а общая факториальная сумма квадратов отклонений Dx состоит из трех членов: Dx=Da+Db+Dab.

Дисперсионный анализ двухфакторных равномерных комплексов отличается от анализа однофакторных тем, что к расчету девиат Dy, Dx и De добавляется расчет факториальных девиат Da, Db и девиаты совместного действия факторов Dab. Последняя равна Dab=Dx-Da-Db. Также необходимо определить степени свободы для факториальных дисперсий А, В и дисперсии совместного действия А и В.

Рассмотрим следующий пример. Изучали действие двух иммуномодуляторов на показатели естественной резистентности цыплят-бройлеров. Животные получали препарат двумя путями: через корм и через воду. В частности, был определен уровень лизоцима в сыворотке крови. Кровь отбирали на забое, от шести голов на каждый вариант опыта. Результаты приведены в таблице 4.

Таблица 4. Уровень лизоцима в сыворотке крови цыплят (%).

Способ дачи препарата – фактор В

Иммуномодуляторы – фактор А

Среднее по В

А1

А2

Результаты определения уровня лизоцима

Результаты определения уровня лизоцима

Через

воду В1

48,5

48,3

47,5

46,6

46,5

45,8

46,87

47,1

47,4

46,4

46,5

45,7

46,1

Через корм В2

47,4

46,5

45,7

46,1

45,4

46,5

46,18

46,7

47,5

46,2

45,2

46,0

44,9

Среднее по А

47,1

45,94

Для удобства расчетов отнимаем от каждой цифры 42 и умножаем на 10 (чтобы избавиться от дробей) и заносим данные в таблицу – по каждой градации каждого фактора отдельно (Табл.8). Как можно видеть, в данном расчете требуется определить ∑х, (∑х)2 , ∑х2 и их суммы не только по всему дисперсионному комплексу, но и по каждому фактору отдельно - ∑xA, ∑xB и т.д. Также в данную таблицу можно занести значения H.

Таблица 5. Расчет двухфакторного дисперсионного комплекса.

A, B

X

А1

А2

Суммы

В1

В2

В1

В2

X (преобразованные показатели лизоцима)

65 63 55

51 54 44

54 45 37

47 55 42

46 45 38

45 37 41

41 34 45

32 40 29

а=2

b=2

n

6

6

6

6

N=24

x

332

280

252

221

1085

(x)2

110224

78400

63504

48841

-

(x)2/n

18370,67

13066,67

10584

8140,17

50161,51

∑x²

18672

13308

10660

8327

50967

nA

12

12

24

∑xA

332+280=612

252+221=473

-

(∑xA)2/nA

31212

18644,0833

49856,0833

nB

12

12

24

∑xB

332+252=584

280+221=501

-

(∑xB)2/nB

28421,33

20916,75

49338,08

После заполнения такой таблице можно приступить к расчету девиат, не забывая о том, что мы умножали все цифры на 10, чтобы избавиться от дробей. Соответственно каждую девиату надо будет разделить на 100.

Dy(общая)= (50967 – 10852/24)= (50967 – 49051,042)=1915,958=19,16

Dx (межгрупповая)= (50161,51 – 10852/24)= (50161,51 – 49051,042) = 1109,468=11,10

De (остаточная) = 19,16 – 11,10 = 8,06

DA(по фактору А)= (49856,0833 – 49051,042)= 805,0413=8,05

DB(по фактору В)= (49338,08 – 49051,042)= 287,038=2,87

DAB(совместная по А,В)=Dx - DA – DB=11,10 – 8,05 – 2,87=0,18

Далее рассчитываем дисперсии варьирования (с учетом степеней свобод) фактора А, фактора В, совместного А и В и остаточного.

SA2=8,05/1=8,05, SB2=2,87/1=2,87, SAB2=0,18/1=0,18, Se2=8,06/20=0,403 и Sy2=19,16/23=0,833.

Полученные результаты сводим в заключительную таблицу и определяем соотношение дисперсий:

FA = SA2/Se2=8,05/0,403=19,98, FB=SB2/Se2= 2,87/0,403=7,122 и FAB=SAB2/Se2=0,18/0,403=0,447.

Таблица 6. Результаты двухфакторного дисперсионного анализа.

Варьирование

k

D

Fфакт.

Уровень значимости

0,05

0,01

По фактору A

1

8,05

8,05

19,98

4,35

8,10

По фактору B

1

2,87

2,87

7,122

Совместно AB

1

0,18

0,18

0,447

Остаточное

20

8,06

0,403

-

Общее

23

19,16

0,833

-

Из данных табл. 6 видно, что критерий Фишера (F) для фактора А больше критического значения - 8,10 – при уровне значимости 0,01, а для фактора В – больше критического значения 4,35 при уровне значимости 0,05. Из этого следует, что и вид иммуномодулятора, и способ его дачи достоверно усиливает резистентность цыплят, что выражается в увеличении уровня лизоцима в сыворотке крови. Фактор «способ дачи препарата» имеет меньшее влияние по сравнению с фактором « тип препарата». Практический вывод из полученных результатов: для усиления естественной резистентности цыплят оптимально применять иммуномодулятор А1 путем его выпойки.

Таким образом, дисперсионный анализ можно успешно использовать для оценки достоверности влияния тех или иных факторов на изучаемый объект. Существуют специальные статистические компьютерные программы по осуществлению дисперсионного анализа, которые существенно облегчают расчеты при наличии большого количества данных.

Приложение 1. Сводная таблица однофакторного дисперсионного анализа.

Варьирование

Числа степеней свободы

Суммы квадратов отклонений или Девиаты D

Средние квадраты отклонений или дисперсии S2

Дисперсионное отношение F факт.

По фактору А

kA=a-1

DA

SA2=DA/kA

Fфакт.=SA2/Se2

Остаточное

Ke=N-a

De

Se2=De/ke

-

Общее

ky=N-1

Dy

Sy2=Dy/ky

-

Приложение 2. Сводная таблица двухфакторного дисперсионного анализа.

Варьирование

Числа степеней свободы

Девиаты

Дисперсии

Fфакт.

По фактору А

kA=a-1

DA

SA2=DA/kA

SA2/Se2

По фактору В

kB=b-1

DB

SB2=DB/kB

SB2/Se2

Совместно АВ

kAB=(a-1)(b-1)

DAB

SAB2=DAB/kAB

SAB2/Se2

Остаточное

Ke=N-ab

De

Se2=De/ke

-

Общее

Ky=N-1

Dy

-

-

Приложение 3. Значения F-критерия Фишера при разных уровнях значимости 0,05 (верхняя строка) и 0,01 (нижняя строка).

k2

k1 – степени свободы для большей дисперсии

1

2

3

4

5

6

7

8

9

10

20

30

1

161

4052

200

4999

216

5403

225

5625

230

5764

234

5859

237

5928

239

5982

241

6022

242

6056

248

6209

250

6261

254

6366

2

18,51

98,49

19

99,01

19,16

99,17

19,25

99,25

19,30

99,30

19,33

99,33

19,36

99,34

19,37

99,36

19,38

99,38

19,39

99,40

19,44

99,45

19,46

99,47

19,5099,50

3

10,13

34,12

9,55

30,81

9,28

29,46

9,12

28,71

9,01

28,24

8,94

27,91

8,88

27,67

8,84

27,49

8,81

27,34

8,78

27,23

8,66

26,69

8,62

26,50

8,53

26,12

4

7,71

21,20

6,94

18,00

6,59

16,69

6,39

15,98

6,26

15,52

6,16

15,21

6,09

14,98

6,04

14,80

6,00

14,66

5,96

14,54

5,80

14,02

5,75

13,83

5,63

13,46

5

6,61

16,26

5,79

13,27

5,41

12,06

5,19

11,39

5,05

10,97

4,95

10,67

4,88

10,45

4,82

10,27

4,78

10,15

4,74

10,05

4,56

9,55

4,50

9,38

4,36

9,02

6

5,99

13,74

5,14

10,92

4,76

9,78

4,53

9,15

4,39

8,75

4,28

8,47

4,21

8,26

4,15

8,10

4,10

7,98

4,06

7,87

3,87

7,39

3,81

7,23

3,67

6,88

7

5,59

12,25

4,74

9,55

4,35

8,45

4,12

7,85

3,97

7,46

3,87

7,19

3,79

7,00

3,73

6,84

3,68

6,71

3,63

6,62

3,44

6,15

3,38

5,98

3,23

5,65

8

5,32

11,26

4,46

8,65

4,07

7,59

3,84

7,01

3,69

6,63

3,58

6,37

3,50

6,19

3,44

6,03

3,39

5,91

3,34

5,82

3,15

5,36

3,08

5,20

2,93

4,86

9

5,12

10,56

4,26

8,02

3,86

6,99

3,63

6,42

3,48

6,06

3,37

5,80

3,29

5,62

3,23

5,47

3,18

5,35

3,14

5,26

2,94

4,80

2,86

4,64

2,71

4,31

10

4,96

10,04

4,10

7,56

3,71

6,55

3,48

5,99

3,33

5,64

3,22

5,39

3,14

5,21

3,07

5,06

3,02

4,95

2,98

4,85

2,77

4,41

2,70

4,25

2,54

3,91

20

4,35

8,10

3,49

5,85

3,10

4,94

2,87

4,43

2,71

4,10

2,60

3,87

2,52

3,71

2,45

3,56

2,40

3,45

2,35

3,37

1,12

2,94

2,04

2,77

1,84

2,42

30

4,17

7,56

3,32

5,39

2,92

4,51

2,69

4,02

2,53

3,70

2,42

3,47

2,34

3,30

2,27

3,17

2,21

3,06

2,16

2,98

1,93

2,55

1,84

2,39

1,62

2,01

3,64

6,63

3,00

4,61

2,60

3,78

2,37

3,32

2,21

3,02

2,10

2,80

2,01

2,64

1,94

2,51

1,88

2,41

1,83

2,32

1,57

1,88

1,46

1,70

1,00

1,00