Сегрег
Разработчик(и) | Институт мелиорации и улучшения земель (ИЛРИ) |
---|---|
Написано в | Дельфи |
Операционная система | Microsoft Windows |
Доступно в | Английский |
Тип | Статистическое программное обеспечение |
Лицензия | Проприетарное бесплатное ПО |
Веб-сайт | Сегрег |
В области статистики и анализа данных прикладное программное обеспечение SegReg представляет собой бесплатный и удобный инструмент для анализа линейной сегментированной регрессии , позволяющий определить точку останова, в которой отношение между зависимой переменной и независимой переменной резко меняется. [1]
Особенности [ править ]
SegReg допускает введение одной или двух независимых переменных. Когда используются две переменные, сначала определяется связь между зависимой переменной и наиболее влиятельной независимой переменной, а затем находится связь между остатками и второй независимой переменной. Остатки — это отклонения наблюдаемых значений зависимой переменной от значений, полученных с помощью сегментированной регрессии по первой независимой переменной.
Точка останова находится численно путем принятия серии предварительных точек останова и выполнения линейной регрессии по обе стороны от них. Предварительная точка останова, которая обеспечивает наибольший коэффициент детерминации (в качестве параметра соответствия линий регрессии наблюдаемым значениям данных), выбирается в качестве истинной точки останова. Чтобы гарантировать, что линии по обе стороны от точки останова пересекаются друг с другом точно в точке останова, SegReg использует два метода и выбирает метод, обеспечивающий наилучшее соответствие.
SegReg распознает множество типов отношений и выбирает окончательный тип на основе статистических критериев, таких как значимость коэффициентов регрессии. Выходные данные SegReg предоставляют статистические доверительные пояса линий регрессии и блок достоверности для точки останова. [2] Уровень достоверности можно выбрать как 90%, 95% и 98% уверенности.
Для завершения утверждений о достоверности SegReg предоставляет дисперсионный анализ и таблицу Anova . [3]
На этапе ввода пользователь может указать предпочтение или исключение определенного типа. Предпочтение определенного типа принимается только тогда, когда оно статистически значимо, даже если значимость другого типа выше.
ИЛРИ [4] предоставляет примеры применения к таким величинам, как урожайность сельскохозяйственных культур , глубина грунтовых вод и засоление почвы .
Со списком публикаций, в которых используется SegReg, можно ознакомиться. [5]
Уравнения [ править ]
Если присутствует только одна независимая переменная, результаты могут выглядеть так:
- X < BP ==> Y = A 1 .X + B 1 + R Y
- X > BP ==> Y = A 2 .X + B 2 + R Y
где BP — точка останова, Y — зависимая переменная, X — независимая переменная, A — коэффициент регрессии , B — константа регрессии и R Y — остаток Y.Если присутствуют две независимые переменные, результаты могут выглядеть так:
- X < BP X ==> Y = A 1 .X + B 1 + R Y
- X > BP X ==> Y = A 2 .X + B 2 + R Y
- Z < BP Z ==> R Y = C 1 .Z + D 1
- Z > BP Z ==> R Y = C 2 .Z + D 2
где, кроме того, BP X — это BP X, BP Z — это BP Z, Z — вторая независимая переменная, C — коэффициент регрессии , а D — константа регрессии для регрессии R Y на Z.
Подстановка выражений R Y из второй системы уравнений в первую дает:
- X < BP X и Z < BP Z ==> Y = A 1 .X + C 1 .Z + E 1
- X < BP X и Z > BP Z ==> Y = A 1 .X + C 2 .Z + E 2
- X > BP X и Z < BP Z ==> Y = A 2 .X + C 1 .Z + E 3
- X > BP X и Z > BP Z ==> Y = A 2 .X + C 2 .Z + E 4
где E 1 = B 1 +D 1 , E 2 = B 1 +D 2 , E 3 = B 2 +D 1 и E 4 = B 2 +D 2 .
Альтернатива [ править ]
В качестве альтернативы регрессии по обе стороны от точки излома (порога) можно использовать метод частичной регрессии для нахождения максимально длинного горизонтального участка с незначительным коэффициентом регрессии, за пределами которого имеется определенный наклон со значительным коэффициентом регрессии. Альтернативный метод можно использовать для сегментированных регрессий типа 3 и типа 4, когда целью является определение уровня толерантности зависимой переменной для изменения количества независимой объясняющей переменной (также называемой предиктором). [6]
Прикрепленный рисунок относится к тем же данным, что показаны на синем графике в информационном поле вверху этой страницы. Здесь урожай пшеницы имеет толерантность к засолению почвы до уровня ЕС=7,1 дСм/м вместо 4,6 на синем рисунке. Однако соответствие данных за порогом не такое хорошее, как на синем рисунке, который был сделан с использованием принципа минимизации суммы квадратов отклонений наблюдаемых значений от линий регрессии во всей области независимой переменной. X (т.е. максимизация коэффициента детерминации), тогда как частичная регрессия предназначена только для нахождения точки, в которой горизонтальный тренд сменяется наклонным.
См. также [ править ]
Ссылки [ править ]
- ^ Статистические принципы сегментированной регрессии с точкой излома
- ^ определение доверительного интервала точки излома
- ^ F-тесты в дисперсионном анализе для сегментированной линейной регрессии
- ^ Исследование дренажа на фермерских полях: анализ данных , 2002. Вклад в проект «Жидкое золото» Международного института мелиорации и улучшения земель (ILRI), Вагенинген, Нидерланды. [1]
- ^ Список публикаций с использованием SegReg
- ^ Бесплатное программное обеспечение для частичной регрессии.