Jump to content

Двумерный анализ

Время ожидания между извержениями и продолжительность извержения гейзера Old Faithful в Йеллоустонском национальном парке , штат Вайоминг , США. Эта диаграмма рассеяния предполагает, что обычно существует два «типа» извержений: кратковременные и кратковременные и длительные и длительные.

Двумерный анализ — одна из простейших форм количественного (статистического) анализа . [1] Он включает в себя анализ двух переменных (часто обозначаемых как X , Y ) с целью определения эмпирической связи между ними. [1]

быть полезен при проверке простых гипотез связи Двумерный анализ может . Двумерный анализ может помочь определить, в какой степени становится легче узнать и предсказать значение одной переменной (возможно, зависимой переменной ), если мы знаем значение другой переменной (возможно, независимой переменной ) (см. также корреляцию и простую линейную регрессию ). . [2]

Двумерный анализ можно противопоставить одномерному анализу , при котором анализируется только одна переменная. [1] Как и одномерный анализ, двумерный анализ может быть описательным или логическим . Это анализ взаимосвязи между двумя переменными. [1] Двумерный анализ — это простой (с двумя переменными) частный случай многомерного анализа (когда одновременно исследуются множественные отношения между несколькими переменными). [1]

Двумерная регрессия

[ редактировать ]

Регрессия — это статистический метод, используемый для исследования того, как изменение одной или нескольких переменных предсказывает или объясняет изменение другой переменной. Двумерная регрессия направлена ​​на определение уравнения, представляющего оптимальную линию, которая определяет взаимосвязь между двумя переменными на основе определенного набора данных. Это уравнение впоследствии применяется для прогнозирования значений зависимой переменной, отсутствующей в исходном наборе данных. С помощью регрессионного анализа можно вывести уравнение кривой или прямой линии и получить коэффициент корреляции.

Простая линейная регрессия

[ редактировать ]

Простая линейная регрессия — это статистический метод, используемый для моделирования линейной зависимости между независимой переменной и зависимой переменной. Он предполагает линейную связь между переменными и чувствителен к выбросам. Наиболее подходящее линейное уравнение часто представляется в виде прямой линии, чтобы минимизировать разницу между прогнозируемыми значениями уравнения и фактическими наблюдаемыми значениями зависимой переменной.

Схема диаграммы рассеяния с простой линейной регрессией

Уравнение:

: независимая переменная (предиктор)

: зависимая переменная (результат)

: наклон линии

: -перехват

Линия регрессии наименьших квадратов (LSRL)

[ редактировать ]

Линия регрессии по методу наименьших квадратов — это метод простой линейной регрессии для моделирования линейной зависимости между двумя переменными, который служит инструментом для прогнозирования на основе новых значений независимой переменной. Расчет основан на методе критерия наименьших квадратов . Цель состоит в том, чтобы минимизировать сумму квадратов вертикальных расстояний (остатков) между наблюдаемыми значениями y и соответствующими прогнозируемыми значениями y для каждой точки данных.

Двумерная корреляция

[ редактировать ]

Двумерная корреляция — это мера того, являются ли две переменные коковарными и если да, то каким образом, то есть изменяется ли дисперсия одной линейно по мере изменения дисперсии другой.

Ковариацию может быть сложно интерпретировать в разных исследованиях, поскольку она зависит от масштаба или уровня используемых измерений. По этой причине ковариация стандартизируется путем деления на произведение стандартных отклонений двух переменных для получения коэффициента корреляции произведения и момента Пирсона (также называемого коэффициентом корреляции Пирсона или коэффициентом корреляции), который обычно обозначается буквой « р ». [3]

Коэффициент корреляции Пирсона используется, когда обе переменные измеряются по шкале интервалов или отношений. Другие коэффициенты корреляции или анализы используются, когда переменные не являются интервалами или отношениями или когда они не имеют нормального распределения. Примерами являются коэффициент корреляции Спирмена , тау Кендалла , бисериальная корреляция и анализ хи-квадрат.

Коэффициент корреляции Пирсона

В отношении корреляции следует выделить три важных замечания:

  • Наличие выбросов может серьезно исказить коэффициент корреляции.
  • Большие размеры выборки могут привести к статистически значимым корреляциям, которые могут иметь небольшое практическое значение или вообще не иметь его.
  • Невозможно сделать выводы о причинно-следственной связи, основываясь только на корреляционном анализе.

Когда есть зависимая переменная

[ редактировать ]

Если зависимая переменная — та, значение которой в некоторой степени определяется другой независимой переменной — является категориальной переменной , например, предпочтительной маркой зерновых, то пробит- или логит- регрессию (или полиномиальную пробит- или полиномиальную логит-регрессию можно использовать ). . Если обе переменные являются порядковыми , то есть они ранжируются в последовательности как первая, вторая и т. д., то ранговой корреляции можно вычислить коэффициент . Если только зависимая переменная является порядковой, упорядоченный пробит или упорядоченный логит можно использовать . Если зависимая переменная является непрерывной (либо уровень интервала, либо уровень соотношения, например, шкала температуры или шкала доходов), то простую регрессию можно использовать .

Если обе переменные представляют собой временные ряды определенный тип причинности, известный как причинность Грейнджера , можно проверить векторную авторегрессию , и выполнить для изучения межвременных связей между переменными.

Когда нет зависимой переменной

[ редактировать ]

Когда ни одна переменная не может рассматриваться как зависимая от другой, регрессия не подходит, но может подойти некоторая форма корреляционного анализа. [4]

Графические методы

[ редактировать ]

Графики , подходящие для двумерного анализа, зависят от типа переменной. Для двух непрерывных переменных диаграмма рассеяния представляет собой обычный график. Когда одна переменная является категориальной, а другая — непрерывной, ящичковая диаграмма обычно используется мозаичная диаграмма , а когда обе переменные являются категориальными , обычно используется . Эти графики являются частью описательной статистики .

См. также

[ редактировать ]
[ редактировать ]
  1. ^ Перейти обратно: а б с д и Эрл Р. Бэбби , Практика социальных исследований , 12-е издание, Wadsworth Publishing, 2009 г., ISBN   0-495-59841-0 , стр. 436–440.
  2. ^ Двумерный анализ , Социологический индекс
  3. ^ Сандилендс, Дебра (Далли) (2014). «Энциклопедия исследований качества жизни и благополучия, двумерный анализ, стр. 416–418» . СпрингерЛинк .
  4. ^ Чаттерджи, Самприт (2012). Регрессионный анализ на примере . Хобокен, Нью-Джерси: Уайли. ISBN  978-0470905845 .
  5. ^ М. Хагигат, М. Абдель-Мотталеб и В. Альхалаби (2016). Дискриминантный корреляционный анализ: объединение уровней признаков в реальном времени для мультимодального биометрического распознавания . Транзакции IEEE по информационной криминалистике и безопасности, 11 (9), 1984–1996.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 5a6586f72f11cc4534d7189ea3533edb__1703232240
URL1:https://arc.ask3.ru/arc/aa/5a/db/5a6586f72f11cc4534d7189ea3533edb.html
Заголовок, (Title) документа по адресу, URL1:
Bivariate analysis - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)