Jump to content

Двумерные данные

В статистике двумерные данные — это данные о каждой из двух переменных , где каждое значение одной из переменных сопряжено со значением другой переменной. [1] Это специфический, но очень распространенный случай многомерных данных . Связь можно изучить с помощью табличного или графического отображения или с помощью выборочной статистики, которую можно использовать для вывода. Обычно было бы интересно исследовать возможную связь между двумя переменными. [2] Метод, используемый для исследования связи, будет зависеть от уровня измерения переменной. Эту ассоциацию, включающую ровно две переменные, можно назвать двумерной корреляцией или двумерной ассоциацией.

Для двух количественных переменных (интервал или соотношение на уровне измерения ) можно использовать диаграмму рассеяния, а коэффициент корреляции или модель регрессии . для количественной оценки связи можно использовать [3] Для двух качественных переменных (номинальных или порядковых по уровню измерения ) для просмотра данных можно использовать таблицу сопряженности , а также можно использовать меру связи или тест независимости. [3]

Если переменные являются количественными, пары значений этих двух переменных часто представляются как отдельные точки на плоскости с использованием диаграммы рассеяния . Это сделано для того, чтобы можно было легко увидеть взаимосвязь (если она есть) между переменными. [4] Например, двумерные данные на диаграмме рассеяния можно использовать для изучения взаимосвязи между длиной шага и длиной ног.В двумерной корреляции выбросы могут быть невероятно проблематичными, если они включают в себя оба крайних значения по обеим переменным. Лучший способ найти эти выбросы — посмотреть на диаграммы рассеяния и посмотреть, выделяются ли какие-либо точки данных между переменными.

Зависимые и независимые переменные

[ редактировать ]

В некоторых случаях двумерных данных определяется, что одна переменная влияет или определяет вторую переменную, и термины «зависимые» и «независимые переменные» используются для различения двух типов переменных. В приведенном выше примере длина ног человека является независимой переменной. Длина шага определяется длиной ног человека, поэтому является зависимой переменной. Длинные ноги увеличивают длину шага, но увеличение длины шага не приведет к увеличению длины ваших ног. [5]

Корреляция между двумя переменными определяется как сильная или слабая корреляция и оценивается по шкале от –1 до 1, где 1 – идеальная прямая корреляция, –1 – идеальная обратная корреляция, а 0 – отсутствие корреляции. В случае длинных ног и больших шагов будет сильная прямая корреляция. [6]

Анализ двумерных данных

[ редактировать ]

При анализе двумерных данных обычно либо сравнивают сводную статистику каждой из переменных, либо используют регрессионный анализ , чтобы определить силу и направление конкретной взаимосвязи между переменными. Если каждая переменная может принимать только одно из небольшого числа значений, например, только «мужской» или «женский», или только «левша» или «правша», то совместное распределение частот можно отобразить в непредвиденном случае. таблица , которую можно проанализировать на предмет силы связи между двумя переменными.

  1. ^ «Двумерный» . Вольфрам Исследования . Проверено 15 августа 2011 г.
  2. ^ Мур, Дэвид; Маккейб, Джордж (1999). Введение в практику статистики (Третье изд.). Нью-Йорк: WH Freeman and Company. п. 104.
  3. ^ Jump up to: а б Отт, Лайман; Лонгнекер, Майкл (2010). Введение в статистические методы и анализ данных (Шестое изд.). Бельмонт, Калифорния: Брукс/Коул. стр. 102–112.
  4. ^ Национальный совет учителей математики. «Проблема статистики и вероятности». Получено 7 августа 2013 г. с http://www.nctm.org/uploadedFiles/Statistics%20and%20Probability%20Problem%202.pdf#search=%22bivariate . [ постоянная мертвая ссылка ] данные%22
  5. ^ Национальный центр статистики образования. «Что такое независимые и зависимые переменные? Детская зона NCES». Получено 7 августа 2013 г. с http://nces.ed.gov/nceskids/help/user_guide/graph/variables.asp .
  6. ^ Пирс, Род. (4 января 2013 г.). «Корреляция». Математика — это весело. Получено 7 августа 2013 г. с http://www.mathsisfun.com/data/correlation.html.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: fd49465b78687be35746d96a7a473a94__1718350320
URL1:https://arc.ask3.ru/arc/aa/fd/94/fd49465b78687be35746d96a7a473a94.html
Заголовок, (Title) документа по адресу, URL1:
Bivariate data - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)