Двумерные данные
Эта статья нуждается в дополнительных цитатах для проверки . ( июнь 2009 г. ) |
В статистике двумерные данные — это данные о каждой из двух переменных , где каждое значение одной из переменных сопряжено со значением другой переменной. [1] Это специфический, но очень распространенный случай многомерных данных . Связь можно изучить с помощью табличного или графического отображения или с помощью выборочной статистики, которую можно использовать для вывода. Обычно было бы интересно исследовать возможную связь между двумя переменными. [2] Метод, используемый для исследования связи, будет зависеть от уровня измерения переменной. Эту ассоциацию, включающую ровно две переменные, можно назвать двумерной корреляцией или двумерной ассоциацией.
Для двух количественных переменных (интервал или соотношение на уровне измерения ) можно использовать диаграмму рассеяния, а коэффициент корреляции или модель регрессии . для количественной оценки связи можно использовать [3] Для двух качественных переменных (номинальных или порядковых по уровню измерения ) для просмотра данных можно использовать таблицу сопряженности , а также можно использовать меру связи или тест независимости. [3]
Если переменные являются количественными, пары значений этих двух переменных часто представляются как отдельные точки на плоскости с использованием диаграммы рассеяния . Это сделано для того, чтобы можно было легко увидеть взаимосвязь (если она есть) между переменными. [4] Например, двумерные данные на диаграмме рассеяния можно использовать для изучения взаимосвязи между длиной шага и длиной ног.В двумерной корреляции выбросы могут быть невероятно проблематичными, если они включают в себя оба крайних значения по обеим переменным. Лучший способ найти эти выбросы — посмотреть на диаграммы рассеяния и посмотреть, выделяются ли какие-либо точки данных между переменными.
Зависимые и независимые переменные
[ редактировать ]В некоторых случаях двумерных данных определяется, что одна переменная влияет или определяет вторую переменную, и термины «зависимые» и «независимые переменные» используются для различения двух типов переменных. В приведенном выше примере длина ног человека является независимой переменной. Длина шага определяется длиной ног человека, поэтому является зависимой переменной. Длинные ноги увеличивают длину шага, но увеличение длины шага не приведет к увеличению длины ваших ног. [5]
Корреляция между двумя переменными определяется как сильная или слабая корреляция и оценивается по шкале от –1 до 1, где 1 – идеальная прямая корреляция, –1 – идеальная обратная корреляция, а 0 – отсутствие корреляции. В случае длинных ног и больших шагов будет сильная прямая корреляция. [6]
Анализ двумерных данных
[ редактировать ]При анализе двумерных данных обычно либо сравнивают сводную статистику каждой из переменных, либо используют регрессионный анализ , чтобы определить силу и направление конкретной взаимосвязи между переменными. Если каждая переменная может принимать только одно из небольшого числа значений, например, только «мужской» или «женский», или только «левша» или «правша», то совместное распределение частот можно отобразить в непредвиденном случае. таблица , которую можно проанализировать на предмет силы связи между двумя переменными.
Ссылки
[ редактировать ]- ^ «Двумерный» . Вольфрам Исследования . Проверено 15 августа 2011 г.
- ^ Мур, Дэвид; Маккейб, Джордж (1999). Введение в практику статистики (Третье изд.). Нью-Йорк: WH Freeman and Company. п. 104.
- ^ Jump up to: а б Отт, Лайман; Лонгнекер, Майкл (2010). Введение в статистические методы и анализ данных (Шестое изд.). Бельмонт, Калифорния: Брукс/Коул. стр. 102–112.
- ^ Национальный совет учителей математики. «Проблема статистики и вероятности». Получено 7 августа 2013 г. с http://www.nctm.org/uploadedFiles/Statistics%20and%20Probability%20Problem%202.pdf#search=%22bivariate . [ постоянная мертвая ссылка ] данные%22
- ^ Национальный центр статистики образования. «Что такое независимые и зависимые переменные? Детская зона NCES». Получено 7 августа 2013 г. с http://nces.ed.gov/nceskids/help/user_guide/graph/variables.asp .
- ^ Пирс, Род. (4 января 2013 г.). «Корреляция». Математика — это весело. Получено 7 августа 2013 г. с http://www.mathsisfun.com/data/correlation.html.