Зависимые и независимые переменные
Переменная считается зависимой , если она зависит от независимой переменной . Зависимые переменные изучаются при предположении или требованию, что они зависят по какому-то закону или правилу (например, математической функции ) от значений других переменных. Независимые переменные, в свою очередь, не рассматриваются как зависящие от какой-либо другой переменной в рамках рассматриваемого эксперимента. [а] В этом смысле некоторыми общими независимыми переменными являются время , пространство , плотность , масса , скорость потока жидкости , [1] [2] и предыдущие значения некоторой наблюдаемой интересующей величины (например, размера человеческой популяции) для прогнозирования будущих значений (зависимая переменная). [3]
Из этих двух всегда именно зависимая переменная, изменение которой изучается путем изменения входных данных, также известных как регрессоры в статистическом контексте. В эксперименте любая переменная, которой можно приписать значение, не приписывая значения какой-либо другой переменной, называется независимой переменной. Модели и эксперименты проверяют влияние независимых переменных на зависимые переменные. Иногда, даже если их влияние не представляет прямого интереса, независимые переменные могут быть включены по другим причинам, например, для учета их потенциального искажающего эффекта.
В чистой математике [ править ]
В математике функция – это правило приема входных данных (в простейшем случае – числа или набора чисел). [5] и предоставление вывода (который также может быть числом). [5] Символ, обозначающий произвольный входной сигнал, называется независимой переменной , а символ, обозначающий произвольный выходной сигнал, называется зависимой переменной . [6] Наиболее распространенный символ для ввода — x , а наиболее распространенный символ для вывода — y ; сама функция обычно записывается y = f ( x ) . [6] [7]
Возможно иметь несколько независимых переменных или несколько зависимых переменных. Например, в исчислении с несколькими переменными часто встречаются функции вида z = f ( x , y ) , где z — зависимая переменная, а x и y — независимые переменные. [8] Функции с несколькими выходными значениями часто называют векторными функциями .
В моделировании и статистике [ править ]
При математическом моделировании изучается связь между множеством зависимых переменных и множеством независимых переменных. [ нужна ссылка ]
В простой стохастической линейной модели y i = a + b x i + e i термин y i — это i- е значение зависимой переменной, а x i е — i- значение независимой переменной. Термин e i известен как «ошибка» и содержит изменчивость зависимой переменной, не объясненную независимой переменной. [ нужна ссылка ]
С несколькими независимыми переменными модель имеет следующий вид: y i = a + b x i , 1 + b x i , 2 + ... + b x i,n + e i , где n — количество независимых переменных. [ нужна ссылка ]
В статистике, точнее, в линейной регрессии , диаграмма рассеяния данных создается с X в качестве независимой переменной и Y в качестве зависимой переменной. Это также называется двумерным набором данных, ( x 1 , y 1 ) ( x 2 , y 2 ) ... ( x i , y i ) . Простая модель линейной регрессии принимает форму Y i = a + B x i + U i для i = 1, 2, ..., n . В этом случае U i , ... , Un . являются независимыми случайными величинами Это происходит, когда измерения не влияют друг на друга. Благодаря распространению независимости независимость U i подразумевает независимость Y i , хотя каждый Y i имеет разное математическое ожидание. Каждый U i имеет математическое ожидание 0 и дисперсию σ. 2 . [9] Ожидание Y i Доказательство: [9]
Линия наилучшего соответствия двумерному набору данных принимает форму y = α + βx и называется линией регрессии. α и β соответствуют точке пересечения и наклону соответственно. [9]
В эксперименте переменная, которой манипулирует экспериментатор, представляет собой нечто, работа которого доказана, и называется независимой переменной. [10] Зависимая переменная – это событие, которое, как ожидается, изменится при манипулировании независимой переменной. [11]
В интеллектуального анализа данных инструментах (для многомерной статистики и машинного обучения отводится роль ) зависимой переменной целевая переменная (или в некоторых инструментах как атрибут метки ), тогда как независимой переменной может быть назначена роль обычной переменной . [12] Известные значения целевой переменной предоставляются для набора обучающих и тестовых данных , но их следует прогнозировать для других данных. Целевая переменная используется в алгоритмах обучения с учителем , но не в обучении без учителя.
Синонимы [ править ]
В зависимости от контекста независимую переменную иногда называют «переменной-предиктором», «регрессором», «ковариатой», «манипулируемой переменной», «объясняющей переменной», «переменной воздействия» (см. теорию надежности ), « фактором риска » ( см. медицинскую статистику ), « функция » (в машинном обучении и распознавании образов ) или «входная переменная». [13] [14] В эконометрике вместо термина «ковариата» обычно используется термин «управляющая переменная». [15] [16] [17] [18] [19]
«объясняющую переменную» «независимой переменной», когда величины, рассматриваемые как независимые переменные, не могут быть статистически независимыми или исследователем, которым можно независимо манипулировать. Некоторые авторы предпочитают [20] [21] Если независимую переменную называют «объясняющей переменной», то некоторые авторы предпочитают термин «переменная отклика» для обозначения зависимой переменной. [14] [20] [21]
В зависимости от контекста зависимую переменную иногда называют «переменной отклика», «регрессией», «критерием», «прогнозируемой переменной», «измеренной переменной», «объясняемой переменной», «экспериментальной переменной», «отвечающей переменной». «результатная переменная», «выходная переменная», «цель» или «метка». [14] В экономике эндогенные переменные обычно относятся к цели.
«объясняемую переменную» «зависимой переменной», когда величины, рассматриваемые как «зависимые переменные», могут не быть статистически зависимыми. Некоторые авторы предпочитают [22] Если зависимая переменная называется «объясняемой переменной», то некоторые авторы предпочитают термин «переменная-предиктор» для обозначения независимой переменной. [22]
Примером может служить анализ тенденции изменения уровня моря, проведенный Вудвортом (1987) . Здесь зависимой переменной (и переменной, представляющей наибольший интерес) был среднегодовой уровень моря в данном месте, для которого был доступен ряд годовых значений. Основной независимой переменной было время. Была использована ковариата, состоящая из годовых значений среднегодового атмосферного давления на уровне моря. Результаты показали, что включение ковариаты позволило получить более качественные оценки тенденции в зависимости от времени по сравнению с анализом, в котором ковариата не учитывалась.
независимый | зависимый |
вход | выход |
регрессор | регресс |
предсказатель | предсказанный |
пояснительный | объяснил |
экзогенный | эндогенный |
манипулировали | измеренный |
контакт | исход |
особенность | ярлык или цель |
Другие переменные [ править ]
Можно считать, что переменная изменяет зависимые или независимые переменные, но на самом деле она не может быть целью эксперимента. Таким образом, переменная будет поддерживаться постоянной или контролироваться, чтобы попытаться свести к минимуму ее влияние на эксперимент. Такие переменные могут быть обозначены как «управляемая переменная», « управляющая переменная » или «фиксированная переменная».
Посторонние переменные, если они включены в регрессионный анализ в качестве независимых переменных, могут помочь исследователю с точной оценкой параметров ответа, прогнозированием и степенью соответствия , но не представляют существенного интереса для гипотезы исследуемой . Например, в исследовании, изучающем влияние высшего образования на заработок в течение жизни, некоторыми посторонними переменными могут быть пол, этническая принадлежность, социальный класс, генетика, интеллект, возраст и т. д. Переменная является посторонней только тогда, когда можно предположить (или показать), что она влияет на зависимую переменную . Если его включить в регрессию, это может улучшить соответствие модели . Если он исключен из регрессии и если он имеет ненулевую ковариацию с одной или несколькими интересующими независимыми переменными, его пропуск приведет к смещению результата регрессии в отношении эффекта этой независимой интересующей переменной. Этот эффект называется смещением смешанной или пропущенной переменной ; в таких ситуациях необходимы изменения конструкции и/или контроль переменных статистических показателей.
Посторонние переменные часто подразделяют на три типа:
- Субъектные переменные, которые представляют собой характеристики изучаемых людей, которые могут повлиять на их действия. Эти переменные включают возраст, пол, состояние здоровья, настроение, происхождение и т. д.
- Блокирующие переменные или экспериментальные переменные — это характеристики людей, проводящих эксперимент, которые могут повлиять на поведение человека. Пол, наличие расовой дискриминации, языка или других факторов могут квалифицироваться как такие переменные.
- Ситуационные переменные – это особенности среды, в которой проводилось исследование или исследование, оказывающие негативное влияние на результат эксперимента. Учитываются температура воздуха, уровень активности, освещение и время суток.
При моделировании изменчивость, не охваченная независимой переменной, обозначается и известен как « остаток », «побочный эффект», « ошибка », «необъяснимая доля», «остаточная переменная», «нарушение» или «допуск».
Примеры [ править ]
- Влияние удобрений на рост растений:
- В исследовании, измеряющем влияние различных количеств удобрений на рост растений, независимой переменной будет количество использованных удобрений. Зависимой переменной будет рост высоты или массы растения. Контролируемыми переменными будут тип растения, тип удобрения, количество солнечного света, которое получает растение, размер горшков и т. д.
- Влияние дозы препарата на тяжесть симптомов:
- Изучая, как различные дозы лекарства влияют на тяжесть симптомов, исследователь мог сравнить частоту и интенсивность симптомов при введении разных доз. Здесь независимой переменной является доза, а зависимой переменной — частота/интенсивность симптомов.
- Влияние температуры на пигментацию:
- При измерении количества удаленного цвета из образцов свеклы при различных температурах температура является независимой переменной, а количество удаленного пигмента — зависимой переменной.
- Влияние сахара, добавленного в кофе:
- Вкус меняется в зависимости от количества сахара, добавленного в кофе. Здесь сахар является независимой переменной, а вкус – зависимой переменной.
См. также [ править ]
Примечания [ править ]
- ^ Даже если существующая зависимость обратима (например, путем нахождения обратной функции при ее существовании), номенклатура сохраняется, если обратная зависимость не является объектом исследования в эксперименте.
Ссылки [ править ]
- ^ Арис, Резерфорд (1994). Методы математического моделирования . Курьерская компания.
- ^ Бойс, Уильям Э.; Ричард К. ДиПрима (2012). Элементарные дифференциальные уравнения . Джон Уайли и сыновья.
- ^ Аллигуд, Кэтлин Т.; Зауэр, Тим Д.; Йорк, Джеймс А. (1996). Хаос: введение в динамические системы . Спрингер Нью-Йорк.
- ^ Гастингс, Нэнси Бакстер. Семинар по исчислению: управляемое исследование с обзором. Том. 2. Springer Science & Business Media, 1998. с. 31
- ↑ Перейти обратно: Перейти обратно: а б Карлсон, Роберт. Конкретное введение в настоящий анализ. CRC Press, 2006. стр.183.
- ↑ Перейти обратно: Перейти обратно: а б Стюарт, Джеймс. Исчисление. Cengage Learning, 2011. Раздел 1.1.
- ^ Антон, Ховард, Ирл К. Бивенс и Стивен Дэвис. Исчисление одной переменной. John Wiley & Sons, 2012. Раздел 0.1.
- ^ Ларсон, Рон и Брюс Эдвардс. Исчисление. Cengage Learning, 2009. Раздел 13.1.
- ↑ Перейти обратно: Перейти обратно: а б с Деккинг, Фредерик Мишель (2005), Современное введение в вероятность и статистику: понимание почему и как , Springer, ISBN 1-85233-896-2 , OCLC 783259968
- ^ «Переменные» .
- ^ Полный словарь Random House Webster. Random House, Inc. 2001. Страница 534, 971. ISBN 0-375-42566-7 .
- ^ Руководство на английском языке, версия 1.0. Архивировано 10 февраля 2014 г. на Wayback Machine для RapidMiner 5.0, октябрь 2013 г.
- ^ Додж, Ю. (2003) Оксфордский словарь статистических терминов , OUP. ISBN 0-19-920613-9 (запись для «независимой переменной»)
- ↑ Перейти обратно: Перейти обратно: а б с Додж, Ю. (2003) Оксфордский словарь статистических терминов , OUP. ISBN 0-19-920613-9 (запись «регрессия»)
- ^ Гуджарати, Дамодар Н.; Портер, Дон К. (2009). «Терминология и обозначения». Базовая эконометрика (Пятое международное изд.). Нью-Йорк: МакГроу-Хилл. п. 21. ISBN 978-007-127625-2 .
- ^ Вулдридж, Джеффри (2012). Вводная эконометрика: современный подход (Пятое изд.). Мейсон, Огайо: Юго-западное обучение Cengage. стр. 22–23. ISBN 978-1-111-53104-1 .
- ^ Последний, Джон М., изд. (2001). Эпидемиологический словарь (Четвертое изд.). Оксфорд, УП. ISBN 0-19-514168-7 .
- ^ Эверитт, бакалавр наук (2002). Кембриджский статистический словарь (2-е изд.). Кембриджский университет. ISBN 0-521-81099-Х .
- ^ Вудворт, Польша (1987). «Тенденции в Великобритании означают уровень моря». Морская геодезия . 11 (1): 57–87. Бибкод : 1987MarGe..11...57W . дои : 10.1080/15210608709379549 .
- ↑ Перейти обратно: Перейти обратно: а б Эверитт, бакалавр наук (2002) Кембриджский статистический словарь, CUP. ISBN 0-521-81099-X
- ↑ Перейти обратно: Перейти обратно: а б Додж, Ю. (2003) Оксфордский словарь статистических терминов , OUP. ISBN 0-19-920613-9
- ↑ Перейти обратно: Перейти обратно: а б Эш Нараян Сах (2009) Анализ данных с использованием Microsoft Excel, Нью-Дели. ISBN 978-81-7446-716-4