Средний
На обычном языке среднее значение — это одно число или значение, которое лучше всего представляет набор данных. Тип среднего значения, наиболее типично репрезентативного для списка чисел, — это среднее арифметическое — сумма чисел, деленная на количество чисел в списке. Например, среднее значение чисел 2, 3, 4, 7 и 9 (в сумме 25) равно 5. В зависимости от контекста наиболее репрезентативной статистикой , которую можно принять за среднее значение, может быть еще одна мера центральной тенденции . такие как средний диапазон , медиана , мода или среднее геометрическое . Например, средний личный доход часто указывается как медианный — число, ниже которого находится 50% личных доходов и выше которого — 50% личных доходов — потому что среднее значение будет выше, если включить в него личные доходы нескольких миллиардеров . По этой причине рекомендуется избегать использования слова «среднее» при обсуждении показателей центральной тенденции и указывать, какой тип показателя среднего используется.
Общие свойства [ править ]
Если все числа в списке — одно и то же число, то их среднее значение также равно этому числу. Это свойство является общим для каждого из многих типов средних значений.
Еще одним универсальным свойством является монотонность : если два списка чисел A и B имеют одинаковую длину и каждая запись списка A по крайней мере такого же размера, как и соответствующая запись в списке B , то среднее значение списка A не меньше, чем среднее значение списка. Б. Кроме того, все средние значения удовлетворяют линейной однородности : если все числа списка умножить на одно и то же положительное число, то его среднее значение изменится на один и тот же коэффициент.
В некоторых типах среднего значения элементам списка присваиваются разные веса перед определением среднего значения. К ним относятся взвешенное среднее арифметическое , взвешенное среднее геометрическое и взвешенная медиана . Также для некоторых типов скользящих средних вес элемента зависит от его положения в списке. Однако большинство типов средних значений удовлетворяют нечувствительности к перестановкам : все элементы одинаково учитываются при определении их среднего значения, и их позиции в списке не имеют значения; среднее значение (1, 2, 3, 4, 6) такое же, как и (3, 2, 6, 4, 1).
Пифагорейский означает [ править ]
Среднее арифметическое , среднее геометрическое и среднее гармоническое известны под общим названием «средние Пифагора» .
Статистическое местоположение [ править ]
Мода описательной , медиана и средний диапазон часто используются в дополнение к среднему значению в качестве оценок центральной тенденции в статистике . Все это можно рассматривать как минимизацию вариаций в той или иной мере; см. Центральную тенденцию § Решения вариационных задач .
Тип | Описание | Пример | Результат |
---|---|---|---|
Среднее арифметическое | Сумма значений набора данных, деленная на количество значений: | (1+2+2+3+4+7+9) / 7 | 4 |
медиана | Среднее значение, разделяющее большую и меньшую половины набора данных | 1, 2, 2, 3 , 4, 7, 9 | 3 |
Режим | Наиболее частое значение в наборе данных | 1, 2 , 2 , 3, 4, 7, 9 | 2 |
Средний уровень | Среднее арифметическое наивысшего и наименьшего значений набора | (1+9) / 2 | 5 |
Режим [ править ]
Наиболее часто встречающееся число в списке называется модой. Например, режим списка (1, 2, 2, 3, 3, 3, 4) равен 3. Может случиться так, что есть два или более чисел, которые встречаются одинаково часто и чаще, чем любое другое число. В этом случае не существует согласованного определения режима. Некоторые авторы говорят, что все они являются модусами, а некоторые говорят, что модусов нет.
Медиана [ править ]
Медиана — это среднее число группы, если они расположены по порядку. (Если чисел четное, берется среднее значение двух средних.)
Таким образом, чтобы найти медиану, упорядочите список в соответствии с величиной его элементов, а затем несколько раз удалите пару, состоящую из самого высокого и самого низкого значений, пока не останется одно или два значения. Если осталось ровно одно значение, это медиана; если два значения, медиана — это среднее арифметическое этих двух. Этот метод берет список 1, 7, 3, 13 и приказывает ему прочитать 1, 3, 7, 13. Затем 1 и 13 удаляются, чтобы получить список 3, 7. Поскольку в этом оставшемся списке два элемента, медиана — это их среднее арифметическое, (3 + 7)/2 = 5.
Средний уровень [ править ]
Средний диапазон — это среднее арифметическое самого высокого и самого низкого значений набора.
Краткое описание типов [ править ]
Имя | Уравнение или описание | Как решение проблемы оптимизации |
---|---|---|
Среднее арифметическое | ||
медиана | Среднее значение, отделяющее верхнюю половину от нижней половины набора данных; может быть не уникальным, если набор данных содержит четное количество точек | |
Геометрическая медиана | Инвариантное вращение точек расширение медианы для в | |
Медиана Тьюки | Еще одно инвариантное к вращению расширение медианы для точек в — точка, которая максимизирует глубину Тьюки | |
Режим | Наиболее частое значение в наборе данных | |
Среднее геометрическое | ||
Гармоническое среднее | ||
Лемер означает | ||
Квадратичное среднее (или среднеквадратичное значение) | ||
Кубическое среднее | ||
Обобщенное среднее | ||
Среднее квазиарифметическое | является монотонным | |
Взвешенное среднее | ||
Усеченное среднее | Среднее арифметическое значений данных после того, как определенное количество или доля самых высоких и самых низких значений данных были отброшены. | |
Межквартильное среднее | Особый случай усеченного среднего с использованием межквартильного диапазона . Особый случай межквантильного усеченного среднего, который работает с квантилями (часто децилями или процентилями ), которые эквидистантны, но находятся на противоположных сторонах медианы. | |
Средний уровень | ||
Винсоризованное среднее | Подобно усеченному среднему значению, но вместо удаления крайних значений они устанавливаются равными наибольшему и наименьшему оставшимся значениям. | |
Медоид | Репрезентативный объект множества объектов с минимальной суммой различий для всех объектов множества согласно некоторой функции несходства . |
Таблица математических символов поясняет символы, используемые ниже.
Разные типы [ править ]
Другие, более сложные средние значения: тримедиана , тримедиана и нормализованное среднее значение с их обобщениями. [1]
Можно создать собственную среднюю метрику, используя обобщенное f -mean :
где f — любая обратимая функция. Среднее гармоническое является примером этого, используя f ( x ) = 1/ x , а среднее геометрическое — другим, используя f ( x ) = log x .
Однако этот метод расчета средних не является достаточно универсальным, чтобы охватить все средние значения. Более общий метод [2] [ не удалось пройти проверку ] для определения среднего берется любая функция g ( x 1 , x 2 , ..., x n ) из списка аргументов, непрерывная , строго возрастающая по каждому аргументу и симметричная (инвариантная относительно перестановки аргументов). Среднее значение y тогда является значением, которое при замене каждого члена списка приводит к тому же значению функции: g ( y , y , ..., y ) = g ( x 1 , x 2 , ..., x н ) . Это наиболее общее определение по-прежнему отражает важное свойство всех средних значений: среднее значение списка идентичных элементов и есть сам этот элемент. Функция g ( x 1 , x 2 , ..., x n ) = x 1 + x 2 + ··· + x n дает среднее арифметическое. Функция g ( x 1 , x 2 , ..., x n ) = x 1 x 2 ··· x n (где элементы списка являются положительными числами) обеспечивает среднее геометрическое. Функция g ( x 1 , x 2 , ..., x n ) = ( x 1 −1 + х2 −1 + ··· + х н −1 ) −1 ) (где элементы списка являются положительными числами) обеспечивает среднее гармоническое значение. [2]
процентная доходность CAGR и Средняя
Типом среднего показателя, используемого в финансах, является средний процент доходности. Это пример среднего геометрического. Когда доходность является годовой, это называется совокупным годовым темпом роста (CAGR). Например, если мы рассматриваем двухлетний период, а доходность инвестиций в первый год составляет -10%, а доходность во второй год составляет +60%, то среднюю процентную доходность или CAGR, R. можно получить решив уравнение: (1 – 10%) × (1 + 60%) = (1 – 0,1) × (1 + 0,6) = (1 + R ) × (1 + R ) . Значение R , которое делает это уравнение верным, составляет 0,2 или 20%. Это означает, что общий доход за двухлетний период такой же, как если бы каждый год наблюдался рост на 20%. Порядок лет не имеет значения: средняя процентная доходность +60% и -10% представляет собой тот же результат, что и для -10% и +60%.
Этот метод можно обобщить на примеры, в которых периоды не равны. Например, рассмотрим период в полгода, за который доходность составляет -23%, и период в два с половиной года, за который доходность составляет +13%. Средняя процентная доходность за объединенный период — это годовая доходность R , которая является решением следующего уравнения: (1 — 0,23). 0.5 × (1 + 0.13) 2.5 = (1 + р ) 0.5+2.5 , что дает среднюю доходность R 0,0600 или 6,00%.
Скользящее среднее [ править ]
Учитывая временные ряды , такие как ежедневные цены на фондовом рынке или годовые температуры, люди часто хотят создать более плавный ряд. [3] Это помогает показать основные тенденции или, возможно, периодическое поведение. Самый простой способ сделать это — скользящее среднее : выбирают число n и создают новую серию, взяв среднее арифметическое первых n значений, затем продвигаясь на одну позицию вперед, отбрасывая самое старое значение и вводя новое значение в другое. конец списка и так далее. Это простейшая форма скользящей средней. Более сложные формы предполагают использование средневзвешенного значения . Взвешивание можно использовать для усиления или подавления различных периодических характеристик, и в литературе по фильтрации существует очень обширный анализ того, какие взвешивания следует использовать . В цифровой обработке сигналов термин «скользящее среднее» используется, даже если сумма весов не равна 1,0 (поэтому выходной ряд представляет собой масштабированную версию средних значений). [4] Причина этого в том, что аналитика обычно интересует только тенденция или периодическое поведение.
История [ править ]
Происхождение [ править ]
Первый зарегистрированный случай, когда среднее арифметическое было расширено с 2 до n случаев для использования оценки, был в шестнадцатом веке. Начиная с конца шестнадцатого века, он постепенно стал распространенным методом уменьшения ошибок измерений в различных областях. [5] [6] В то время астрономы хотели узнать реальную величину на основе шумных измерений, таких как положение планеты или диаметр Луны. Используя среднее значение нескольких измеренных значений, ученые предположили, что погрешности составляют относительно небольшое количество по сравнению с суммой всех измеренных значений. Метод взятия среднего для уменьшения ошибок наблюдения действительно был разработан главным образом в астрономии. [5] [7] Возможным предшественником среднего арифметического является средний диапазон (среднее значение двух крайних значений), используемый, например, в арабской астрономии девятого-одиннадцатого веков, а также в металлургии и мореплавании. [6]
Однако существуют различные более старые расплывчатые ссылки на использование среднего арифметического значения (которые не так ясны, но вполне могут иметь отношение к нашему современному определению среднего арифметического). В тексте IV века было написано следующее (текст в квадратных скобках — возможно, отсутствующий текст, который может прояснить смысл): [8]
- В первую очередь надо выставить в ряд последовательность чисел от монады до девяти: 1, 2, 3, 4, 5, 6, 7, 8, 9. Затем надо сложить сумму всех из них вместе, а так как строка содержит девять членов, то мы должны искать девятую часть суммы, чтобы увидеть, присутствует ли она уже естественным образом среди чисел строки; и мы обнаружим, что свойство быть [одной] девятой [суммы] принадлежит только самому [арифметическому] среднему...
Существуют еще более старые потенциальные ссылки. Имеются записи, что примерно с 700 г. до н. э. купцы и грузоотправители договорились, что ущерб грузу и кораблю (их «вклад» в случае повреждения морем) должен быть разделен между собой поровну. [7] Это могло быть рассчитано с использованием среднего значения, хотя прямых записей о расчетах, похоже, нет.
Этимология [ править ]
Корень в арабском языке встречается как عوار ʿawār , дефект или что-либо дефектное или поврежденное, включая частично испорченный товар; и عواري ʿawārī (также عوارة ʿawara ) = « авар , состояние частичного повреждения или относящееся к нему». [а] В западных языках история этого слова начинается со средневековой морской торговли на Средиземноморье. Генуя XII и XIII веков на латыни avaria означала «ущерб, потери и необычные расходы, возникающие в связи с торговым морским путешествием»; и такое же значение авария имеет в Марселе в 1210 г., в Барселоне в 1258 г. и во Флоренции конца 13 в. [б] XV века Французское авари имело то же значение и породило английское «averay» (1491 г.) и английское «average» (1502 г.) с тем же значением. Сегодня итальянская авария , каталонская авария и французская авария по-прежнему имеют основное значение «ущерб». Огромная трансформация значения в английском языке началась с практики западных договоров торгового морского права позднего средневековья и раннего Нового времени, согласно которой, если корабль попадал в сильный шторм, часть товаров приходилось выбрасывать за борт, чтобы сделать корабль легче и безопаснее. , то соразмерно должны были пострадать все купцы, товар которых находился на корабле (а не тот, чей товар был выброшен за борт); и в более общем плане должно было быть пропорциональное распределение любой аварии . Отсюда это слово было принято британскими страховщиками, кредиторами и торговцами для обозначения своих убытков как распределенных по всему их портфелю активов и имеющих среднюю долю. Сегодняшнее значение развилось из этого и началось в середине 18 века и зародилось в английском языке. [б] [9]
Морской ущерб – это либо частная авария , которую несет только владелец поврежденного имущества, либо общая авария , когда владелец может требовать пропорционального вклада от всех сторон морского предприятия. Тип расчетов, используемых при корректировке общего среднего показателя, привел к использованию слова «среднее» для обозначения «среднего арифметического».
Второе употребление в английском языке, задокументированное еще в 1674 году и иногда пишущееся как «авериш», означает остатки и второй рост полевых культур, которые считались пригодными для употребления в пищу тягловыми животными («аверс»). [10]
Существует более раннее (по крайней мере, с 11 века) несвязанное использование этого слова. Похоже, это старый юридический термин, обозначающий поденные трудовые обязательства арендатора перед шерифом, вероятно, англизированный от слова «avera», найденного в английской « Книге судного дня » (1085 г.).
Однако в Оксфордском словаре английского языка говорится, что производные от немецкого hafen Haven и арабского ʿawâr потеря, ущерб были «полностью устранены», и это слово имеет романское происхождение. [11]
инструмент как риторический Средние числа
Из-за вышеупомянутого разговорного характера термина «среднее значение» этот термин может использоваться для запутывания истинного значения данных и предложения различных ответов на вопросы, основанных на используемом методе усреднения (чаще всего среднее арифметическое, медиана или мода). В своей статье «Подставлено под ложь: статистика как художественное доказательство» преподаватель Питтсбургского университета Дэниел Либертц отмечает, что по этой причине статистическая информация часто игнорируется в риторических аргументах. [12] Однако из-за их убедительной силы не следует полностью отбрасывать средние значения и другие статистические значения, а вместо этого использовать и интерпретировать их с осторожностью. Либертц призывает нас критически относиться не только к статистической информации, такой как средние значения, но и к языку, используемому для описания данных и их использования, говоря: «Если статистика опирается на интерпретацию, ораторам следует предлагать своей аудитории интерпретировать, а не настаивать на интерпретации». интерпретация». [12] Во многих случаях приводятся данные и конкретные расчеты, которые помогают облегчить такую интерпретацию с учетом аудитории.
См. также [ править ]
- Среднее абсолютное отклонение
- Центральная предельная теорема
- Ожидаемая стоимость
- Закон средних чисел
- Среднее значение численности населения
- Выборочное среднее
Примечания [ править ]
- ↑ В средневековом арабском языке عور ʿawr означает «слепой на один глаз», а عوار ʿawār означает «любой дефект, или что-либо дефектное или поврежденное». Некоторые средневековые арабские словари находятся на Baheth.info. Архивировано 29 октября 2013 г. на Wayback Machine , а некоторые переводы на английский язык того, что есть в средневековых арабских словарях, находятся в Лейна арабско-английском лексиконе , страницы 2193 и 2195 . В средневековых словарях словоформа عوارية ʿawārīa не упоминается . Авария может естественным образом образовываться в арабской грамматике для обозначения вещей, которые имеют авар , но на практике в средневековых арабских текстах авария встречается редко или вообще не существует, в то время как формы عواري ʿawārī и عوارة ʿawara часто используются при упоминании вещей, которые имеют авар. или повреждение – это можно увидеть в доступной для поиска коллекции средневековых текстов на AlWaraq.net (ссылки на книги кликабельны справа).
- ↑ Перейти обратно: Перейти обратно: а б Об арабском происхождении аварии впервые сообщил Рейнхарт Дози в 19 веке. Оригинальное резюме Дози содержится в его книге «Глоссарий» 1869 года . Краткая информация о ранних записях этого слова на итальянско-латинском, итальянском, каталонском и французском языках доступна на сайте @ CNRTL.fr . Архивировано 6 января 2019 г. на Wayback Machine . Морской порт Генуи является местом самой ранней известной записи на европейских языках, датированной 1157 годом. Набор средневековых латинских записей об аварии в Генуе находится в загружаемом словаре Vocabolario Ligure Серджио Апросио, 2001 год, авария на страницах тома 1. 115-116. Многие другие записи на средневековой латыни в Генуе находятся на StoriaPatriaGenova.it , обычно во множественном числе avariis и avarias . В порту Марселя в 1-й половине 13-го века нотариально заверенные коммерческие контракты имеют десятки экземпляров латинского avariis (аблатива множественного числа от avaria ), опубликованного в Бланкаре в 1884 году . Некоторая информация об английском слове на протяжении веков находится в NED (1888 год) . См. также определение английского «среднего» в английских словарях, опубликованных в начале 18 века, то есть в период незадолго до большой трансформации значения: Словарь Керси-Филлипса (1706 г.) , словарь Блаунта (издание 1707 г.) , словарь Хаттона (1712 г.) , словарь Бейли (1726 г.) , словарь Мартина (1749 г.) . Некоторые сложности, связанные с историей английского слова, обсуждаются в книгах Хенсли Веджвуда, 1882 год, стр. 11 , и Уолтера Скита, 1888 год, стр. 781 . Сегодня существует консенсус в том, что: (№1) сегодняшнее английское слово «средний» происходит от средневекового итальянского «авария» , каталонского «авария» и (№2) среди латинян слово «авария» возникло в 12 веке и началось как термин, обозначающий Средиземное море. торговля, и (#3) в латыни нет корня слова «авария» , и (#4) значительное количество арабских слов вошли в итальянский, каталонский и провансальский языки в XII и XIII веках, начиная с терминов средиземноморской морской торговли. и (#5) арабский авар | ʿawārī фонетически хорошо соответствует слову avaria , поскольку преобразование w в v было регулярным в латыни и итальянском языке, а -ia является суффиксом в итальянском языке, а самые ранние записи западного слова находятся в итальяноязычных регионах (письмо на латыни). И большинство комментаторов сходятся во мнении, что (№6) арабский авар | ʿawārī = «ущерб | относящийся к ущербу» семантически хорошо соответствует слову avaria = «ущерб или расходы на ущерб». Меньшая часть комментаторов сомневалась в этом на том основании, что ранние записи итало-латинской аварии в некоторых случаях имеют значение «расходы» в более общем смысле – см. TLIO (на итальянском языке) . По мнению большинства, значение слова «расходы» было расширением понятия «ущерб и расходы на ущерб», и хронологический порядок значений в записях подтверждает эту точку зрения, а широкое значение «расходы» никогда не было наиболее распространенным. использованное значение. На основании вышеизложенного делается вывод о том, что латинское слово произошло или, вероятно, произошло от арабского слова.
Ссылки [ править ]
- ^ Мериго, Хосе М.; Канановас, Монтсеррат (2009). «Обобщенный гибридный усредняющий оператор и его применение при принятии решений». Журнал количественных методов экономики и делового администрирования . 9 : 69–84. ISSN 1886-516X .
- ↑ Перейти обратно: Перейти обратно: а б Бибби, Джон (1974). «Аксиоматизация среднего и дальнейшее обобщение монотонных последовательностей» . Математический журнал Глазго . 15 : 63–65. дои : 10.1017/s0017089500002135 .
- ^ Бокс, Джордж Э.П.; Дженкинс, Гвилим М. (1976). Анализ временных рядов: прогнозирование и контроль (переработанная ред.). Холден-Дэй. ISBN 0816211043 .
- ^ Хайкин, Саймон (1986). Адаптивная теория фильтров . Прентис-Холл. ISBN 0130040525 .
- ↑ Перейти обратно: Перейти обратно: а б Плакетт, Р.Л. (1958). «Исследования по истории вероятности и статистики: VII. Принцип среднего арифметического». Биометрика . 45 (1/2): 130–135. дои : 10.2307/2333051 . JSTOR 2333051 .
- ↑ Перейти обратно: Перейти обратно: а б Эйзенхарт, Черчилль. «Развитие понятия о лучшем средстве совокупности измерений от древности до наших дней». Неопубликованное обращение президента Американской статистической ассоциации, 131-е ежегодное собрание, Форт-Коллинз, Колорадо. 1971.
- ↑ Перейти обратно: Перейти обратно: а б Баккер, Артур. «Ранняя история средних ценностей и последствия для образования». Журнал статистического образования 11.1 (2003): 17–26.
- ^ «Уотерфилд, Робин. «Богословие арифметики». О мистическом, математическом и космологическом символизме первых десяти чисел (1988). Страница 70» (PDF) . Архивировано из оригинала (PDF) 4 марта 2016 г. Проверено 27 ноября 2018 г.
- ^ "средний" . Dictionary.com Полный (онлайн). нд . Проверено 25 мая 2023 г.
- ^ Рэй, Джон (1674). Сборник английских слов, которые обычно не используются . Лондон: Х. Брюгге . Проверено 18 мая 2015 г.
- ^ "средний, №2" . Оксфордский словарь английского языка (онлайн-изд.). Издательство Оксфордского университета . Сентябрь 2019 года . Проверено 5 сентября 2019 г. (Требуется подписка или членство участвующей организации .)
- ↑ Перейти обратно: Перейти обратно: а б Либертц, Дэниел (31 декабря 2018 г.). «Подставлено для лжи: статистика как художественное доказательство» . Рес Риторика . 5 (4). дои : 10.29107/rr2018.4.1 . ISSN 2392-3113 .