Среднее арифметическое
В математике и статистике арифметическое среднее ( / ˌ æ r ɪ θ ˈ m ɛ t ɪ k ˈ m iː n / arr-ith- MET -ik ), среднее арифметическое , или просто среднее или среднее (когда контекст понятен) — это сумма набора чисел делится на количество чисел в коллекции. [1] Коллекция часто представляет собой набор результатов эксперимента , наблюдательного исследования или опроса . Термин «среднее арифметическое» предпочтительнее в некоторых контекстах математики и статистики, поскольку он помогает отличить его от других типов средних, таких как геометрические и гармонические .
Помимо математики и статистики, среднее арифметическое часто используется в экономике , антропологии , истории и почти во всех научных областях в той или иной степени. Например, доход на душу населения — это средний арифметический доход населения страны.
Хотя среднее арифметическое часто используется для определения центральных тенденций , оно не является надежным статистическим показателем : на него сильно влияют выбросы (значения, намного большие или меньшие, чем у большинства других). Для асимметричного распределения , такого как распределение дохода , при котором доходы некоторых людей существенно выше, чем у большинства людей, среднее арифметическое может не совпадать с понятием «среднего». В этом случае надежная статистика, такая как медиана , может обеспечить лучшее описание центральной тенденции.
Определение
[ редактировать ]Среднее арифметическое набора наблюдаемых данных равно сумме числовых значений каждого наблюдения, деленной на общее количество наблюдений. Символически, для набора данных, состоящего из значений , среднее арифметическое определяется по формуле:
(Пояснения к оператору суммирования см. в разделе суммирование .)
Например, если ежемесячная заработная плата сотрудники , то среднее арифметическое равно:
Если набор данных представляет собой статистическую совокупность (т. е. состоит из всех возможных наблюдений, а не только их подмножества), то среднее значение этой совокупности называется средним значением совокупности и обозначается греческой буквой. . Если набор данных представляет собой статистическую выборку (подмножество генеральной совокупности), он называется выборочным средним (что для набора данных обозначается как ).
Среднее арифметическое можно аналогичным образом определить для векторов в нескольких измерениях, а не только для скалярных значений; это часто называют центроидом . В более общем смысле, поскольку среднее арифметическое представляет собой выпуклую комбинацию (то есть сумма ее коэффициентов равна ), его можно определить в выпуклом пространстве , а не только в векторном пространстве.
Мотивирующие свойства
[ редактировать ]Среднее арифметическое имеет несколько свойств, которые делают его интересным, особенно как меру центральной тенденции. К ним относятся:
- Если числа иметь в виду , затем . С — это расстояние от данного числа до среднего значения. Один из способов интерпретировать это свойство — сказать, что числа слева от среднего значения уравновешиваются числами справа. Среднее значение — единственное число, для которого сумма остатков (отклонений от оценки) равна нулю. Это также можно интерпретировать как утверждение, что среднее значение трансляционно инвариантно в том смысле, что для любого действительного числа , .
- Если требуется использовать одно число в качестве «типичного» значения для набора известных чисел , то среднее арифметическое чисел делает это лучше всего, поскольку оно минимизирует сумму квадратов отклонений от типичного значения: сумму . Выборочное среднее также является лучшим одиночным предиктором, поскольку оно имеет наименьшую среднеквадратичную ошибку . [3] Если требуется среднее арифметическое совокупности чисел, то его несмещенная оценка представляет собой среднее арифметическое выборки, взятой из совокупности.
- Среднее арифметическое не зависит от масштаба единиц измерения в том смысле, что Так, например, вычисление среднего значения в литрах, а затем преобразование в галлоны — это то же самое, что сначала преобразование в галлоны, а затем вычисление среднего значения. Это также называется однородностью первого порядка .
Дополнительные свойства
[ редактировать ]- Среднее арифметическое выборки всегда находится между наибольшим и наименьшим значениями в этой выборке.
- Среднее арифметическое любого количества групп чисел одинакового размера вместе взятых является средним арифметическим средних арифметических каждой группы.
Контраст с медианой
[ редактировать ]Среднее арифметическое можно противопоставить медиане . Медиана определяется так, чтобы не более половины значений были больше и не более половины меньше ее. Если элементы данных увеличиваются арифметически при размещении в определенном порядке, то медиана и среднее арифметическое равны. Например, рассмотрим образец данных . Среднее значение , как и медиана. Однако, когда мы рассматриваем выборку, которую нельзя организовать для арифметического увеличения, например , медиана и среднее арифметическое могут существенно различаться. В этом случае среднее арифметическое равно , а медиана . Среднее значение может значительно отличаться от большинства значений в выборке и может быть больше или меньше большинства значений.
Это явление находит применение во многих областях. Например, с 1980-х годов средний доход в США рос медленнее, чем среднее арифметическое дохода. [4]
Обобщения
[ редактировать ]Средневзвешенное значение
[ редактировать ]Средневзвешенное значение или средневзвешенное значение — это среднее значение, в котором некоторые точки данных имеют большее значение, чем другие, поскольку им придается больший вес при расчете. [5] Например, среднее арифметическое и является или эквивалентно . Напротив, средневзвешенное значение, при котором первое число получает, например, в два раза больший вес, чем второе (возможно, потому, что предполагается, что оно встречается в два раза чаще в общей совокупности, из которой были выбраны эти числа), будет рассчитываться как . Здесь веса, сумма которых обязательно равна единице, равны и , причем первое в два раза больше последнего. Среднее арифметическое (иногда называемое «невзвешенным средним» или «равновзвешенным средним») можно интерпретировать как частный случай взвешенного среднего, в котором все веса равны одному и тому же числу ( в приведенном выше примере и в ситуации с цифры усредняются).
Непрерывные распределения вероятностей
[ редактировать ]Если числовое свойство и любая выборка данных из него могут принимать любое значение из непрерывного диапазона, а не, например, только целые числа, то вероятность попадания числа в некоторый диапазон возможных значений можно описать путем интегрирования непрерывное распределение вероятностей в этом диапазоне, даже если наивная вероятность того, что число выборок выберет одно определенное значение из бесконечного множества, равна нулю. В этом контексте аналог средневзвешенного значения, в котором существует бесконечно много возможностей для точного значения переменной в каждом диапазоне, называется средним значением распределения вероятностей . Наиболее широко встречающееся распределение вероятностей называется нормальным распределением ; он обладает тем свойством, что все меры его центральной тенденции, включая не только среднее значение, но и упомянутую выше медиану и моду (три Мс), [6] ), равны. Это равенство не выполняется для других распределений вероятностей, как показано здесь для логарифмически нормального распределения.
Углы
[ редактировать ]Особая осторожность необходима при использовании циклических данных, таких как фазы или углы . Взяв среднее арифметическое 1° и 359°, получим результат 180 ° .Это неверно по двум причинам:
- Во-первых, измерения углов определяются только до аддитивной константы 360° ( или , если измерять в радианах ). Таким образом, их можно было бы легко назвать 1° и -1° или 361° и 719°, поскольку каждый из них дает разное среднее значение.
- Во-вторых, в этой ситуации 0° (или 360°) является геометрически лучшим средним вокруг него меньше значением: дисперсия (точки находятся как на 1° от него, так и на 179° от 180°, предполагаемого среднего).
В общем случае такая оплошность приведет к искусственному смещению среднего значения в сторону середины числового диапазона. Решение этой проблемы состоит в том, чтобы использовать формулировку оптимизации (то есть определить среднее значение как центральную точку: точку, относительно которой имеется наименьшая дисперсия) и переопределить разницу как модульное расстояние (т. е. расстояние по окружности: поэтому модульное расстояние между 1° и 359° составляет 2°, а не 358°).
Символы и кодировка
[ редактировать ]Среднее арифметическое часто обозначается чертой ( винкулум или макрон ), как в . [3]
Некоторые программы ( текстовые процессоры , веб-браузеры ) могут неправильно отображать символ «x». Например, HTML- символ «x̄» объединяет два кода — базовую букву «x» плюс код строки выше ( ̄ или ¯). [7]
В некоторых форматах документов (например, PDF ) символ может быть заменен символом «¢» ( цент ) при копировании в текстовый процессор, например Microsoft Word .
См. также
[ редактировать ]- Фреше означает
- Обобщенное среднее
- Неравенство средних арифметических и геометрических
- Выборочное среднее и ковариация
- Стандартное отклонение
- Стандартная ошибка среднего
- Сводная статистика
Примечания
[ редактировать ]- ^ Если AC = a и BC = b . OC = AM для a и b , а радиус r = QO = OG.
Используя теорему Пифагора , QC² = QO² + OC² ∴ QC = √ QO² + OC² = QM .
Используя теорему Пифагора, OC² = OG² + GC² ∴ GC = √ OC² − OG² = GM .
Используя подобные треугольники , HC / GC = GC / OC ∴ HC = GC² / OC = HM .
Ссылки
[ редактировать ]- ^ Джейкобс, Гарольд Р. (1994). Математика: человеческие усилия (Третье изд.). У. Х. Фриман . п. 547. ИСБН 0-7167-2426-Х .
- ^ Вайсштейн, Эрик В. «Среднее арифметическое» . mathworld.wolfram.com . Проверено 21 августа 2020 г.
- ^ Jump up to: а б Медхи, Джотипрасад (1992). Статистические методы: вводный текст . Нью Эйдж Интернэшнл. стр. 53–58. ISBN 9788122404197 .
- ^ Кругман, Пол (4 июня 2014 г.) [осень 1992 г.]. «Богатые, правые и факты: деконструкция дебатов о распределении доходов» . Американский проспект .
- ^ «Среднее | математика» . Британская энциклопедия . Проверено 21 августа 2020 г.
- ^ Thinkmap Visual Thesaurus (30 июня 2010 г.). «Три М статистики: мода, медиана, среднее значение на 30 июня 2010 г.» . www.visualthesaurus.com . Проверено 3 декабря 2018 г.
- ^ «Заметки о Unicode для символов статистики» . www.personal.psu.edu . Архивировано из оригинала 31 марта 2022 года . Проверено 14 октября 2018 г.
Дальнейшее чтение
[ редактировать ]- Хафф, Даррелл (1993). Как лгать со статистикой . WW Нортон. ISBN 978-0-393-31072-6 .