Предполагаемое среднее
В статистике предполагаемое среднее — это метод расчета среднего арифметического и стандартного отклонения набора данных. Это упрощает расчет точных значений вручную. Сегодня его интерес в основном исторический, но его можно использовать для быстрой оценки этой статистики. Существуют и другие методы быстрых вычислений , которые больше подходят для компьютеров и также обеспечивают более точные результаты, чем очевидные методы.
Пример
[ редактировать ]Первый:Ищем среднее значение следующих чисел:
- 219, 223, 226, 228, 231, 234, 235, 236, 240, 241, 244, 247, 249, 255, 262
Предположим, мы начнем с правдоподобного первоначального предположения, что среднее значение составляет около 240. Тогда отклонения от этого «предполагаемого» среднего значения будут следующими:
- −21, −17, −14, −12, −9, −6, −5, −4, 0, 1, 4, 7, 9, 15, 22
Сложив их, можно обнаружить, что:
- 22 и −21 почти отменяются, остается +1,
- 15 и -17 почти отменяются, остается -2,
- 9 и −9 отменяют,
- 7 + 4 отменяет −6 − 5,
и так далее. У нас осталась сумма −30. из Таким образом , среднее этих 15 отклонений от предполагаемого среднего составляет -30/15 = -2. Следовательно, это то, что нам нужно добавить к предполагаемому среднему значению, чтобы получить правильное среднее значение:
- правильное среднее = 240 - 2 = 238.
Метод
[ редактировать ]Метод основан на оценке среднего значения и округлении до значения, которое будет легко рассчитать. Затем это значение вычитается из всех значений выборки. Когда выборки классифицируются по диапазонам одинакового размера, выбирается центральный класс, и в расчетах используется количество диапазонов из него. Например, для роста людей в качестве предполагаемого среднего значения можно использовать значение 1,75 м.
Для набора данных с предполагаемым средним значением x 0 предположим:
Затем
или для выборочного стандартного отклонения с использованием поправки Бесселя :
Пример использования диапазонов классов
[ редактировать ]При большом количестве выборок можно получить быструю разумную оценку среднего значения и стандартного отклонения, сгруппировав выборки в классы с использованием одинаковых диапазонов размеров. Это приводит к ошибке квантования, но обычно является достаточно точным для большинства целей, если используется 10 или более классов.
Например, за исключением
- 167.8 175.4 176.1 166 174.7 170.2 178.9 180.4 174.6 174.5 182.4 173.4 167.4 170.7 180.6 169.6 176.2 176.3 175.1 178.7 167.2 180.2 180.3 164.7 167.9 179.6 164.9 173.2 180.3 168 175.5 172.9 182.2 166.7 172.4 181.9 175.9 176.8 179.6 166 171.5 180.6 175.5 173.2 178.8 168.3 170.3 174.2 168 172.6 163.3 172.5 163.4 165.9 178.2 174.6 174.3 170.5 169.7 176.2 175.1 177 173.5 173.6 174.3 174.4 171.1 173.3 164.6 173 177.9 166.5 159.6 170.5 174.7 182 172.7 175.9 171.5 167.1 176.9 181.7 170.7 177.5 170.9 178.1 174.3 173.3 169.2 178.2 179.4 187.6 186.4 178.1 174 177.1 163.3 178.1 179.1 175.6
Минимум и максимум — 159,6 и 187,6. Мы можем сгруппировать их следующим образом, округляя числа в меньшую сторону. Размер класса (CS) равен 3. Предполагаемое среднее значение — это центр диапазона от 174 до 177, что составляет 175,5. Различия учитываются в классах.
Диапазон | подсчет | частота | разница в классе | freq×diff | freq×diff 2 |
---|---|---|---|---|---|
159—161 | / | 1 | −5 | −5 | 25 |
162—164 | 6 | −4 | −24 | 96 | |
165—167 | 10 | −3 | −30 | 90 | |
168—170 | 13 | −2 | −26 | 52 | |
171—173 | 16 | −1 | −16 | 16 | |
174—176 | 25 | 0 | 0 | 0 | |
177—179 | 16 | 1 | 16 | 16 | |
180—182 | 11 | 2 | 22 | 44 | |
183—185 | 0 | 3 | 0 | 0 | |
186—188 | // | 2 | 4 | 8 | 32 |
Сумма | Н = 100 | А = −55 | Б = 371 |
Тогда среднее значение оценивается как
что очень близко к фактическому среднему значению 173,846.
Стандартное отклонение оценивается как