Jump to content

Топ-кодированный

В эконометрике и статистике наблюдение за данными с верхним кодированием точки данных, значения которых превышают верхнюю границу — это наблюдение, для которого цензурируются .

Данные опросов часто кодируются перед публикацией, чтобы сохранить анонимность респондентов. Например, если в ответе на опрос сообщается, что респондент оценивает свое состояние в 79 миллиардов долларов, он не будет анонимным, поскольку люди будут знать, что есть большая вероятность, что респондентом был Билл Гейтс . Также можно применять верхнее кодирование, чтобы предотвратить возможных ошибочных выбросов публикацию .

Нижнее кодирование аналогично, например, если суммы ниже нуля сообщаются как ноль. Верхнее кодирование происходит для данных, записанных в группах, например, если в этих группах указаны возрастные диапазоны: 0–20, 21–50, 50–99, 100 и старше. Здесь мы знаем только количество людей в возрасте старше 100 лет, а не их распределение. Производители данных опросов иногда публикуют среднее значение подвергнутых цензуре сумм, чтобы помочь пользователям получить объективные оценки верхней группы.

Пример: Топ-кодирование дохода в размере 30 000 долларов США.

[ редактировать ]
идентификатор возраст фактическое богатство переменная богатства в наборе данных
1 26 24,778 24,778
2 32 26,750 26,750
3 45 26,780 26,780
4 64 35,469 30000+
5 27 43,695 30000+

Топ-кодирование является общей проблемой анализа наборов данных общего пользования. Топ-кодирование в Текущем обследовании населения затрудняет оценку показателей неравенства доходов, поскольку форма распределения высоких доходов блокируется. Чтобы помочь решить эту проблему, CPS предоставляет среднее значение значений с верхним кодированием. [1]

Практика топ-кодирования или ограничения максимальной суммы, указанной в налоговых декларациях, для защиты анонимности получателя усложняет анализ распределения богатства в Соединенных Штатах. [2]

Последствия для обычной оценки методом наименьших квадратов

[ редактировать ]
  • Если нижняя граница группы с верхним кодированием используется в качестве значения регрессора (30 000 в приведенном выше примере), МНК является смещенным и непоследовательным, поскольку самые высокие значения регрессора сообщаются с систематической ошибкой.
  • Наблюдения с верхним кодированием можно полностью исключить из регрессии. При условии отсутствия систематических различий между исключенной группой и включенными группами, МНК является последовательным и объективным.
  • Процедура Тобита устойчива к верхнему кодированию и дает несмещенные оценки.

См. также

[ редактировать ]

Дальнейшее чтение

[ редактировать ]
  1. ^ Ларримор, Джефф, Ричард В. Буркхаузер, Шуайчжан Фэн и Лаура Заяц . 2008. Согласованные средние значения ячеек для топкодированных доходов в публичном использовании, мартовская CPS (1976-2007). Журнал экономических и социальных измерений 33 (2-3)
  2. ^ Хакер, Джейкоб С. и Пол Пирсон (2010). Политика «победитель получает все»: как Вашингтон сделал богатых еще богаче и отвернулся от среднего класса . Саймон и Шустер. стр. 13 . ISBN  978-1-4165-8869-6 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e7b22f95f6a2397f2877a7e7c67f51f2__1606856700
URL1:https://arc.ask3.ru/arc/aa/e7/f2/e7b22f95f6a2397f2877a7e7c67f51f2.html
Заголовок, (Title) документа по адресу, URL1:
Top-coded - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)