Jump to content

Алгоритм подсчета с потерями

Алгоритм подсчета с потерями — это алгоритм идентификации элементов в потоке данных которых , частота превышает заданный пользователем порог. Алгоритм работает путем разделения потока данных на сегменты для часто встречающихся элементов, но при этом за один раз заполняется как можно больше сегментов в основной памяти. Частота, вычисленная этим алгоритмом, не всегда точна, но имеет порог ошибки, который может указать пользователь. Время выполнения и пространство, необходимые алгоритму, обратно пропорциональны указанному порогу ошибки; следовательно, чем больше ошибка, тем меньше след.

Алгоритм был создан учеными-компьютерщиками Радживом Мотвани и Гурмитом Сингхом Манку. Он находит применение в вычислениях, где данные принимают форму непрерывного потока данных, а не конечного набора данных , например , измерения сетевого трафика , журналы веб-сервера и потоки посещений .

Алгоритм

[ редактировать ]

Общий алгоритм следующий [ 1 ]

  • Шаг 1. Разделите входящий поток данных на сегменты по ширине. , где упоминается пользователем как граница ошибки (вместе с минимальным порогом поддержки = ).
  • Шаг 2. Увеличьте частоту каждого элемента в соответствии с новыми значениями сегмента. После каждого сегмента уменьшайте все счетчики на 1.
  • Шаг 3. Повторите. Обновите счетчики и после каждого сегмента уменьшите все счетчики на 1.
  1. ^ Хан, Цзявэй. (2006). Интеллектуальный анализ данных: концепции и методы . Камбер, Мишлин. (2-е изд.). Амстердам: Эльзевир. ISBN  978-0-08-047558-5 . OCLC   143252170 .
  • Мотвани, Р; Маньку, Г.С. (2002). «Приблизительное количество частот в потоках данных». VLDB '02 Материалы 28-й Международной конференции по очень большим базам данных : 346–357.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: dbf9b86885d2b0e0a590209323a40534__1677804720
URL1:https://arc.ask3.ru/arc/aa/db/34/dbf9b86885d2b0e0a590209323a40534.html
Заголовок, (Title) документа по адресу, URL1:
Lossy Count Algorithm - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)