~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ 5CCBBD72C61F3AD89EA04BE3B367B946__1707559500 ✰
Заголовок документа оригинал.:
✰ Data loading - Wikipedia ✰
Заголовок документа перевод.:
✰ Загрузка данных — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Data_loading ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/5c/46/5ccbbd72c61f3ad89ea04be3b367b946.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/5c/46/5ccbbd72c61f3ad89ea04be3b367b946__translat.html ✰
Дата и время сохранения документа:
✰ 21.06.2024 21:16:06 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 10 February 2024, at 13:05 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Загрузка данных — Википедия Jump to content

Загрузка данных

Из Википедии, бесплатной энциклопедии

Загрузка данных или просто загрузка — это часть обработки данных , при которой данные перемещаются между двумя системами так, что они попадают в промежуточную область целевой системы.

При использовании традиционного метода извлечения, преобразования и загрузки (ETL) задание загрузки является последним шагом, а загружаемые данные уже преобразованы. При альтернативном методе извлечения, загрузки и преобразования (ELT) задание загрузки является средним шагом, а преобразованные данные загружаются в исходном формате для преобразования данных в целевую систему.

Традиционно загрузка заданий в больших системах занимала много времени и обычно выполнялась ночью, в нерабочие часы компании.

Цель [ править ]

Две основные цели загрузки данных — получение более свежих данных в системах после загрузки и обеспечение быстрой загрузки, чтобы данные можно было часто обновлять. Для полного обновления данных можно добиться более быстрой загрузки, отключив ссылочную целостность , вторичные индексы и ведение журнала , но это обычно не допускается при инкрементном обновлении или постепенной подаче.

Типы [ править ]

Загрузка данных может осуществляться путем полного обновления (немедленно), постепенной загрузки и обновления (немедленно) или постепенной подачи (отложенно). Выбор метода может зависеть от объема данных, которые обновляются, изменяются или добавляются, а также от того, насколько актуальными должны быть данные. Важными факторами также являются тип данных, предоставляемых исходной системой, и возможность доверия историческим данным, предоставленным исходной системой.

Полное обновление [ править ]

Полное обновление данных означает, что сначала удаляются существующие данные в целевой таблице. Затем все данные из источника загружаются в целевую таблицу, в целевой таблице создаются новые индексы, а новые меры для обновленной таблицы рассчитываются .

Полное обновление легко реализовать, но оно предполагает перемещение большого количества данных, что может занять много времени и затруднить сохранение исторических данных. [1]

Инкрементное обновление [ править ]

Добавочное обновление или добавочное обновление означает, что из исходной системы извлекаются только новые или обновленные данные. [2] [3] Обновленные данные затем добавляются к существующим данным в целевой системе, и существующие данные в целевой системе обновляются. Индексы и статистика обновляются соответствующим образом. Добавочное обновление может ускорить загрузку и упростить отслеживание истории, но может потребовать больших затрат на настройку и обслуживание. [1]

Тройная подача [ править ]

Тройная подача или капельная загрузка означает, что при обновлении исходной системы изменения в целевой системе произойдут почти сразу. [4] [5]

Загрузка в используемые системы [ править ]

При загрузке данных в систему, которая в данный момент используется пользователями или другими системами, необходимо решить, когда систему следует обновить и что произойдет с таблицами, которые используются одновременно с обновлением системы. Одним из возможных решений является использование теневых таблиц . [6] [7]

См. также [ править ]

Ссылки [ править ]

  1. ^ Перейти обратно: а б «Инкрементальная загрузка данных и ETL с полной загрузкой: 4 критических различия — Узнайте | Hevo» . 14 апреля 2022 г. Проверено 18 февраля 2023 г.
  2. ^ «Постепенная загрузка» . Проверено 18 февраля 2023 г.
  3. ^ Митчелл, Тим (23 июля 2020 г.). «Что, почему, когда и как при возрастающих нагрузках» . Проверено 18 февраля 2023 г.
  4. ^ Зутерс, Янис (2011). «Хранилище данных в режиме, близком к реальному времени, с многоступенчатой ​​струйкой и переворотом» . В Грабисе, Янис; Кирикова, Марите (ред.). Перспективы исследований в области бизнес-информатики . Том. 90. Шпрингер Берлин Гейдельберг. стр. 73–82. дои : 10.1007/978-3-642-24511-4_6 . ISBN  978-3-642-24510-7 . Хранилище данных обычно представляет собой набор исторических данных, предназначенных для поддержки принятия решений, поэтому оно периодически обновляется из источников, в основном ежедневно. Однако сегодняшний бизнес требует более свежих данных. Складирование в режиме реального времени является одной из тенденций достижения этой цели, но существует ряд проблем на пути к настоящему реальному времени. В этом документе предлагается «многоэтапная методология «струйки и переворота»» для обновления хранилища данных. он основан на принципе «струйки и переворота» и расширен для дальнейшей изоляции операций загрузки и запроса, что позволяет им обоим быть более эффективными.
  5. ^ «Постепенная загрузка данных» . Проверено 18 февраля 2023 г.
  6. ^ «Создание теневых таблиц для синхронизации — Управление данными — Центр документации Cloud Alibaba» . Проверено 18 февраля 2023 г.
  7. ^ «Теневые таблицы» . 10 августа 2015 г. Проверено 18 февраля 2023 г.
Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: 5CCBBD72C61F3AD89EA04BE3B367B946__1707559500
URL1:https://en.wikipedia.org/wiki/Data_loading
Заголовок, (Title) документа по адресу, URL1:
Data loading - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)