Jump to content

дплир


дплир
Оригинальный автор(ы) Хэдли Уикэм , Ромен Франсуа, Лайонел Генри, Кирилл Мюллер, Дэвис Вон
Первоначальный выпуск 7 января 2014 г .; 10 лет назад ( 07.01.2014 )
Стабильная версия
1.1.0 / 29 января 2023 г .; 18 месяцев назад ( 29.01.2023 )
Написано в Р
Лицензия МОЯ лицензия
Веб-сайт дплир .tidyverse .org //

dplyr — это пакет R , набор функций которого предназначен для обеспечения интуитивно понятного и удобного для пользователя манипулирования фреймами данных (структурой данных, похожей на электронную таблицу). Это один из основных пакетов популярного tidyverse набора пакетов на языке программирования R. [1] Аналитики данных обычно используют dplyr для преобразования существующих наборов данных в формат, лучше подходящий для определенного типа анализа или визуализации данных. [2] [3]

Например, тот, кто хочет проанализировать большой набор данных, может захотеть просмотреть только меньшую часть данных. Альтернативно, пользователь может захотеть изменить порядок данных, чтобы увидеть строки, ранжированные по некоторому числовому значению или даже на основе комбинации значений из исходного набора данных. Функции пакета dplyr позволят пользователю выполнять такие задачи.

dplyr был выпущен в 2014 году. [4] На веб-странице dplyr пакет описан как «грамматика манипулирования данными, предоставляющая согласованный набор глаголов, которые помогут вам решить наиболее распространенные проблемы манипулирования данными». [5]

Пять основных глаголов

[ редактировать ]

Хотя dplyr на самом деле включает в себя несколько десятков функций, которые позволяют различные формы манипулирования данными, в пакете есть пять основных команд или действий: [6]

  • filter() , который используется для извлечения строк из кадра данных на основе условий, указанных пользователем;
  • select() , который используется для подмножества кадра данных по его столбцам;
  • Arrange() , который используется для сортировки строк в кадре данных на основе атрибутов, содержащихся в определенных столбцах;
  • mutate() , который используется для создания новых переменных путем изменения и/или объединения значений из существующих столбцов; и
  • summarise() , также называемый summarise() , который используется для свертывания значений из кадра данных в одну сводку.

Дополнительные функции

[ редактировать ]

В дополнение к пяти основным командам dplyr также включает в себя несколько других функций, которые позволяют исследовать и манипулировать кадрами данных. В их число входят:

  • count() , который используется для суммирования количества уникальных наблюдений, содержащих определенное значение или категориальный атрибут;
  • rename() , который позволяет пользователю изменять имена столбцов для переменных, часто для повышения простоты использования и интуитивного понимания набора данных;
  • срез_max() , который возвращает подмножество данных, содержащее строки с наибольшим количеством значений для некоторой конкретной переменной;
  • срез_min() , который возвращает подмножество данных, содержащее строки с наименьшим количеством значений для некоторой конкретной переменной.

Встроенные наборы данных

[ редактировать ]

Пакет dplyr включает пять наборов данных. Это: band_instruments, band_instruments2, band_members, starwars, storms.

[ редактировать ]

Авторские права на dplyr принадлежат Posit PBC , ранее RStudio PBC. dplyr изначально был выпущен под GPL. лицензией [ нужна ссылка ] , но в 2022 году Posit изменил условия лицензии пакета на «более либеральную» лицензию MIT . [7] Основное различие между этими двумя типами лицензий заключается в том, что лицензия MIT допускает последующее повторное использование кода в проприетарном программном обеспечении, тогда как лицензия GPL этого не делает.

  1. ^ Уикхэм, Хэдли; Аверик, Мара; Брайан, Дженнифер; Чанг, Уинстон; Макгоуэн, Люси Д'Агостино; Франсуа, Ромен; Гролемунд, Гарретт; Хейс, Алекс; Генри, Лайонел; Хестер, Джим; Кун, Макс; Педерсен, Томас Лин; Миллер, Эван; Бач, Стефан Милтон; Мюллер, Кирилл (21 ноября 2019 г.). «Добро пожаловать в Тидиверс» . Журнал программного обеспечения с открытым исходным кодом . 4 (43): 1686. doi : 10.21105/joss.01686 . ISSN   2475-9066 .
  2. ^ Ядав, Рохит (29 октября 2019 г.). «Панды Python против Tidyverse R: кто победит?» . Журнал Analytics India Magazine . Проверено 6 февраля 2021 г.
  3. ^ Криль, Пол (30 июня 2015 г.). «Почему R? Плюсы и минусы языка R» . Инфомир . Проверено 6 февраля 2021 г.
  4. ^ «Знакомство с dplyr» . blog.rstudio.com . 17 января 2014 года . Проверено 2 сентября 2020 г.
  5. ^ «Справочник по функциям» . dplyr.tidyverse.org . Проверено 6 февраля 2021 г.
  6. ^ Гролемунд, Гарретт; Уикхем, Хэдли. 5 Преобразование данных | R для науки о данных .
  7. ^ «Грамматика манипулирования данными» . tidyverse.org . Проверено 14 января 2023 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: c80d15b7dbeed5524503988d07a34284__1716771720
URL1:https://arc.ask3.ru/arc/aa/c8/84/c80d15b7dbeed5524503988d07a34284.html
Заголовок, (Title) документа по адресу, URL1:
dplyr - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)