Jump to content

Дэвид Дж. Робинсон (специалист по данным)

Дэвид Робинсон
Образование
Научная карьера
Поля
Учреждения
Веб-сайт varianceexplained.org

Дэвид Г. Робинсон специалист по данным в аналитической компании Heap. Он является соавтором пакета tidytext R (язык программирования) и книги О'Рейли «Интеллектуальный анализ текста с помощью R» . Робинсон ранее работал главным специалистом по данным в DataCamp и специалистом по данным в Stack Overflow . [ 1 ] В 2019 году он также работал инженером по обработке данных в Flatiron Health.

Образование

[ редактировать ]

Робинсон окончил Гарвардский университет со степенью бакалавра гуманитарных наук в области статистики в 2010 году. [ 2 ] Он получил докторскую степень в области количественной и вычислительной биологии в Принстонском университете . [ 3 ]

Робинсон ранее работал в Flatiron Health, где использовал науку о данных в борьбе с раком в команде инженеров Data Insights. Он опубликовал три курса по DataCamp, которые помогают людям изучать R и науку о данных. [ 4 ] Он также является соавтором Text Mining with R: A Tidy Approach with Julia Silge . [ 5 ] Книга была опубликована издательством O'Reilly в июле 2017 года и представляет собой руководство по извлечению информации из текста с помощью пакета tidytext в R. [ 6 ] Другая книга, написанная Робинсоном, — « Введение в эмпирический байесовский метод: примеры из бейсбольной статистики» , электронная книга, демонстрирующая статистический метод эмпирического Байеса на примере оценки средних показателей по бейсболу. [ 7 ]

Робинсон известен своим профилированием авторов и анализом настроений твитов Дональда Трампа в 2016 году, когда он обнаружил, что сообщения с официального аккаунта Трампа поступали из нескольких источников. [ 8 ] [ 9 ] [ 10 ]

Публикации

[ редактировать ]

Робинсон имеет множество публикаций, в том числе: «Широко распространенные изменения в стабильности мРНК способствуют паттернам экспрессии генов, специфичных для покоя, в модели покоя фибробластов». [ 11 ] «метла: пакет R для преобразования объектов статистического анализа в аккуратные фреймы данных», [ 12 ] «Вложенный параллельный эксперимент демонстрирует различия в зависимости интенсивности между секвенированием РНК и микрочипами», [ 13 ] «subSeq: определение соответствующей глубины секвенирования посредством эффективной субвыборки чтения», [ 14 ] «Планирование и анализ экспериментов Bar-seq», [ 15 ] и «OASIS: автоматизированная программа для глобального исследования последовательностей вставок бактерий и архей». [ 16 ]

Как уже упоминалось, его книга «Введение в эмпирический Байес» помогает читателям понять байесовские методы оценки биномиальных пропорций с помощью серии примеров, взятых из бейсбольной статистики. [ 17 ]

  1. ^ «Изучите R, Python и науку о данных онлайн» . Архивировано из оригинала 19 июля 2002 года . Проверено 1 апреля 2020 г.
  2. ^ Робинсон, Дэвид. «Линкедин» .
  3. ^ «Моделирование в «tidyverse» с помощью пакета R: метла» . lsi.princeton.edu . 2018 . Проверено 4 марта 2021 г.
  4. ^ «Набор данных Gapminder | R» . кампус.datacamp.com . Проверено 1 апреля 2020 г.
  5. ^ Силге, Юлия (12 июня 2017 г.). Анализ текста с помощью R: аккуратный подход . Робинсон, Дэвид (Первое изд.). Севастополь, Калифорния. ISBN  978-1-4919-8162-7 . OCLC   990182937 . {{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  6. ^ Силге, Джулия; Робинсон, Дэвид. Анализ текста с помощью R .
  7. ^ «Введение в эмпирический метод Байеса: примеры из бейсбольной статистики» . Гамроуд . Проверено 1 апреля 2020 г.
  8. ^ Гринмайер, Ларри. «Только некоторые из твитов @realDonaldTrump на самом деле являются Дональдом Трампом» . Научный американец . Проверено 1 июня 2020 г.
  9. ^ Бергер, Ариэль. «Ученый по данным: Есть простой способ определить, исходил ли один из твитов Трампа от него самого или от его предвыборного штаба» . Бизнес-инсайдер . Проверено 1 июня 2020 г.
  10. ^ Кан, Эндрю; Филбрик, Ян Прасад (15 августа 2016 г.). «Кто написал эти твиты Дональда Трампа?» . Сланец . ISSN   1091-2339 . Проверено 1 июня 2020 г.
  11. ^ Джонсон, Элизабет Л.; Робинсон, Дэвид Г.; Коллер, Хилари А. (1 февраля 2017 г.). «Широко распространенные изменения в стабильности мРНК способствуют паттернам экспрессии генов, специфичным для покоя, в модели покоя фибробластов» . БМК Геномика . 18 (1): 123. дои : 10.1186/s12864-017-3521-0 . ISSN   1471-2164 . ПМЦ   5286691 . ПМИД   28143407 .
  12. ^ Робинсон, Дэвид (19 декабря 2014 г.). «Метла: пакет R для преобразования объектов статистического анализа в аккуратные фреймы данных». arXiv : 1412.3565 [ stat.CO ].
  13. ^ Робинсон, Дэвид Г.; Ван, Жан; Стори, Джон Д. (2015). «Вложенный параллельный эксперимент демонстрирует различия в зависимости интенсивности между секвенированием РНК и микрочипами» . Исследования нуклеиновых кислот . 43 (20): гкв636. биоRxiv   10.1101/013342 . дои : 10.1093/nar/gkv636 . ПМЦ   4787771 . ПМИД   26130709 .
  14. ^ Робинсон, Дэвид Г.; Стори, Джон Д. (1 декабря 2014 г.). «subSeq: определение соответствующей глубины секвенирования посредством эффективной субвыборки чтения» . Биоинформатика . 30 (23): 3424–3426. doi : 10.1093/биоинформатика/btu552 . ISSN   1367-4803 . ПМК   4296149 . ПМИД   25189781 .
  15. ^ Робинсон, Дэвид Г.; Чен, Вэй; Стори, Джон Д.; Грешем, Дэвид (1 января 2014 г.). «Планирование и анализ экспериментов Bar-seq» . G3: Гены, геномы, генетика . 4 (1): 11–18. дои : 10.1534/g3.113.008565 . ISSN   2160-1836 . ПМЦ   3887526 . ПМИД   24192834 .
  16. ^ Робинсон, Дэвид Г.; Ли, Мин-Чун; Маркс, Кристофер Дж. (1 декабря 2012 г.). «OASIS: автоматизированная программа для глобального исследования последовательностей вставок бактерий и архей» . Исследования нуклеиновых кислот . 40 (22): е174. дои : 10.1093/nar/gks778 . ISSN   0305-1048 . ПМЦ   3526298 . ПМИД   22904081 .
  17. ^ «Анонсирую выпуск моей электронной книги: Введение в эмпирический байесовский метод» . Объяснение дисперсии . 7 февраля 2017 г. Проверено 13 апреля 2020 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: c32a0973cce3b5762267a5bd4ad3b6ab__1707001320
URL1:https://arc.ask3.ru/arc/aa/c3/ab/c32a0973cce3b5762267a5bd4ad3b6ab.html
Заголовок, (Title) документа по адресу, URL1:
David G. Robinson (data scientist) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)