Дэвид Дж. Робинсон (специалист по данным)
Дэвид Робинсон | |
---|---|
Образование | |
Научная карьера | |
Поля | |
Учреждения |
|
Веб-сайт | varianceexplained.org |
Дэвид Г. Робинсон — специалист по данным в аналитической компании Heap. Он является соавтором пакета tidytext R (язык программирования) и книги О'Рейли «Интеллектуальный анализ текста с помощью R» . Робинсон ранее работал главным специалистом по данным в DataCamp и специалистом по данным в Stack Overflow . [ 1 ] В 2019 году он также работал инженером по обработке данных в Flatiron Health.
Образование
[ редактировать ]Робинсон окончил Гарвардский университет со степенью бакалавра гуманитарных наук в области статистики в 2010 году. [ 2 ] Он получил докторскую степень в области количественной и вычислительной биологии в Принстонском университете . [ 3 ]
Карьера
[ редактировать ]Робинсон ранее работал в Flatiron Health, где использовал науку о данных в борьбе с раком в команде инженеров Data Insights. Он опубликовал три курса по DataCamp, которые помогают людям изучать R и науку о данных. [ 4 ] Он также является соавтором Text Mining with R: A Tidy Approach with Julia Silge . [ 5 ] Книга была опубликована издательством O'Reilly в июле 2017 года и представляет собой руководство по извлечению информации из текста с помощью пакета tidytext в R. [ 6 ] Другая книга, написанная Робинсоном, — « Введение в эмпирический байесовский метод: примеры из бейсбольной статистики» , электронная книга, демонстрирующая статистический метод эмпирического Байеса на примере оценки средних показателей по бейсболу. [ 7 ]
Робинсон известен своим профилированием авторов и анализом настроений твитов Дональда Трампа в 2016 году, когда он обнаружил, что сообщения с официального аккаунта Трампа поступали из нескольких источников. [ 8 ] [ 9 ] [ 10 ]
Публикации
[ редактировать ]Робинсон имеет множество публикаций, в том числе: «Широко распространенные изменения в стабильности мРНК способствуют паттернам экспрессии генов, специфичных для покоя, в модели покоя фибробластов». [ 11 ] «метла: пакет R для преобразования объектов статистического анализа в аккуратные фреймы данных», [ 12 ] «Вложенный параллельный эксперимент демонстрирует различия в зависимости интенсивности между секвенированием РНК и микрочипами», [ 13 ] «subSeq: определение соответствующей глубины секвенирования посредством эффективной субвыборки чтения», [ 14 ] «Планирование и анализ экспериментов Bar-seq», [ 15 ] и «OASIS: автоматизированная программа для глобального исследования последовательностей вставок бактерий и архей». [ 16 ]
Как уже упоминалось, его книга «Введение в эмпирический Байес» помогает читателям понять байесовские методы оценки биномиальных пропорций с помощью серии примеров, взятых из бейсбольной статистики. [ 17 ]
Ссылки
[ редактировать ]- ^ «Изучите R, Python и науку о данных онлайн» . Архивировано из оригинала 19 июля 2002 года . Проверено 1 апреля 2020 г.
- ^ Робинсон, Дэвид. «Линкедин» .
- ^ «Моделирование в «tidyverse» с помощью пакета R: метла» . lsi.princeton.edu . 2018 . Проверено 4 марта 2021 г.
- ^ «Набор данных Gapminder | R» . кампус.datacamp.com . Проверено 1 апреля 2020 г.
- ^ Силге, Юлия (12 июня 2017 г.). Анализ текста с помощью R: аккуратный подход . Робинсон, Дэвид (Первое изд.). Севастополь, Калифорния. ISBN 978-1-4919-8162-7 . OCLC 990182937 .
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ) - ^ Силге, Джулия; Робинсон, Дэвид. Анализ текста с помощью R .
- ^ «Введение в эмпирический метод Байеса: примеры из бейсбольной статистики» . Гамроуд . Проверено 1 апреля 2020 г.
- ^ Гринмайер, Ларри. «Только некоторые из твитов @realDonaldTrump на самом деле являются Дональдом Трампом» . Научный американец . Проверено 1 июня 2020 г.
- ^ Бергер, Ариэль. «Ученый по данным: Есть простой способ определить, исходил ли один из твитов Трампа от него самого или от его предвыборного штаба» . Бизнес-инсайдер . Проверено 1 июня 2020 г.
- ^ Кан, Эндрю; Филбрик, Ян Прасад (15 августа 2016 г.). «Кто написал эти твиты Дональда Трампа?» . Сланец . ISSN 1091-2339 . Проверено 1 июня 2020 г.
- ^ Джонсон, Элизабет Л.; Робинсон, Дэвид Г.; Коллер, Хилари А. (1 февраля 2017 г.). «Широко распространенные изменения в стабильности мРНК способствуют паттернам экспрессии генов, специфичным для покоя, в модели покоя фибробластов» . БМК Геномика . 18 (1): 123. дои : 10.1186/s12864-017-3521-0 . ISSN 1471-2164 . ПМЦ 5286691 . ПМИД 28143407 .
- ^ Робинсон, Дэвид (19 декабря 2014 г.). «Метла: пакет R для преобразования объектов статистического анализа в аккуратные фреймы данных». arXiv : 1412.3565 [ stat.CO ].
- ^ Робинсон, Дэвид Г.; Ван, Жан; Стори, Джон Д. (2015). «Вложенный параллельный эксперимент демонстрирует различия в зависимости интенсивности между секвенированием РНК и микрочипами» . Исследования нуклеиновых кислот . 43 (20): гкв636. биоRxiv 10.1101/013342 . дои : 10.1093/nar/gkv636 . ПМЦ 4787771 . ПМИД 26130709 .
- ^ Робинсон, Дэвид Г.; Стори, Джон Д. (1 декабря 2014 г.). «subSeq: определение соответствующей глубины секвенирования посредством эффективной субвыборки чтения» . Биоинформатика . 30 (23): 3424–3426. doi : 10.1093/биоинформатика/btu552 . ISSN 1367-4803 . ПМК 4296149 . ПМИД 25189781 .
- ^ Робинсон, Дэвид Г.; Чен, Вэй; Стори, Джон Д.; Грешем, Дэвид (1 января 2014 г.). «Планирование и анализ экспериментов Bar-seq» . G3: Гены, геномы, генетика . 4 (1): 11–18. дои : 10.1534/g3.113.008565 . ISSN 2160-1836 . ПМЦ 3887526 . ПМИД 24192834 .
- ^ Робинсон, Дэвид Г.; Ли, Мин-Чун; Маркс, Кристофер Дж. (1 декабря 2012 г.). «OASIS: автоматизированная программа для глобального исследования последовательностей вставок бактерий и архей» . Исследования нуклеиновых кислот . 40 (22): е174. дои : 10.1093/nar/gks778 . ISSN 0305-1048 . ПМЦ 3526298 . ПМИД 22904081 .
- ^ «Анонсирую выпуск моей электронной книги: Введение в эмпирический байесовский метод» . Объяснение дисперсии . 7 февраля 2017 г. Проверено 13 апреля 2020 г.