Моделирование поднятия
Моделирование подъема , также известное как постепенное моделирование , моделирование истинного подъема или чистое моделирование, представляет собой метод прогнозного моделирования , который напрямую моделирует постепенное влияние лечения (например, прямого маркетингового действия) на поведение человека.
Моделирование Uplift находит применение в управлении взаимоотношениями с клиентами для моделирования дополнительных, перекрестных продаж и удержания. Это также применялось к политическим выборам и персонализированной медицине . В отличие от родственной концепции дифференциального прогнозирования в психологии, моделирование подъема предполагает наличие активного агента.
Введение
[ редактировать ]Моделирование подъема использует рандомизированный научный контроль не только для измерения эффективности действия, но и для построения прогнозирующей модели, которая предсказывает постепенную реакцию на действие. Ответом может быть двоичная переменная (например, посещение веб-сайта). [1] или непрерывная переменная (например, доход клиента). [2] Моделирование подъема — это метод интеллектуального анализа данных , который применяется преимущественно в сфере финансовых услуг, телекоммуникаций и розничного прямого маркетинга для увеличения продаж , перекрестных продаж , оттока и удержания клиентов.
Измерение подъема
[ редактировать ]Повышение эффективности маркетинговой кампании обычно определяется как разница в частоте ответов между группой, получавшей лечение , и рандомизированной контрольной группой. Это позволяет маркетинговой команде изолировать эффект маркетингового действия и измерить эффективность или эффективность этого отдельного маркетингового действия. Честные маркетинговые команды будут признавать только дополнительный эффект своей кампании.
Однако многие маркетологи определяют подъем (а не подъем) как разницу в скорости ответа между лечением и контролем, поэтому моделирование подъема можно определить как улучшение (повышение) подъема посредством прогнозного моделирования.
В таблице ниже показаны подробности кампании с указанием количества ответов и расчетной доли ответов для гипотетической маркетинговой кампании. Эта кампания будет определена как имеющая повышение уровня отклика на 5%. Было получено 50 000 дополнительных ответов (100 000–50 000).
Группа | Количество клиентов | Ответы | Скорость ответа |
---|---|---|---|
Обработанный | 1,000,000 | 100,000 | 10% |
Контроль | 1,000,000 | 50,000 | 5% |
Традиционное моделирование реагирования
[ редактировать ]Традиционное моделирование ответа обычно берет группу пролеченных клиентов и пытается построить прогностическую модель, которая отделит вероятных ответивших от тех, кто не ответил, посредством использования одного из ряда методов прогнозного моделирования . Обычно для этого используются деревья решений или регрессионный анализ .
Эта модель будет использовать только обработанных клиентов для построения модели.
Напротив, моделирование подъема использует как обработанных, так и контрольных клиентов для построения прогнозной модели, ориентированной на дополнительную реакцию. Для понимания модели этого типа предлагается провести фундаментальную сегментацию, разделяющую клиентов на следующие группы (их названия были предложены Н. Рэдклиффом и объяснены в [3] )
- Убеждаемые : клиенты, которые реагируют на маркетинговые действия только потому, что они были нацелены на них.
- The Sure Things : клиенты, которые бы отреагировали независимо от того, стали ли они мишенью или нет.
- «Упущенные причины» : клиенты, которые не ответят, независимо от того, являются ли они объектом внимания.
- Режим «Не беспокоить» или «Спящие собаки» : клиенты, которые с меньшей вероятностью ответят, поскольку на них нацелены
Единственный сегмент, который дает настоящие дополнительные ответы, — это Persuadables .
Моделирование Uplift обеспечивает метод оценки, который позволяет разделить клиентов на группы, описанные выше.
Традиционное моделирование реагирования часто направлено на то, чтобы « Уверенные вещи» не могли отличить их от « Убеждаемых» .
Возврат инвестиций
[ редактировать ]Поскольку моделирование подъема фокусируется только на дополнительных реакциях, оно обеспечивает очень высокую отдачу от инвестиций при применении к традиционным действиям по формированию и удержанию спроса. Например, ориентируясь только на убеждаемых клиентов в исходящей маркетинговой кампании, можно значительно улучшить затраты на контакты и, следовательно, прибыль на единицу затрат.
Снятие негативных последствий
[ редактировать ]Одним из наиболее эффективных применений моделирования подъема является устранение негативных последствий кампаний по удержанию. Как в сфере телекоммуникаций, так и в сфере финансовых услуг часто кампании по удержанию клиентов могут побудить клиентов расторгнуть контракт или полис. Моделирование Uplift позволяет исключить этих клиентов из кампании «Не беспокоить».
Применение к A/B и многовариантному тестированию
[ редактировать ]Редко бывает, чтобы существовала одна экспериментальная и контрольная группы. Часто «лечение» может представлять собой множество простых вариантов сообщения или многоступенчатую стратегию контакта, которая классифицируется как единое лечение. В случае A/B или многомерного тестирования моделирование прироста может помочь понять, обеспечивают ли различия в тестах какой-либо значительный прирост по сравнению с другими критериями таргетинга, такими как поведенческие или демографические показатели.
История моделирования поднятий
[ редактировать ]Впервые моделирование истинного ответа появилось в работах Рэдклиффа и Сарри. [4]
Виктор Ло также опубликовал статью по этой теме в книге «Модель истинного подъема» (2002). [5] а затем снова Рэдклифф с «Использование контрольных групп для определения прогнозируемого подъема: построение и оценка моделей подъема» (2007). [6]
Рэдклифф также предоставляет очень полезный раздел часто задаваемых вопросов (FAQ) на своем веб-сайте Scientific Marketer. [7] Ло (2008) предлагает более общую концепцию, от разработки программ до прогнозного моделирования и оптимизации, а также будущие области исследований. [8]
Независимо моделирование поднятия изучалось Петром Жепаковским. Вместе с Шимоном Ярошевичем он адаптировал теорию информации для построения многоклассовых деревьев принятия решений и опубликовал статью в 2010 году. [9] А позже, в 2011 году, они распространили алгоритм на случай множественного лечения. [10]
Подобные подходы были исследованы в персонализированной медицине . [11] [12] Шимон Ярошевич и Петр Жепаковский (2014) разработали методологию повышения эффективности для анализа выживаемости и применили ее к анализу рандомизированных контролируемых исследований. [13] Йонг (2015) объединил алгоритм математической оптимизации посредством динамического программирования с методами машинного обучения для оптимальной стратификации пациентов. [14]
Моделирование подъема — это частный случай старой психологической концепции дифференциального прогнозирования. [15] В отличие от дифференциального прогнозирования, моделирование подъема предполагает наличие активного агента и использует показатель подъема в качестве показателя оптимизации.
Моделирование подъемов недавно было расширено и включено в различные машинного обучения алгоритмы , такие как индуктивное логическое программирование . [15] Байесовская сеть , [16] Статистическое реляционное обучение , [12] Машины опорных векторов , [17] [18] Анализ выживания [13] и ансамблевое обучение . [19]
Несмотря на то, что моделирование подъема широко применяется в маркетинговой практике (наряду с политическими выборами), оно редко встречается в маркетинговой литературе. Кейн, Ло и Чжэн (2014) опубликовали в маркетинговом журнале тщательный анализ трех наборов данных с использованием нескольких методов и предоставили доказательства того, что новый подход (известный как метод четырех квадрантов) работает довольно хорошо на практике. [20] Ло и Пачаманова (2015) расширили моделирование подъема до предписывающей аналитики для нескольких ситуаций лечения и предложили алгоритмы для решения больших задач детерминированной оптимизации и сложных задач стохастической оптимизации, где оценки неточны. [21]
Недавние исследования анализируют эффективность различных современных моделей подъема в сравнительных исследованиях с использованием больших объемов данных. [22] [1]
Подробное описание моделирования поднятия, его истории, способа построения моделей поднятия, отличий от построения классической модели, а также методов оценки, специфичных для поднятия, сравнение различных программных решений и объяснение различных экономических сценариев можно найти здесь. [23]
Реализации
[ редактировать ]На Python
[ редактировать ]В Р
[ редактировать ]Другие языки
[ редактировать ]- JMP от SAS
- Портретный подъем от Питни Боуз
- Узел Uplift для KNIME от Dymatrix
- Моделирование поднятия в Миро от Stochastic Solutions
Наборы данных
[ редактировать ]- Набор данных Hillstrom для электронного маркетинга
- Набор данных Criteo Uplift Prediction
- Набор данных для моделирования поднятия Ленты
- Набор данных для моделирования X5 RetailHero Uplift
- Набор данных конкурса MegaFon Uplift
Примечания и ссылки
[ редактировать ]- ^ Jump up to: а б Девриендт, Флорис; Молдаванин, Дарье; Вербеке, Воутер (2018). «Обзор литературы и экспериментальная оценка современного состояния моделирования поднятия: ступенька к развитию предписывающей аналитики». Большие данные . 6 (1): 13–41. дои : 10.1089/big.2017.0104 . ПМИД 29570415 .
- ^ Губела, Робин М.; Лессманн, Стефан; Ярошевич, Шимон (2020). «Преобразование ответа и декомпозиция прибыли для моделирования увеличения доходов». Европейский журнал операционных исследований . 283 (2): 647–661. arXiv : 1911.08729 . дои : 10.1016/j.ejor.2019.11.030 . S2CID 208175716 .
- ^ Н. Рэдклифф (2007). Определение того, кого можно спасти, а кого отпугнет деятельность по удержанию . Стохастик Солюшн Лимитед
- ^ Рэдклифф, Нью-Джерси; и Сарри, П.Д. (1999); Анализ дифференциального ответа: моделирование истинного ответа путем выделения эффекта одного действия , в Proceedings of Credit Scoring and Credit Control VI , Центр кредитных исследований, Школа менеджмента Эдинбургского университета.
- ^ Ло, ВСИ (2002); Модель истинного подъема , Информационный бюллетень ACM SIGKDD Explorations, Vol. 4, № 2, 78–86, доступно по адресу http://citeseerx.ist.psu.edu/viewdoc/download;jsessionid=4FD247B4987CBF2E29186DACE0D40C3D?doi=10.1.1.99.7064&rep=rep1&type=pdf .
- ^ Рэдклифф, Нью-Джерси (2007); Использование контрольных групп для достижения прогнозируемого роста: построение и оценка моделей подъема , Аналитический журнал прямого маркетинга, Ассоциация прямого маркетинга
- ^ Часто задаваемые вопросы для научных маркетологов по моделированию подъема.
- ^ Ло, VSY (2008) «Новые возможности в анализе маркетинговых данных». В Энциклопедии хранилищ и интеллектуального анализа данных, 2-е издание, под редакцией Ванга (2008), Idea Group Publishing.
- ^ Жепаковский, Петр; Ярошевич, Шимон (2010). «Деревья решений для моделирования поднятий». Международная конференция IEEE 2010 по интеллектуальному анализу данных . Сидней, Австралия. стр. 441–450. дои : 10.1109/ICDM.2010.62 . ISBN 978-1-4244-9131-5 . S2CID 14362608 .
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ) - ^ Жепаковский, Петр; Ярошевич, Шимон (2011). «Схемы решений для моделирования поднятия с помощью одной и нескольких обработок» . Знания и информационные системы . 32 (2): 303–327. дои : 10.1007/s10115-011-0434-0 .
- ^ Кай, Т.; Тиан, Л.; Вонг, PH; и Вэй, LJ (2009); Анализ данных рандомизированных сравнительных клинических исследований для индивидуального выбора лечения , Серия рабочих документов по биостатистике Гарвардского университета, документ 97
- ^ Jump up to: а б Насиф, Хусам; Куусисто, финн; Бернсайд, Элизабет С; Пейдж, Дэвид; Шавлик, Джуд; Сантос Коста, Витор (2013). «Оценивайте по мере подъема (SAYL): статистический подход к реляционному обучению для моделирования подъема». Инженерия передовых информационных систем . Конспекты лекций по информатике. Том. 8190. Прага. стр. 595–611. дои : 10.1007/978-3-642-40994-3_38 . ISBN 978-3-642-38708-1 . ПМЦ 4492311 . ПМИД 26158122 .
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ) - ^ Jump up to: а б Ярошевич, Шимон; Жепаковский, Петр (2014). «Моделирование поднятия с данными о выживании» (PDF) . Семинар ACM SIGKDD по медицинской информатике (HI KDD'14) . Нью-Йорк, США.
- ^ Йонг, Ф.Х. (2015), «Количественные методы стратифицированной медицины», докторская диссертация, факультет биостатистики, Гарвардская школа общественного здравоохранения им. Т.Ч. Чана, http://dash.harvard.edu/bitstream/handle/1/17463130/YONG -ДИССЕРТАЦИЯ-2015.pdf?sequence=1 .
- ^ Jump up to: а б Насиф, Хусам; Сантос Коста, Витор; Бернсайд, Элизабет С; Пейдж, Дэвид (2012). «Реляционное дифференциальное прогнозирование». Машинное обучение и обнаружение знаний в базах данных . Конспекты лекций по информатике. Том. 7523. Бристоль, Великобритания. стр. 617–632. дои : 10.1007/978-3-642-33460-3_45 . ISBN 978-3-642-33459-7 .
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ) - ^ Насиф, Хусам; Ву, Йиронг; Пейдж, Дэвид; Бернсайд, Элизабет (2012). «Байесовая сеть логического дифференциального прогнозирования, улучшающая диагностику рака молочной железы у пожилых женщин» . Симпозиум Американской ассоциации медицинской информатики (AMIA'12) . 2012 : 13:30–13:39. ПМК 3540455 . ПМИД 23304412 .
- ^ Куусисто, финн; Сантос Коста, Витор; Насиф, Хусам; Бернсайд, Элизабет; Пейдж, Дэвид; Шавлик, Джуд (2014). «Машины опорных векторов для дифференциального прогнозирования». Машинное обучение и обнаружение знаний в базах данных . Конспекты лекций по информатике. Том. 8725. Нанси, Франция. стр. 50–65. дои : 10.1007/978-3-662-44851-9_4 . ISBN 978-3-662-44850-2 . ПМЦ 4492338 . ПМИД 26158123 .
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ) - ^ Заневич, Лукаш; Ярошевич, Шимон (2013). «Машины опорных векторов для моделирования поднятий». Первый семинар IEEE ICDM по обнаружению причинно-следственных связей . Даллас, Техас.
- ^ Солтыс, Михал; Ярошевич, Шимон; Жепаковский, Петр (2015). «Ансамблевые методы моделирования поднятий» . Интеллектуальный анализ данных и обнаружение знаний . 29 (6): 1531–1559. дои : 10.1007/s10618-014-0383-9 .
- ^ Кейн, К.; Ло, ВСЫ; Чжэн, Дж. (2014). «Майнинг для по-настоящему отзывчивых и потенциальных клиентов с использованием моделирования True-Lift: сравнение новых и существующих методов». Журнал маркетинговой аналитики . 2 (4): 218–238. дои : 10.1057/jma.2014.18 . S2CID 256513132 .
- ^ Ло, ВСЫ; Пачаманова, Д. (2015). «От прогнозного моделирования повышения к предписывающей аналитике повышения: практический подход к оптимизации лечения с учетом оценки риска». Журнал маркетинговой аналитики . 3 (2): 79–95. дои : 10.1057/jma.2015.5 . S2CID 256508939 .
- ^ Губела, Робин М.; Беке, Артем; Лессманн, Стефан; Геберт, Фабиан (2019). «Рост конверсии в электронной коммерции: систематический критерий моделирования стратегий». Международный журнал информационных технологий и принятия решений . 18 (3): 747–791. дои : 10.1142/S0219622019500172 . hdl : 10419/230773 . S2CID 126538764 .
- ^ Р. Мишель, И. Шнакенбург, Т. фон Мартенс (2019). «Целевой подъем». Спрингер, ISBN 978-3-030-22625-1