Дифференциальная конфиденциальность
Дифференциальная конфиденциальность ( DP ) — это математически строгая основа для раскрытия статистической информации о наборах данных при одновременной защите конфиденциальности отдельных субъектов данных. Это позволяет владельцу данных делиться совокупными моделями группы, ограничивая при этом утечку информации о конкретных людях. [1] [2] Это делается путем введения тщательно калиброванного шума в статистические вычисления таким образом, чтобы полезность статистики сохранялась, но при этом доказуемо ограничивалась тем, что можно сделать вывод о любом человеке в наборе данных.
Другой способ описать дифференциальную конфиденциальность — это ограничение на алгоритмы, используемые для публикации совокупной информации о статистической базе данных, которое ограничивает раскрытие частной информации записей в базе данных. Например, алгоритмы дифференциальной конфиденциальности используются некоторыми государственными учреждениями для публикации демографической информации или других статистических агрегатов, обеспечивая при этом конфиденциальность ответов на опросы, а также компаниями для сбора информации о поведении пользователей, контролируя при этом то, что видно даже внутренним аналитикам.
Грубо говоря, алгоритм является дифференциально частным, если наблюдатель, видя его выходные данные, не может сказать, использовалась ли информация конкретного человека в вычислениях. Дифференциальная конфиденциальность часто обсуждается в контексте идентификации лиц, информация которых может находиться в базе данных. Хотя это и не относится напрямую к атакам с идентификацией и повторной идентификацией, алгоритмы дифференциальной конфиденциальности, очевидно, противостоят таким атакам. [3]
История [ править ]
Историческая справка [ править ]
Официальным статистическим организациям поручено собирать информацию от отдельных лиц или учреждений и публиковать совокупные данные в интересах общества. Например, в ходе переписи населения США 1790 года была собрана информация о людях, живущих в Соединенных Штатах , и опубликованы таблицы с учетом пола, возраста, расы и условий подневольного состояния . [4] Первоначально записи переписи населения были опубликованы, но начиная с переписи 1840 года они собирались под обещанием конфиденциальности , что предоставленная информация будет использоваться в статистических целях, но что публикации не будут содержать информацию, которую можно было бы отследить до конкретного человека или учреждения. .
Для достижения конфиденциальности статистические организации долгое время скрывали информацию в своих публикациях. Например, в таблице, представляющей продажи каждого предприятия в городе, сгруппированные по категориям бизнеса, ячейку, содержащую информацию только об одной компании, можно скрыть, чтобы сохранить конфиденциальность конкретных продаж этой компании.
Внедрение систем электронной обработки информации статистическими агентствами в 1950-х и 1960-х годах резко увеличило количество таблиц, которые статистическая организация могла создавать, и тем самым значительно увеличила вероятность ненадлежащего раскрытия конфиденциальной информации. Например, если компания, у которой были скрыты данные о продажах, также имела эти цифры в общем объеме продаж региона, то можно было бы определить скрытое значение, вычитая другие продажи из этой суммы. Но могут также быть комбинации добавлений и исключений, которые могут привести к раскрытию частной информации. Количество комбинаций, которые необходимо проверить, увеличивается экспоненциально с увеличением количества публикаций и потенциально не ограничено, если пользователи данных могут делать запросы к статистической базе данных с помощью интерактивной системы запросов.
ведущие к дифференцированной конфиденциальности , Ранние исследования
В 1977 году Торе Далениус формализовал математику подавления клеток . [5] Торе Далениус был шведским статистиком, который внес вклад в обеспечение конфиденциальности статистической информации в своей статье 1977 года, в которой раскрылся ключевой момент статистических баз данных, а именно то, что базы данных не должны раскрывать информацию о человеке, которая не была бы доступна иным образом. [6]
В 1979 году Дороти Деннинг , Питер Дж. Деннинг и Майер Д. Шварц формализовали концепцию трекера — злоумышленника, который мог узнать конфиденциальное содержимое статистической базы данных, создав серию целевых запросов и запомнив результаты. [7] Это и будущие исследования показали, что свойства конфиденциальности в базе данных можно сохранить только при рассмотрении каждого нового запроса в свете (возможно, всех) предыдущих запросов. Это направление работы иногда называют конфиденциальностью запросов, а конечный результат заключается в том, что отслеживание влияния запроса на конфиденциальность отдельных лиц в базе данных было NP-сложным.
Исследования 21 века в дифференциальной области конфиденциальности
В 2003 году Кобби Ниссим и Ирит Динур продемонстрировали, что невозможно публиковать произвольные запросы к частной статистической базе данных, не раскрывая при этом некоторого количества частной информации, и что весь информационный контент базы данных может быть раскрыт путем публикации результатов удивительно небольшого количество случайных запросов — гораздо меньше, чем предполагалось в предыдущей работе. [8] Это общее явление известно как « Фундаментальный закон восстановления информации» , и его ключевое понимание, а именно то, что в самом общем случае конфиденциальность не может быть защищена без внесения некоторого количества шума, привело к развитию дифференциальной конфиденциальности.
В 2006 году Синтия Дворк , Фрэнк МакШерри , Кобби Ниссим и Адам Д. Смит опубликовали статью, в которой формализовали количество шума, которое необходимо добавить, и предлагали обобщенный механизм для этого. [3] Их работа стала одним из лауреатов премии TCC Test of Time Award 2016. [9] и премия Гёделя 2017 года . [10]
С тех пор последующие исследования показали, что существует множество способов получения очень точной статистики из базы данных, сохраняя при этом высокий уровень конфиденциальности . [1]
ε-дифференциальная конфиденциальность [ править ]
2006 года В статье Синтии Дворк , Фрэнка МакШерри , Кобби Ниссим и Адама Д. Смита была представлена концепция ε-дифференциальной конфиденциальности, математическое определение потери конфиденциальности, связанной с любой публикацией данных, взятых из статистической базы данных. (Здесь термин «статистическая база данных» означает набор данных, которые собираются под залогом конфиденциальности с целью создания статистики, которая в результате своего производства не ставит под угрозу конфиденциальность тех лиц, которые предоставили данные.)
Интуиция определения ε-дифференциальной конфиденциальности, данного в 2006 году, заключается в том, что конфиденциальность человека не может быть скомпрометирована публикацией статистики, если его данные отсутствуют в базе данных. Таким образом, при использовании дифференцированной конфиденциальности цель состоит в том, чтобы предоставить каждому человеку примерно такую же конфиденциальность, которая была бы получена в результате удаления его данных. То есть статистические функции, выполняемые в базе данных, не должны чрезмерно зависеть от данных какого-либо одного человека.
Конечно, вклад каждого человека в результат запроса к базе данных частично зависит от того, сколько данных людей задействовано в запросе. Если база данных содержит данные одного человека, вклад данных этого человека составляет 100%. Если база данных содержит данные ста человек, вклад каждого человека составляет всего 1%. Основная идея дифференциальной конфиденциальности заключается в том, что, поскольку запрос выполняется на основе данных все меньшего и меньшего числа людей, к результату запроса необходимо добавлять больше шума, чтобы обеспечить тот же уровень конфиденциальности. Отсюда и название статьи 2006 года: «Калибровка шума по чувствительности при анализе частных данных».
В документе 2006 года представлено как математическое определение дифференциальной конфиденциальности, так и механизм, основанный на добавлении шума Лапласа (т. е. шума, исходящего из распределения Лапласа ), который удовлетворяет этому определению.
Определение ε конфиденциальности дифференциальной -
Пусть ε — положительное действительное число и быть рандомизированным алгоритмом , который принимает набор данных в качестве входных данных (представляющий действия доверенной стороны, хранящей данные).
Позволять обозначаем образ .
Алгоритм Говорят, что он обеспечивает ε-дифференциальную конфиденциальность, если для всех наборов данных и которые различаются по одному элементу (т. е. данным одного человека) и всем подмножествам из :
где вероятность принимается за случайность, используемую алгоритмом. [11]
Дифференциальная конфиденциальность предлагает надежные и надежные гарантии, которые облегчают модульное проектирование и анализ дифференциально-частных механизмов благодаря их компонуемости , устойчивости к постобработке и постепенному деградации при наличии коррелированных данных .
Компонуемость [ править ]
(Само)компонуемость относится к тому факту, что совместное распределение результатов (возможно, адаптивно выбранных) дифференциально частных механизмов удовлетворяет дифференциальной конфиденциальности.
Последовательная композиция. Если мы запросим механизм ε-дифференциальной конфиденциальности раз, а рандомизация механизма независима для каждого запроса, то результат будет - дифференциально-частный. В более общем случае, если существуют независимые механизмы: , чьи гарантии конфиденциальности дифференциальная конфиденциальность, соответственно, то любая функция из них: является - дифференциально-частный. [12]
Параллельная композиция. Если предыдущие механизмы вычисляются на непересекающихся подмножествах частной базы данных, то функция было бы - вместо этого дифференциально частный. [12]
Устойчивость к постобработке [ править ]
Для любой детерминированной или рандомизированной функции определяется над изображением механизма , если удовлетворяет ε-дифференциальной конфиденциальности, как и .
Вместе компонуемость и устойчивость к постобработке позволяют модульное построение и анализ дифференциально частных механизмов и мотивируют концепцию бюджета потери конфиденциальности . Если все элементы, имеющие доступ к конфиденциальным данным сложных механизмов, являются по отдельности дифференциально приватными, то же самое будет и с их комбинацией с последующей произвольной постобработкой.
Конфиденциальность группы [ править ]
В общем, ε-дифференциальная конфиденциальность предназначена для защиты конфиденциальности между соседними базами данных, которые различаются только одной строкой. Это означает, что ни один противник с произвольной вспомогательной информацией не может знать, один предоставил ли свою информацию конкретный участник. Однако это также расширяемо. Мы можем захотеть защитить базы данных, различающиеся по строк, что означает, что противник с произвольной вспомогательной информацией знает, отдельные участники представили свою информацию. Этого можно достичь, потому что если элементы меняются, расширение вероятности ограничено вместо , [13] т. е. для D 1 и D 2, отличающихся предметы:
Таким образом, установив ε вместо достигает желаемого результата (защита предметы). Другими словами, вместо того, чтобы каждый элемент был защищен ε-дифференциально частной защитой, теперь каждая группа элементы защищены ε-дифференциально частной защитой (и каждый элемент - дифференциально-частная защита).
ε-дифференциально частные механизмы [ править ]
Поскольку дифференциальная конфиденциальность является вероятностной концепцией, любой дифференциально-частный механизм обязательно рандомизирован. Некоторые из них, например механизм Лапласа, описанный ниже, основаны на добавлении контролируемого шума к функции, которую мы хотим вычислить. Другие, такие как экспоненциальный механизм [14] и задний отбор проб [15] Вместо этого выберите выборку из семейства распределений, зависящих от проблемы.
Чувствительность [ править ]
Позволять быть положительным целым числом, быть набором наборов данных, и быть функцией. Чувствительность [3] функции, обозначаемой , определяется
В приведенном ниже примере медицинской базы данных, если мы рассмотрим быть функцией , то чувствительность функции равна единице, поскольку изменение любой из записей в базе данных приводит к изменению выходных данных функции либо на ноль, либо на единицу.
Существуют методы (описанные ниже), с помощью которых мы можем создать дифференциально-частный алгоритм для функций с низкой чувствительностью.
Механизм Лапласа [ править ]
Механизм Лапласа добавляет шум Лапласа (т.е. шум из распределения Лапласа , который может быть выражен функцией плотности вероятности , который имеет нулевое среднее значение и стандартное отклонение ). Теперь в нашем случае мы определяем выходную функцию как действительнозначная функция (называемая выводом транскрипта ) как где и — это исходный запрос/функция с действительным значением, которую мы планировали выполнить в базе данных. Теперь ясно можно рассматривать как непрерывную случайную величину, где
что максимум . Мы можем рассмотреть быть фактором конфиденциальности . Таким образом следует дифференциально-частному механизму (как видно из определения выше ). Если мы попытаемся использовать эту концепцию в нашем примере с диабетом, то из приведенного выше факта вытекает, что для того, чтобы иметь как -дифференциальный частный алгоритм, который нам нужен . Хотя здесь мы использовали шум Лапласа, можно использовать и другие формы шума, такие как гауссов шум, но они могут потребовать небольшого смягчения определения дифференциальной конфиденциальности. [13]
Согласно этому определению, дифференциальная конфиденциальность является условием механизма выпуска (т. е. предоставления доверенной стороной информации о наборе данных), а не самого набора данных. Интуитивно это означает, что для любых двух наборов данных, которые похожи, данный дифференциально-частный алгоритм будет вести себя примерно одинаково в обоих наборах данных. Определение дает надежную гарантию того, что присутствие или отсутствие человека не окажет существенного влияния на конечный результат алгоритма.
Например, предположим, что у нас есть база данных медицинских записей. где каждая запись представляет собой пару ( Name , X ), где — логическое значение, обозначающее, есть ли у человека диабет или нет. Например:
Имя | Имеет диабет (X) |
---|---|
Росс | 1 |
Моника | 1 |
Джоуи | 0 |
Фиби | 0 |
Чендлер | 1 |
Рэйчел | 0 |
Теперь предположим, что злонамеренный пользователь (часто называемый злоумышленником ) хочет выяснить, есть ли у Чендлера диабет или нет. Предположим, он также знает, в какой строке базы данных находится Чендлер. Теперь предположим, что злоумышленнику разрешено использовать только определенную форму запроса. который возвращает частичную сумму первого строки столбца в базе данных. Чтобы определить статус диабета Чендлера, противник выполняет и , затем вычисляет их разницу. В этом примере и , поэтому их разница равна 1. Это означает, что поле «Имеет диабет» в строке Чендлера должно быть равно 1. В этом примере показано, как индивидуальная информация может быть скомпрометирована даже без явного запроса информации о конкретном человеке.
Продолжая этот пример, если мы построим заменив (Чандлер, 1) на (Чандлер, 0), тогда этот злонамеренный противник сможет отличить от путем вычисления для каждого набора данных. Если бы противнику требовалось получить значения через -дифференциально частный алгоритм, для достаточно малого , то он или она не сможет различить два набора данных.
Рандомизированный ответ [ править ]
Простой пример, особенно разработанный в социальных науках , [16] состоит в том, чтобы попросить человека ответить на вопрос «Владеете ли вы атрибутом А ?», согласно следующей процедуре:
- Подбросьте монетку .
- Если выпадет орел, подбросьте монету еще раз (игнорируя результат) и честно ответьте на вопрос.
- Если решка, то подбросьте монету еще раз и ответьте «Да», если орёл, «Нет», если решка.
(Казалось бы, избыточное дополнительное подбрасывание в первом случае необходимо в ситуациях, когда другие могут наблюдать сам акт подбрасывания монеты, даже если фактический результат остается скрытым.) Конфиденциальность тогда возникает из опровержимости индивидуальных ответов.
Но в целом эти данные со многими ответами значимы, поскольку положительные ответы на четверть дают люди, не обладающие признаком А , а три четверти - люди, действительно им обладающие.Таким образом, если p — истинная доля людей с A , то мы ожидаем получить (1/4)(1- p ) + (3/4) p = (1/4) + p /2 положительных ответов. Следовательно, можно оценить p .
В частности, если признак А является синонимом противоправного поведения, то ответ «Да» не является инкриминирующим, поскольку у человека есть вероятность ответа «Да», каким бы он ни был.
Хотя этот пример, основанный на рандомизированном ответе , может быть применим к микроданным (т. е. публикации наборов данных вместе с каждым отдельным ответом), дифференциальная конфиденциальность по определению исключает выпуск микроданных и применима только к запросам (т. е. агрегированию отдельных ответов в один результат), поскольку этот пример нарушит требования, а точнее правдоподобное отрицание того, что субъект участвовал или нет. [17] [18]
Стабильные преобразования [ править ]
Преобразование является -стабильна, если расстояние Хэмминга между и самое большее -умноженное на расстояние Хэмминга между и для любых двух баз данных . Теорема 2 в [12] утверждает, что если существует механизм то есть -дифференциально частный, то составной механизм является - дифференциально-частный.
Это можно обобщить на групповую конфиденциальность, поскольку размер группы можно рассматривать как расстояние Хэмминга. между и (где содержит группу и нет). В этом случае является - дифференциально-частный.
Другие дифференциальной понятия конфиденциальности
Поскольку дифференциальная конфиденциальность считается слишком сильной или слабой для некоторых приложений, было предложено множество ее версий. [19] Наиболее распространенной релаксацией является (ε, δ)-дифференциальная конфиденциальность, [20] что ослабляет определение, допуская дополнительную малую плотность вероятности δ, для которой верхняя граница ε не выполняется.
Альтернативно, можно думать о дифференциальной конфиденциальности как об ограничении частоты ошибок при проверке гипотезы. Рассмотрим две гипотезы:
: данные человека отсутствуют в наборе данных.
: данные человека находятся в наборе данных.
Тогда есть два коэффициента ошибок:
Частота ложноположительных результатов (FPR): = Pr[Противник догадывается ∣ это правда].
Истинно положительный показатель (TPR): =Pr[Противник догадывается ∣ это правда].
Идеальная защита предполагает, что обе частоты ошибок равны, но при фиксированных настройках (ε, δ) злоумышленник может достичь следующих показателей: [21]
реальных Внедрение дифференциальной конфиденциальности в приложениях
На сегодняшний день существует более 12 реальных применений дифференциальной конфиденциальности , наиболее примечательными из которых являются:
- 2008: Бюро переписи населения США — за показ моделей поездок на работу. [22]
- 2014: RAPPOR от Google для телеметрии, например, для получения статистики о нежелательном программном обеспечении, взламывающем настройки пользователей. [23] [24]
- 2015: Google за обмен исторической статистикой трафика. [25]
- 2016: Apple iOS 10 для использования в интеллектуального персонального помощника . технологии [26]
- 2017: Microsoft для телеметрии в Windows. [27]
- 2020: Social Science One и Facebook , набор данных из 55 триллионов ячеек, позволяющий исследователям узнать о выборах и демократии. [28] [29]
- 2021: Бюро переписи населения США использует дифференциальную конфиденциальность для публикации данных о перераспределении избирательных округов переписи населения 2020 года. [30]
цели Соображения общественной
Существует несколько соображений, касающихся общественных целей, касающихся дифференцированной конфиденциальности, которые важно учитывать, особенно для политиков и аудиторий, ориентированных на политику, заинтересованных в социальных возможностях и рисках, связанных с технологией: [31]
- Полезность и точность данных. Основная проблема, связанная с дифференциальной конфиденциальностью, — это компромисс между полезностью данных и личной конфиденциальностью. Если параметр потери конфиденциальности установлен в пользу полезности, преимущества конфиденциальности снижаются (в систему вводится меньше «шума»); если параметр потери конфиденциальности настроен в пользу строгой конфиденциальности, точность и полезность набора данных снижаются (в систему вводится больше «шума»). Для политиков важно учитывать компромиссы, связанные с дифференцированной конфиденциальностью, чтобы помочь установить соответствующие лучшие практики и стандарты использования этой практики сохранения конфиденциальности, особенно с учетом разнообразия вариантов использования в организациях. Однако стоит отметить, что снижение точности и полезности является общей проблемой для всех методов ограничения статистического раскрытия и не является уникальной для дифференциальной конфиденциальности. Однако уникально то, как политики, исследователи и исполнители могут рассмотреть возможность смягчения рисков, возникающих в результате этого компромисса.
- Конфиденциальность и безопасность данных. Дифференциальная конфиденциальность обеспечивает количественную меру потери конфиденциальности и верхнюю границу и позволяет кураторам выбирать явный компромисс между конфиденциальностью и точностью. Он устойчив к еще неизвестным атакам на конфиденциальность. Однако это поощряет более широкий обмен данными, что, если все сделано неправильно, увеличивает риск конфиденциальности. Дифференциальная конфиденциальность подразумевает, что конфиденциальность защищена, но это во многом зависит от выбранного параметра потери конфиденциальности и вместо этого может привести к ложному чувству безопасности. Наконец, хотя он устойчив к непредвиденным будущим атакам на конфиденциальность, можно разработать контрмеры, которые мы не можем предсказать.
См. также [ править ]
- Реализация дифференцированного частного анализа – внедрение дифференцированной конфиденциальности
- Квази-идентификация
- Экспоненциальный механизм (дифференциальная конфиденциальность) - метод разработки дифференциально частных алгоритмов.
- k-анонимность
- Дифференциально частный анализ графиков
- Защищенная медицинская информация
- Локальная дифференциальная конфиденциальность
- Конфиденциальность
Публикации [ править ]
- Калибровка шума на чувствительность при анализе частных данных , Синтия Дворк , Фрэнк МакШерри , Кобби Ниссим и Адам Смит. 2006. В материалах Третьей конференции по теории криптографии (TCC'06). Springer-Verlag, Берлин, Гейдельберг, 265–284. https://doi.org/10.1007/11681878_14 (Это оригинальная публикация «Дифференциальной конфиденциальности», а не одноименная статья Дворка, опубликованная в том же году.)
- Дифференциальная конфиденциальность: обзор результатов, проведенный Синтией Дворк, Microsoft Research, апрель 2008 г. (Представляется то, что было обнаружено в течение первых двух лет исследований дифференциальной конфиденциальности.)
- Дифференциальная конфиденциальность: учебник для нетехнической аудитории , Александра Вуд, Мика Альтман , Аарон Бембенек, Марк Бан, Марко Габорди и др., Журнал Vanderbilt Journal of Entertainment & Technology Law. Журнал Vanderbilt Journal of Entertainment, Том 21, Выпуск 1, осень 2018 г. (Хороший вводный документ, но определенно *не* для нетехнической аудитории!)
- Информационный бюллетень о технологиях: Дифференцированная конфиденциальность , Райна Ганди и Амрита Джаянти, Белферовский центр науки и международных отношений, осень 2020 г.
- Дифференциальная конфиденциальность и перепись населения США 2020 года , Тематические исследования Массачусетского технологического института по социальной и этической ответственности за использование компьютеров, вып. Зима 2022 (январь). https://doi.org/10.21428/2c646de5.7ec6ab93 .
Учебники [ править ]
- Практическое руководство для начинающих по дифференциальной конфиденциальности , Кристин Таск, Университет Пердью, апрель 2012 г.
Ссылки [ править ]
- ↑ Перейти обратно: Перейти обратно: а б Хилтон, М; Кэл (2012). «Дифференциальная конфиденциальность: исторический обзор» . Семантический учёный . S2CID 16861132 . Проверено 31 декабря 2023 г.
- ^ Дворк, Синтия (25 апреля 2008 г.). «Дифференциальная конфиденциальность: обзор результатов» . В Агравале — Маниндра; Ду, Динчжу; Дуань, Чжэньхуа; Ли, Ангшэн (ред.). Теория и приложения моделей вычислений . Конспекты лекций по информатике. Том. 4978. Шпрингер Берлин Гейдельберг. стр. 1–19. дои : 10.1007/978-3-540-79228-4_1 . ISBN 978-3-540-79227-7 . S2CID 2887752 .
- ↑ Перейти обратно: Перейти обратно: а б с Калибровка шума по чувствительности в анализе частных данных Синтия Дворк, Фрэнк МакШерри, Кобби Ниссим, Адам Смит. На конференции по теории криптографии (TCC), Springer, 2006. дои : 10.1007/11681878_14 . Полная версия опубликована в Journal of Privacy and Confidentiality, 7 (3), 17-51. два : 10.29012/jpc.v7i3.405
- ^ «Записи переписи 1790 года» .
- ^ Торе Далениус (1977). «К методологии контроля раскрытия статистической информации» . Статистика Тидскрифт . 15 .
- ^ Дворк, Синтия (2006). Бульези, Микеле; Пренил, Барт; Сассоне, Владимиро; Вегенер, Инго (ред.). «Дифференциальная конфиденциальность» . Автоматы, языки и программирование . Конспекты лекций по информатике. Берлин, Гейдельберг: Springer: 1–12. дои : 10.1007/11787006_1 . ISBN 978-3-540-35908-1 .
- ^ Дороти Э. Деннинг; Питер Дж. Деннинг; Майер Д. Шварц (март 1979 г.). «Трекер: угроза безопасности статистических баз данных» . Транзакции ACM в системах баз данных . 4 (1): 76–96. дои : 10.1145/320064.320069 . S2CID 207655625 .
- ^ Ирит Динур и Кобби Ниссим. 2003. Раскрытие информации при сохранении конфиденциальности. В материалах двадцать второго симпозиума ACM SIGMOD-SIGACT-SIGART по принципам систем баз данных (PODS '03). ACM, Нью-Йорк, Нью-Йорк, США, 202–210. дои : 10.1145/773153.773173
- ^ «Награда TCC за испытание временем» .
- ^ «Премия Гёделя 2017» .
- ^ Алгоритмические основы дифференциальной конфиденциальности Синтии Дворк и Аарона Рота. Основы и тенденции теоретической информатики. Том. 9, нет. 3–4, стр. 211–407, август 2014 г. дои : 10.1561/0400000042
- ↑ Перейти обратно: Перейти обратно: а б с Запросы, интегрированные в конфиденциальность: расширяемая платформа для анализа данных с сохранением конфиденциальности, Фрэнк Д. МакШерри. В материалах 35-й Международной конференции SIGMOD по управлению данными (SIGMOD), 2009 г. дои : 10.1145/1559845.1559850
- ↑ Перейти обратно: Перейти обратно: а б Дифференциальная конфиденциальность , Синтия Дворк, Международный коллоквиум по автоматам, языкам и программированию (ICALP), 2006 г., стр. 1–12. дои : 10.1007/11787006_1
- ^ Ф.Макшерри и К.Талвар. Mechasim Design через дифференциальную конфиденциальность. Материалы 48-го ежегодного симпозиума по основам информатики, 2007 г.
- ^ Христос Димитракакис, Блейн Нельсон, Айкатерини Митрокотса, Бенджамин Рубинштейн. Надежный и частный байесовский вывод. Алгоритмическая теория обучения 2014
- ^ Уорнер, SL (март 1965 г.). «Рандомизированный ответ: метод опроса для устранения уклончивых ответов». Журнал Американской статистической ассоциации . 60 (309). Тейлор и Фрэнсис : 63–69. дои : 10.1080/01621459.1965.10480775 . JSTOR 2283137 . ПМИД 12261830 . S2CID 35435339 .
- ^ Дворк, Синтия. «Прочная основа для анализа частных данных». Сообщения ACM 54.1 (2011): 86–95, примечание 19 выше, стр. 91.
- ^ Бамбауэр, Джейн, Кришнамурти Муралидхар и Ратиндра Сарати. «Золото дураков: иллюстрированная критика дифференциальной конфиденциальности». Ванд. Дж. Энт. & Техн. Л. 16 (2013): 701.
- ^ SoK: Дифференциальная конфиденциальность Дэмьена Дефонтена, Балаша Пейо. 2019 год
- ^ Дворк, Синтия, Кришнам Кентапади, Фрэнк МакШерри, Илья Миронов и Мони Наор. «Наши данные, мы сами: конфиденциальность посредством распределенной генерации шума». В достижениях в криптологии – EUROCRYPT 2006, стр. 486–503. Шпрингер Берлин Гейдельберг, 2006.
- ^ Кайруз, Питер, Севунг О и Прамод Вишванат. «Теорема о композиции дифференциальной конфиденциальности». Международная конференция по машинному обучению. ПМЛР, 2015. ссылка
- ^ Эльфар Эрлингссон, Василий Пихур, Александра Королева. «RAPPOR: рандомизированный совокупный порядковый ответ с сохранением конфиденциальности». В материалах 21-й конференции ACM по компьютерной и коммуникационной безопасности (CCS), 2014 г. дои : 10.1145/2660267.2660348
- ^ google/report , GitHub, 15 июля 2021 г.
- ^ Решение проблемы городской мобильности с помощью технологий , Эндрю Эланд. Блог Google Policy Europe, 18 ноября 2015 г.
- ^ «Apple – Информация для прессы – Apple анонсирует iOS 10, самый крупный релиз iOS за всю историю» . Яблоко . Проверено 20 июня 2023 г.
- ^ Частный сбор данных телеметрии Болин Дин, Яна Кулкарни, Сергей Еханин. НИПС 2017.
- ^ Мессинг, Соломон; ДеГрегорио, Кристина; Хилленбранд, Беннетт; Кинг, Гэри; Маханти, Саурав; Мукерджи, Загреб; Наяк, Чая; Персили, Нейт; State, Bogdan (2020), Набор данных полных URL-адресов Facebook с защитой конфиденциальности , Загреб Мукерджи, Harvard Dataverse, doi : 10.7910/dvn/tdoapg , получено 8 февраля 2023 г.
- ^ Эванс, Джорджина; Кинг, Гэри (январь 2023 г.). «Статистически достоверные выводы из выпусков дифференциально частных данных с применением к набору данных URL-адресов Facebook» . Политический анализ . 31 (1): 1–21. дои : 10.1017/pan.2022.1 . ISSN 1047-1987 . S2CID 211137209 .
- ^ «Недопущение раскрытия информации в ходе переписи населения 2020 года: введение» . 2 ноября 2021 г.
- ^ «Информационный бюллетень по технологиям: дифференциальная конфиденциальность» . Белферовский центр науки и международных отношений . Проверено 12 апреля 2021 г.
Дальнейшее чтение [ править ]
- Список литературы по дифференциальной конфиденциальности
- О, Джон. 2017. «Как будут работать статистические агентства, когда все данные являются конфиденциальными?». Журнал конфиденциальности и конфиденциальности 7 (3). doi : 10.29012/jpc.v7i3.404 ( слайды )
- «Дифференциальная конфиденциальность: учебник для нетехнической аудитории» , Кобби Ниссим, Томас Стейнке, Александра Вуд, Мика Альтман , Аарон Бембенек, Марк Бан, Марко Габорди, Дэвид Р. О'Брайен и Салил Вадхан, Гарвардский проект инструментов обеспечения конфиденциальности , 14 февраля 2018 г.
- Динур, Ирит и Кобби Ниссим. 2003. Раскрытие информации при сохранении конфиденциальности. В материалах двадцать второго симпозиума ACM SIGMOD-SIGACT-SIGART по принципам систем баз данных (PODS '03). ACM, Нью-Йорк, Нью-Йорк, США, 202–210. дои : 10.1145/773153.773173 .
- Дворк, Синтия, Фрэнк МакШерри, Кобби Ниссим и Адам Смит. 2006. в Халеви, С. и Рабин, Т. (ред.) Калибровка шума на чувствительность в анализе частных данных. Теория криптографии: Третья конференция по теории криптографии, TCC 2006, Нью-Йорк, Нью-Йорк, США, 4–7 марта 2006 г. Слушания, Springer Berlin Heidelberg, 265–284, дои : 10.1007/11681878 14 .
- Дворк, Синтия. 2006. Дифференциальная конфиденциальность, 33-й Международный коллоквиум по автоматам, языкам и программированию, часть II (ICALP 2006), Springer Verlag, 4052, 1–12, ISBN 3-540-35907-9 .
- Дворк, Синтия и Аарон Рот. 2014. Алгоритмические основы дифференциальной конфиденциальности. Основы и тенденции теоретической информатики. Том. 9, № 3–4. 211–407, дои : 10.1561/0400000042 .
- Мачанаваджхала, Ашвин, Дэниел Кифер, Джон М. Абоуд, Йоханнес Герке и Ларс Вилхубер. 2008. Конфиденциальность: теория встречается с практикой на карте, Международная конференция по инженерии данных (ICDE), 2008: 277–286, дои : 10.1109/ICDE.2008.4497436 .
- Дворк, Синтия и Мони Наор. 2010. О трудностях предотвращения раскрытия информации в статистических базах данных или аргументах в пользу дифференцированной конфиденциальности, Журнал конфиденциальности и конфиденциальности: Том. 2: Вып. 1, статья 8. Доступно по адресу: http://repository.cmu.edu/jpc/vol2/iss1/8 .
- Кифер, Дэниел и Ашвин Мачанаваджхала. 2011. В сфере конфиденциальности данных бесплатного обеда не будет. В материалах Международной конференции ACM SIGMOD 2011 г. по управлению данными (SIGMOD '11). ACM, Нью-Йорк, штат Нью-Йорк, США, 193–204. дои : 10.1145/1989323.1989345 .
- Эрлингссон, Ульфар, Василий Пихур и Александра Королева. 2014. RAPPOR: Рандомизированный агрегированный порядковый ответ с сохранением конфиденциальности. В материалах конференции ACM SIGSAC 2014 г. по компьютерной и коммуникационной безопасности (CCS '14). ACM, Нью-Йорк, Нью-Йорк, США, 1054–1067. дои : 10.1145/2660267.2660348 .
- Абоуд, Джон М. и Ян М. Шмутте. 2017 . Пересмотр экономики конфиденциальности: статистика населения и защита конфиденциальности как общественные блага. Институт динамики труда Корнельского университета, Институт динамики труда Корнельского университета, https://digitalcommons.ilr.cornell.edu/ldi/37/
- Абоуд, Джон М. и Ян М. Шмутте. Ожидается. Экономический анализ защиты конфиденциальности и статистической точности как социального выбора. Американский экономический обзор, arXiv : 1808.06303.
- Apple, Inc., 2016 г. Apple представляет iOS 10, самый масштабный выпуск iOS за всю историю. Пресс-релиз (13 июня). https://www.apple.com/newsroom/2016/06/apple-previews-ios-10-biggest-ios-release-ever.html .
- Динг, Болин, Джанардхан Кулкарни и Сергей Еханин, 2017 г. Частный сбор телеметрических данных, NIPS, 2017 г.
- http://www.win-vector.com/blog/2015/10/a-simpler-explanation-of-differential-privacy/
- Райффель, Тео, Эндрю Траск и др. «Общая структура глубокого обучения, сохраняющая конфиденциальность»