Шифрование ДНК
Шифрование ДНК — это процесс сокрытия или искажения генетической информации с помощью вычислительного метода с целью улучшения генетической конфиденциальности в процессах секвенирования ДНК . Геном человека сложен и длинный, но вполне возможно интерпретировать важную и идентифицирующую информацию из более мелких вариаций, вместо того, чтобы читать весь геном. Весь человеческий геном представляет собой цепочку из 3,2 миллиардов пар нуклеотидов , строительных блоков жизни, но между людьми генетические вариации различаются только на 0,5%, важных 0,5%, на которые приходится все человеческое разнообразие, патология различных заболеваний, и родовая история. [ 1 ] Новые стратегии включают в себя различные методы, такие как алгоритмы рандомизации и криптографические подходы, чтобы деидентифицировать генетическую последовательность человека и, по сути, изолировать только необходимую информацию, одновременно защищая остальную часть генома от ненужных исследований. Приоритетом сейчас является определение того, какие методы являются надежными и как политика должна обеспечивать постоянную защиту генетической конфиденциальности.
История
[ редактировать ]В 2003 году Национальный институт исследования генома человека и его дочерние партнеры успешно секвенировали первый полный геном человека — проект , на завершение которого потребовалось чуть менее 3 миллиардов долларов. [ 2 ] Четыре года спустя Джеймс Уотсон – один из соавторов структуры ДНК – смог секвенировать свой геном менее чем за 1,5 миллиона долларов. [ 3 ] Поскольку технологии генетического секвенирования получили широкое распространение, рационализировались и стали адаптированными к клиническим методам, теперь они могут обеспечить невероятную информацию об индивидуальной генетической идентичности при гораздо меньших затратах, а конкуренты в области биотехнологий соперничают за звание генома стоимостью 1000 долларов . [ 4 ] Генетический материал теперь можно извлечь из слюны, волос, кожи, крови или других источников человека, секвенировать, оцифровать, сохранить и использовать для множества целей. Всякий раз, когда данные оцифровываются и сохраняются, существует вероятность нарушения конфиденциальности. [ 5 ] Хотя современная технология полногеномного секвенирования обеспечила беспрецедентный доступ и понимание человеческого генома , а также вызвала интерес к возможностям персонализированной медицины , она также вызвала серьезные разговоры об этических рисках и рисках конфиденциальности, которые сопровождают этот процесс раскрытия основных инструкций человека по будучи: их последовательность ДНК.
Исследовать
[ редактировать ]Генетическое секвенирование является ключевым компонентом получения научных знаний о происхождении заболеваний, их профилактике и разработке значимых терапевтических вмешательств. В большинстве исследований используются образцы ДНК больших групп или совокупные наборы полногеномных данных для сравнения и идентификации генов, связанных с конкретными заболеваниями или фенотипами; поэтому существует много противников ограничения доступа к базам данных геномов и большая поддержка укреплению таких широкомасштабных исследований. Например, если бы пункт об информированном согласии был введен в действие для всех генетических исследований, существующие генетические базы данных не могли бы быть повторно использованы для новых исследований - все наборы данных должны были бы быть либо уничтожены в конце каждого исследования, либо всем участникам пришлось бы повторно использовать их. авторизовать разрешения для каждого нового исследования. [ 1 ] Поскольку наборы генетических данных можно экстраполировать на близкородственных членов семьи, это добавляет еще одно измерение необходимого согласия в исследовательский процесс. Это фундаментально поднимает вопрос о том, являются ли эти ограничения необходимой защитой конфиденциальности или препятствием для научного прогресса.
Клиническое использование
[ редактировать ]В медицине генетическое секвенирование важно не только для традиционных целей, таких как тест на отцовство, но и для облегчения диагностики и лечения. Персонализированная медицина была провозглашена будущим здравоохранения, поскольку полногеномное секвенирование предоставило возможность персонализировать лечение с учетом индивидуального проявления и опыта заболевания. Поскольку фармакология и разработка лекарств основаны на популяционных исследованиях, текущие методы лечения нормализованы по статистике всего населения, что может снизить эффективность лечения для отдельных лиц, поскольку реакция каждого человека на болезнь и лекарственную терапию однозначно связана с его генетической предрасположенностью. Генетическое секвенирование уже ускорило прогностическое консультирование при моногенных заболеваниях , которые требуют быстрой дифференциальной диагностики при уходе за новорожденными . [ 6 ] Однако часто размытое различие между использованием в медицинских целях и использованием в исследованиях может усложнить обеспечение конфиденциальности между этими двумя сферами, поскольку они часто требуют разных уровней согласия и используют разные политики.
Коммерческое использование
[ редактировать ]Даже на потребительском рынке люди стекаются на Ancestry.com и 23andMe, чтобы узнать о своем наследии и выяснить свои генотипы. Поскольку характер потребительских транзакций позволяет этим электронным моделям кликов обходить традиционные формы согласия в исследованиях и здравоохранении, потребители могут не до конца осознавать последствия оцифровки и хранения их генетической последовательности. Более того, корпоративная политика конфиденциальности часто действует за пределами федеральной юрисдикции, подвергая потребителей информационным рискам, как с точки зрения их генетической конфиденциальности, так и с точки зрения самораскрытого потребительского профиля, включая самораскрытие семейной истории, состояния здоровья, расы, этнической принадлежности, социального статуса. сети и многое другое. [ 7 ] Само наличие баз данных сопряжено с потенциальными рисками для конфиденциальности, поскольку хранение данных по своей сути влечет за собой возможность утечки данных и запроса наборов данных со стороны правительства. 23andMe уже получила четыре запроса от Федерального бюро расследований (ФБР) на доступ к наборам потребительских данных, и хотя эти запросы были отклонены, это раскрывает ту же загадку, что и спор ФБР и Apple о шифровании . [ 7 ]
Судебно-медицинское использование
[ редактировать ]ДНК-информация может быть использована для раскрытия уголовных дел путем установления совпадения между известным подозреваемым в конкретном преступлении и неизвестным подозреваемым в нераскрытом преступлении. Однако информация о ДНК сама по себе может привести к ожидаемым ошибкам определенной вероятности и не должна использоваться сама по себе как полностью надежное доказательство. [ 8 ]
Политика
[ редактировать ]Поскольку геномная последовательность человека может раскрыть медицинскую информацию о нем самом и членах его семьи, сторонники конфиденциальности полагают, что должны быть предусмотрены определенные меры защиты, чтобы в конечном итоге защитить конфиденциальность и личность пользователя от возможной дискриминации со стороны страховых компаний или работодателей, основной высказано беспокойство. Были случаи, когда имела место генетическая дискриминация, часто показывая, как наука может быть неверно истолкована неспециалистами. В 1970 году афроамериканцам было отказано в страховании или взимались более высокие страховые взносы, потому что они были известными носителями серповидноклеточной анемии, но как носители сами не имеют никаких медицинских проблем, и это преимущество носителя фактически обеспечивает устойчивость к малярии. [ 9 ] Легитимность этой политики подвергается сомнению со стороны ученых, которые осуждают позицию генетического детерминизма , утверждающую, что генотип полностью определяет фенотип . Факторы окружающей среды, дифференциальные модели развития и область эпигенетики утверждают, что экспрессия генов гораздо более сложна, и гены не являются ни диагнозом, ни надежным диагнозом медицинского будущего человека. [ 10 ]
Зарождающиеся законы появились в ответ на генетическую исключительность , повышенное внимание, ожидаемое от геномных исследований, например, Закон о недискриминации генетической информации (GINA) 2008 года в Соединенных Штатах; однако во многих случаях объем и подотчетность формального законодательства довольно неопределенны, поскольку наука, похоже, развивается гораздо более быстрыми темпами, чем закон, и специализированным комитетам по этике пришлось заполнить эту необходимую нишу. [ 1 ] Большая часть критики направлена на то, что в политике принципиально отсутствует понимание технических проблем, связанных с секвенированием генома, и не учитывается, что в случае утечки данных личный геном человека не может быть заменен, что еще больше усложняет защиту конфиденциальности. [ 1 ] Поскольку компьютерная геномика является такой технической областью, перевод языка экспертов на политику затруднен (не говоря уже о переводе на язык непрофессионала), что представляет собой определенный барьер для общественного восприятия возможностей современных технологий геномного секвенирования, что, в конечном итоге, делает дискуссию о защитить генетическую конфиденциальность, не препятствуя научному прогрессу, что еще сложнее.
Во всем мире каждая страна имеет уникальные системы здравоохранения и исследований, которые порождают различные политические потребности – политика конфиденциальности в области генетики еще больше усложняется, если принять во внимание международное сотрудничество в области генетических исследований или международные биобанки, базы данных, в которых хранятся биологические образцы и информация о ДНК. Более того, исследования и здравоохранение — не единственные области, требующие формальной юрисдикции; Другие области, вызывающие обеспокоенность, включают генетическую конфиденциальность тех, кто работает в системе уголовного правосудия, и тех, кто занимается частным секвенированием генома на основе потребителей.
Судебная медицина
[ редактировать ]Англия и Уэльс
[ редактировать ]91% крупнейшей в мире базы данных судебно-медицинской экспертизы ДНК , Национальной базы данных ДНК криминальной разведки (NDNAD), содержит информацию о ДНК жителей Англии и Уэльса . [ 8 ] NDNAD хранит генетическую информацию о лицах, осужденных за уголовные преступления, о тех, кому было предъявлено обвинение, но оправдано в регистрируемом преступлении, о тех, кто был арестован, но никогда не обвинялся в регистрируемом преступлении, а также о тех, кто находится под контртеррористическим контролем. Из 5,5 миллионов человек в базе данных, что составляет 10% от общей численности населения, 1,2 миллиона никогда не были осуждены за преступления. [ 8 ] Европейский суд по правам человека постановил в деле С. и Марпер против Соединенного Королевства (2008 г.), что правительство должно представить достаточное обоснование для различного обращения с профилями ДНК тех, кто находится в системе уголовного правосудия, по сравнению с профилями ДНК неосужденных лиц. ; по существу, не должно быть никаких злоупотреблений сохраненными биологическими материалами и информацией ДНК. [ 8 ] Решение выявило несколько существующих проблем в нынешней системе, которая создает риски для конфиденциальности участвующих лиц: хранение личной информации вместе с генетической информацией, хранение профилей ДНК с присущей им способностью определять генетические связи и, по сути, сам процесс хранения Образцы клеток и профили ДНК создают возможности для рисков конфиденциальности. В результате был принят Закон о защите свобод 2012 года, призванный обеспечить правильное использование собранных материалов ДНК и регулировать их хранение и уничтожение. [ 8 ] Тем не менее, многие проблемы все еще сохраняются, поскольку образцы по-прежнему могут храниться в базах данных неопределенно долго, независимо от того, был ли пострадавший осужден или нет – и даже образцы несовершеннолетних правонарушителей. Критики утверждают, что такое долгосрочное удержание может привести к стигматизации пострадавших лиц и препятствовать их реинтеграции в общество, а также стать объектом злоупотреблений в результате дискриминационного поведения, присущего системе уголовного правосудия. [ 8 ]
Германия
[ редактировать ]В 1990 году Федеральный верховный суд Германии и Федеральный конституционный суд Германии постановили, что разделы Уголовно-процессуального кодекса Германии обеспечивают обоснованную правовую основу для использования генетической дактилоскопии для выявления преступников и освобождения невиновных. [ 8 ] Однако в решениях не хватало конкретных подробностей о том, как можно получить биологические материалы и как можно использовать генетический дактилоскопический анализ; были четко изложены только правила проведения анализов крови и медицинских осмотров. В 1998 году парламент Германии санкционировал создание национальной базы данных ДНК из-за растущего давления с целью предотвращения случаев сексуального насилия и убийств с участием детей. [ 8 ] Это решение было признано конституционным и поддержано убедительным общественным интересом Федеральным конституционным судом в 2001 году, несмотря на некоторую критику в отношении нарушения права на информационное самоопределение. Суд постановил, что информация и образцы ДНК должны быть подтверждены доказательствами того, что человек может совершить подобное преступление в будущем. Чтобы устранить правовую неопределенность, Закон о судебно-медицинском анализе ДНК 2005 года ввел положения, которые включали точные и ограниченные юридические основания для использования информации, основанной на ДНК, в уголовном судопроизводстве. [ 8 ] Некоторые разделы предписывают, чтобы образцы ДНК могли использоваться только в том случае, если они необходимы для ускорения расследования и устранения подозреваемых, а суд должен распорядиться о генетической дактилоскопии. С момента его внедрения в базу данных ежемесячно добавлялось 8000 новых наборов данных, что ставит под сомнение необходимость такого широкомасштабного сбора данных и то, обеспечивают ли формулировки положений эффективную защиту конфиденциальности. [ 8 ] Недавнее спорное решение правительства Германии расширило диапазон семейного поиска с помощью ДНК-сети для выявления генетических родственников лиц, совершивших сексуальные и жестокие преступления. Это действие ранее было признано Федеральным верховным судом Германии в 2012 году не имеющим юридической основы. [ 8 ]
Южная Корея
[ редактировать ]Национальная судебно-медицинская служба Южной Кореи и прокуратура Южной Кореи создали отдельные отделы анализа ДНК в 1991 году, несмотря на первоначальную публичную критику того, что сбор данных проводился без учета конфиденциальности информации участвующих субъектов, и эта критика переросла в поддержку со стороны общественности. ряд громких дел. [ 8 ] В 2006 году предложенный Генеральной Ассамблеей законопроект о сборе и использовании информации ДНК определил категории преступлений, связанные с хранением, контролем и уничтожением образцов ДНК и информации ДНК. Однако законопроект не был принят, поскольку не мог привести к каким-либо значительным изменениям в реальной практике. Включенные неполные категории преступлений применимы только для получения биологической информации без согласия человека, а протокол уничтожения собранных образцов был неясным, что подвергало их неправомерному использованию. [ 8 ]
Закон о ДНК-информации 2009 года попытался устранить эти недостатки, включая положения, согласно которым биологически чувствительная информация может быть получена только от осужденных, задержанных подозреваемых и с мест преступлений. Генетическое снятие отпечатков пальцев было разрешено при совершении конкретных преступлений, включая поджоги, убийства, похищения, изнасилования или сексуальные домогательства, вторжение в жилище в ночное время с целью кражи, кражи и кражи со взломом, а также множество других насильственных преступлений. [ 8 ] Закон также требовал наличия письменного ордера на получение образцов у осужденных преступников или подозреваемых, если заинтересованные лица не дали письменного согласия. Все образцы должны быть своевременно уничтожены, если соответствующее лицо признано невиновным, оправдано, уголовное преследование прекращено, а также в случае его смерти. [ 8 ] Важно отметить, что если собранные образцы используются для установления личности лиц на месте преступления, информация ДНК должна быть уничтожена после успешной идентификации. Тем не менее, в этом законодательстве все еще есть несколько недостатков и критических замечаний, касающихся разъяснения презумпции невиновности, довольно тривиального обеспечения уничтожения образцов (только 2,03% образцов удаляются ежегодно) и необходимости письменного ордера (99,6% образцов). добываются без ордера), и до сих пор ведется много споров о том, нарушает ли это законодательство право на информационное самоопределение. [ 8 ]
Биобанки
[ редактировать ]Соединенные Штаты
[ редактировать ]В Соединенных Штатах биобанки в первую очередь находятся под юрисдикцией Правил конфиденциальности Закона о переносимости и подотчетности медицинского страхования (HIPAA) и Федеральной политики защиты людей (общее правило). Поскольку ни одно из этих правил не было задумано с целью регулирования биобанков и децентрализованных уровней регулирования, было много проблем в их применении и обеспечении соблюдения, а федеральный закон не может напрямую решать международную политику и способы обмена данными за пределами ЕС. -Соглашение о безопасной гавани США. [ 11 ] Область, которая требует разъяснения, заключается в том, как федеральные законы и законы штата дифференцированно и конкретно применяются к различным биобанкам, исследователям или проектам. Ситуация еще больше усложняется тем фактом, что большинство биобанков являются частью более крупных организаций или работают в сотрудничестве с другими учреждениями, что сбивает с толку совмещать общественные и частные интересы. Около 80% всех биобанков имеют внутренние наблюдательные советы, которые регулируют сбор, использование и распространение данных. Существуют три основные модели доступа, применяемые к доступности образцов и данных биобанков: открытый доступ (неограниченный для всех), многоуровневый доступ (некоторые ограничения доступа зависят от характера проекта) или контролируемый доступ (жестко контролируемый доступ). [ 11 ]
Положения GINA запрещают медицинским страховым компаниям требовать генетического тестирования или запрашивать генетическую информацию для целей регистрации, а также запрещают работодателям запрашивать генетическое тестирование или генетическую информацию для любого типа оценки занятости (прием на работу, продвижение по службе, увольнение). Однако страховщики могут запросить генетическую информацию, чтобы определить покрытие конкретной процедуры. Некоторые группы также исключены из соблюдения положений GINA, включая страховщиков и работодателей федеральных государственных служащих, военных и работодателей со штатом менее 15 сотрудников. [ 12 ]
Китай
[ редактировать ]В Китае имеется обширная сеть больниц и научно-исследовательских институтов. В настоящее время разрабатывается план по созданию более целостной структуры для обмена данными между существующими биобанками, которые ранее находились под юрисдикцией дублирующих и запутанных нормативных законов. Многие биобанки работают независимо или в рамках сети других сетей, наиболее известной из которых является сеть Шанхайских биобанков. [ 13 ] В рамках этой основной сети в руководящих принципах подробно описывается конкретная политика деидентификации и явно поддерживается широкое согласие. Недавно Конституция Китая официально признала частную жизнь личности как отдельное и независимое конституционное право, и поэтому законодатели начали разработку проекта Постановления о генетических ресурсах человека, чтобы организовать национальные законы о мерах управления биобанками, юридической ответственности и наказании за нарушения. Международный обмен данными будет еще более строго регулироваться этими федеральными законами. [ 13 ]
Австралия
[ редактировать ]Биобанки в Австралии в основном регулируются руководящими принципами конфиденциальности в сфере здравоохранения и комитетами по этике исследований на людях – формального законодательства о биобанках не существует, но международный обмен данными широко разрешен. Национальный совет здравоохранения и медицинских исследований (NHMRC) разрабатывает рекомендации для многих из этих учреждений и финансирует их. Ведется дискуссия о широком согласии на биобанкинг. [ 14 ]
Потребительское генетическое тестирование
[ редактировать ]Electronic Frontier Foundation , защитник конфиденциальности, обнаружил, что существующее законодательство не имеет формальной юрисдикции в обеспечении конфиденциальности потребителей в том, что касается информации ДНК. Генетическая информация, хранящаяся потребительскими предприятиями, не защищена HIPAA; следовательно, эти компании могут передавать генетическую информацию третьим лицам при условии, что они зависят от их собственных заявлений о конфиденциальности. [ 7 ] Большинство компаний, занимающихся генетическим тестированием, делятся анонимными агрегированными данными только с согласия пользователей. Ancestry.com и 23andMe продают такие данные исследовательским учреждениям и другим организациям и могут запрашивать в каждом конкретном случае согласие на раскрытие неанонимных данных другим сторонам, включая работодателей или страховщиков. 23andMe даже предупреждает, что повторная идентификация может произойти и возможна. Если потребитель явно отказывается от исследовательского использования или просит уничтожить его данные, 23andMe по-прежнему имеет право использовать его идентификационную и поведенческую информацию о потребителе, такую как модели просмотра и географическое местоположение, для других маркетинговых услуг. [ 7 ]
Области беспокойства
[ редактировать ]Многие эксперты в области вычислений разработали и разрабатывают более безопасные системы геномного секвенирования, чтобы защитить будущее этой области от ошибочной юрисдикции, неправомерного применения генетических данных и, прежде всего, генетической конфиденциальности людей. В настоящее время существуют четыре основные области генетических исследований, в которых разрабатываются технологии сохранения конфиденциальности:
Поиск и сравнение строк
[ редактировать ]Тесты на отцовство, тесты на генетическую совместимость и тестирование на происхождение — это все виды медицинских инструментов, которые основаны на алгоритмах поиска и сравнения строк . [ 1 ] Проще говоря, это подход «иголка в стоге сена», при котором в наборе данных ищется соответствующая «строка», интересующая последовательность или образец. Поскольку эти типы тестирования стали более распространенными и адаптированы к потребительским геномным моделям, таким как приложения для смартфонов или модные тесты ДНК, современные методы обеспечения конфиденциальности ориентированы на усиление этого процесса и защиту как здравоохранения, так и частного использования.
Публикация совокупных данных
[ редактировать ]Современный век больших данных и крупномасштабного геномного тестирования требует систем обработки, которые минимизируют риски конфиденциальности при выпуске совокупных геномных данных, что по сути означает гарантию того, что отдельные данные не могут быть распознаны в геномной базе данных. [ 1 ] Этот дифференциальный подход к конфиденциальности представляет собой простую оценку безопасности геномной базы данных, и многие исследователи проводят «проверку» строгости существующей инфраструктуры.
Согласование необработанных геномных данных
[ редактировать ]Одним из наиболее важных достижений в области геномики является возможность картирования чтения, при которой миллионы коротких последовательностей могут быть сопоставлены с эталонной последовательностью ДНК для эффективной обработки больших наборов данных. Поскольку этот высокопроизводительный процесс часто делится между общедоступной и частной вычислительной средой, существует множество связанных с этим рисков и этапов, на которых генетическая конфиденциальность особенно уязвима; поэтому текущие исследования сосредоточены на том, как обеспечить безопасные операции в двух разных областях данных, не жертвуя при этом эффективностью и точностью. [ 1 ]
Клиническое использование
[ редактировать ]С появлением высокопроизводительных геномных технологий, обеспечивающих беспрецедентный доступ к генетической информации, персонализированная медицина набирает обороты как обещанное будущее здравоохранения, делая модели безопасного геномного тестирования обязательным условием прогресса медицины. В частности, вызывает обеспокоенность то, что этот процесс будет включать в себя многостороннее участие и доступ к данным. [ 1 ] Различие между генетическим секвенированием в медицинских и исследовательских целях является спорным, и, кроме того, каждый раз, когда в дискуссию вовлечено здравоохранение, необходимо учитывать аспект конфиденциальности пациентов, поскольку он может противоречить или дополнять генетическую конфиденциальность.
Методы шифрования
[ редактировать ]Безопасное сопоставление чтения
[ редактировать ]Чувствительное картирование чтения имеет важное значение для исследований в области геномики, поскольку картирование чтения важно не только для секвенирования ДНК, но и для идентификации целевых регуляторных молекул в RNA-Seq . Решение предлагает разделить отображение чтения на две задачи в гибридной вычислительной операции: точное сопоставление операций чтения с использованием хеш-значений с ключами может выполняться в общедоступном облаке , а выравнивание операций чтения может проводиться в частном облаке . Поскольку публичному контролю подвергаются только ключевые значения хеш-функции, конфиденциальность исходной последовательности сохраняется. [ 15 ] Однако, поскольку процессы согласования, как правило, являются объемными и трудоемкими, большинство схем секвенирования по-прежнему функционально требуют сторонних вычислительных операций, что вновь создает риски для конфиденциальности в общедоступном облаке.
Безопасный поиск строк
[ редактировать ]Многочисленные генетические скрининговые тесты основаны на поиске строк и стали обычным явлением в здравоохранении; поэтому конфиденциальность таких методологий была важной областью развития. Один протокол скрывает положение и размер частичных подстрок, позволяя одной стороне (исследователю или врачу) с оцифрованным геномом, а второй стороне (участнику исследования или пациенту) с исключительным правом собственности на его или ее маркер ДНК проводить безопасные генетические тесты. Только исследователь или врач знает вывод схемы поиска и сравнения строк, и ни одна из сторон не имеет доступа к другой информации, что обеспечивает сохранение конфиденциальности. [ 16 ]
Безопасный запрос генома
[ редактировать ]Основой персонализированной медицины и профилактического здравоохранения является установление генетической совместимости путем сравнения генома человека с известными вариациями для оценки восприимчивости к таким заболеваниям, как рак молочной железы или диабет, для оценки фармакогеномики и изучения биологических взаимоотношений между людьми. [ 5 ] Для тестов на риск заболеваний исследования предложили метод сохранения конфиденциальности, который использует гомоморфное шифрование и безопасное сравнение целых чисел и предлагает хранить и обрабатывать конфиденциальные данные в зашифрованной форме. Чтобы обеспечить конфиденциальность, блок хранения и обработки (SPU) сохраняет весь однонуклеотидный полиморфизм (SNP) как настоящие SNP - наблюдаемые SNP у пациента - с избыточным содержимым из набора потенциальных SNP. [ 17 ] [ 18 ] Другое решение разработало три протокола для обеспечения расчета расстояния редактирования с использованием пересечений искаженной схемы Яо и алгоритма полосового выравнивания. Основным недостатком этого решения является его неспособность выполнять крупномасштабные вычисления с сохранением точности. [ 19 ]
Безопасные полногеномные исследования ассоциаций
[ редактировать ]Полногеномные исследования ассоциаций (GWAS) важны для выявления конкретных изменений в последовательностях генома, которые приводят к заболеванию. Алгоритмы сохранения конфиденциальности, которые идентифицируют SNP, существенно связанные с заболеваниями, основаны на внесении случайного шума в агрегированную статистику для защиты частной жизни человека. [ 20 ] В другом исследовании природа неравновесия связей используется для выбора наиболее полезных наборов данных при максимальной защите конфиденциальности пациентов с помощью вносимого шума; однако ему может не хватать эффективных возможностей ассоциации заболеваний. [ 21 ] Критики этих методов отмечают, что для обеспечения дифференциальной конфиденциальности при небольшом соотношении SNP требуется значительное количество шума, что непрактично для проведения эффективных исследований. [ 5 ]
Аутентифицированное шифрованное хранилище
[ редактировать ]Природа геномных последовательностей требует специального инструмента шифрования для защиты от атак низкой сложности (повторяющегося контента) и KPA ( атаки по известному открытому тексту ) при наличии нескольких ожидаемых символов. Крифа [ 22 ] использует упаковку (уменьшение размера хранилища), механизм перетасовки (рандомизация позиций символов) и шифр AES ( расширенный стандарт шифрования ) для безопасного хранения файлов FASTA, FASTQ, VCF, SAM и BAM с аутентифицированным шифрованием.
Ссылки
[ редактировать ]- ^ Jump up to: а б с д и ж г час Айдай Э., Де Кристофаро Э., Юбо Дж.П., Цудик Дж. (февраль 2015 г.). «Полное секвенирование генома: революционная медицина или кошмар конфиденциальности?» . Компьютер . 48 (2): 58–66. дои : 10.1109/MC.2015.59 . hdl : 11693/22558 . S2CID 2431877 .
- ^ Гутмахер А.Е., Коллинз Ф.С. (сентябрь 2003 г.). «Добро пожаловать в геномную эру» . Медицинский журнал Новой Англии . 349 (10): 996–8. дои : 10.1056/NEJMe038132 . ПМИД 12954750 . S2CID 32233347 .
- ^ Вадман М. (апрель 2008 г.). «Геном Джеймса Уотсона секвенировали на высокой скорости» . Природа . 452 (7189): 788. Бибкод : 2008Natur.452R....W . дои : 10.1038/452788b . ПМИД 18431822 . S2CID 205037214 .
- ^ Служба РФ (март 2006 г.). «Секвенирование генов. Гонка за геном за 1000 долларов». Наука . 311 (5767): 1544–6. дои : 10.1126/science.311.5767.1544 . ПМИД 16543431 . S2CID 23411598 .
- ^ Jump up to: а б с Акгюн М., Байрак А.О., Озер Б., Сагироглу МШ (август 2015 г.). «Обработка геномных данных с сохранением конфиденциальности: опрос» . Журнал биомедицинской информатики . 56 (Приложение C): 103–11. дои : 10.1016/j.jbi.2015.05.022 . ПМИД 26056074 .
- ^ Сондерс С.Дж., Миллер Н.А., Соден С.Е., Динвидди Д.Л., Нолл А., Альнади Н.А. и др. (октябрь 2012 г.). «Быстрое полногеномное секвенирование для диагностики генетических заболеваний в отделениях интенсивной терапии новорожденных» . Наука трансляционной медицины . 4 (154): 154ра135. doi : 10.1126/scitranslmed.3004041 . ПМЦ 4283791 . ПМИД 23035047 .
- ^ Jump up to: а б с д Драбьяк К (01.01.2017). «Предостережение покупателя: как пересечение больших данных и потребительской геномики экспоненциально увеличивает риски конфиденциальности информации» . Матрица здоровья: Журнал юридической медицины . 27 (1): 143. Гейл А495831384 .
- ^ Jump up to: а б с д и ж г час я дж к л м н тот п Ли Дж (март 2016 г.). «Наличие и будущее использования ДНК-информации и защита конфиденциальности генетической информации: сравнительный взгляд». Международный журнал права, преступности и правосудия . 44 : 212–29. дои : 10.1016/j.ijlcj.2015.10.001 .
- ^ Браун С.М. (2003). Основы медицинской геномики . Джон Уайли и сыновья. п. 219. ИСБН 978-0-471-27061-4 .
- ^ Вейнхольд Б. (март 2006 г.). «Эпигенетика: наука об изменениях» . Перспективы гигиены окружающей среды . 114 (3): А160-7. дои : 10.1289/ehp.114-a160 . ПМЦ 1392256 . ПМИД 16507447 .
- ^ Jump up to: а б Харрелл Х.Л., Ротштейн Массачусетс (март 2016 г.). «Законы о биобанковских исследованиях и конфиденциальности в США». Журнал права, медицины и этики . 44 (1): 106–27. дои : 10.1177/1073110516644203 . ПМИД 27256128 . S2CID 3670078 .
- ^ Гаммон А., Некласон Д.В. (октябрь 2015 г.). «Конфиденциальность и риск генетической дискриминации: что нужно знать хирургам» . Клиники хирургической онкологии Северной Америки . 24 (4): 667–81. дои : 10.1016/j.soc.2015.06.004 . ПМЦ 4568442 . ПМИД 26363536 .
- ^ Jump up to: а б Чен Х, Чан Б, Джоли Ю (2015). «Конфиденциальность и биобанкинг в Китае: пример политики переходного периода». Журнал права, медицины и этики . 43 (4): 726–42. дои : 10.1111/jlme.12315 . ПМИД 26711413 . S2CID 23026547 .
- ^ Чалмерс Д. (2015). «Законы о биобанкинге и конфиденциальности в Австралии». Журнал права, медицины и этики . 43 (4): 703–13. дои : 10.1111/jlme.12313 . ПМИД 26711411 . S2CID 34539242 .
- ^ Ван XF. «Крупномасштабное картирование геномных последовательностей человека в гибридных облаках с сохранением конфиденциальности. | Добро пожаловать» . www.informatics.indiana.edu . Проверено 3 ноября 2017 г.
- ^ Де Кристофаро Э., Фабер С., Цудик Г. (ноябрь 2013 г.). Безопасное геномное тестирование с помощью сопоставления частных подстрок со скрытием размера и положения . Материалы 12-го семинара ACM по вопросам конфиденциальности в электронном обществе. Нью-Йорк, штат Нью-Йорк, США. стр. 107–118. дои : 10.1145/2517840.2517849 .
- ^ «Вычисление риска заболеваний с сохранением конфиденциальности с использованием геномных, клинических данных и данных окружающей среды | USENIX» . www.usenix.org . Проверено 3 ноября 2017 г.
- ^ Айдай Э., Райсаро Дж.Л., Хубо Дж.П. (2012). «Технологии повышения конфиденциальности медицинских тестов с использованием геномных данных» .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Азиз М.М., Альхадиди Д., Мохаммед Н. (июль 2017 г.). «Надежное приближение расстояния редактирования геномных данных» . BMC Медицинская Геномика . 10 (Приложение 2): 41. doi : 10.1186/s12920-017-0279-9 . ПМЦ 5547448 . ПМИД 28786362 .
- ^ Джонсон А., Шматиков В. (август 2013 г.). «Исследование данных с сохранением конфиденциальности в полногеномных исследованиях ассоциаций». Материалы 19-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных . Том. 2013. С. 1079–1087. дои : 10.1145/2487575.2487687 . ISBN 9781450321747 . ПМЦ 4681528 . ПМИД 26691928 .
- ^ Чжао Ю, Ван Х, Цзян Х, Оно-Мачадо Л, Тан Х (январь 2015 г.). «Выбор вслепую, но мудро: дифференцированный частный запрос наборов данных ДНК для открытия маркеров заболеваний» . Журнал Американской ассоциации медицинской информатики . 22 (1): 100–8. дои : 10.1136/amiajnl-2014-003043 . ПМЦ 4433380 . ПМИД 25352565 .
- ^ Хоссейни М., Пратас Д., Пиньо А.Дж. (январь 2019 г.). «Cryfa: безопасный инструмент шифрования геномных данных» . Биоинформатика . 35 (1): 146–148. doi : 10.1093/биоинформатика/bty645 . ПМК 6298042 . ПМИД 30020420 .