Геномный проект
Геномные проекты — это научные целью которых в конечном итоге является определение полной последовательности генома организма усилия , (будь то животное , растение , гриб , бактерия , архей , простейший или вирус ) и аннотирование генов , кодирующих белки , и других важные функции, закодированные в геноме. [ 1 ] Последовательность генома организма включает коллективные последовательности ДНК каждой хромосомы организма. Для бактерии, содержащей одну хромосому, проект генома будет направлен на картирование последовательности этой хромосомы. Для человеческого вида, геном которого включает 22 пары аутосом и 2 половые хромосомы, полная последовательность генома будет включать 46 отдельных последовательностей хромосом.
Проект «Геном человека» является хорошо известным примером проекта генома. [ 2 ]
Сборка генома
[ редактировать ]Сборка генома — это процесс взятия большого количества коротких последовательностей ДНК и их повторной сборки для создания представления об исходных хромосомах , из которых произошла ДНК. В проекте секвенирования методом дробовика вся ДНК из источника (обычно одного организма , от бактерии до млекопитающего ) сначала разбивается на миллионы мелких кусочков. Затем эти фрагменты «читаются» автоматическими секвенаторами. сборки генома Алгоритм работает, беря все части и выравнивая их друг с другом, а также обнаруживая все места, где две короткие последовательности или чтения перекрываются. Эти перекрывающиеся чтения можно объединить, и процесс продолжится.
Сборка генома — очень сложная вычислительная задача, которая усложняется тем, что многие геномы содержат большое количество идентичных последовательностей, известных как повторы . Эти повторы могут иметь длину в тысячи нуклеотидов и встречаться в разных местах, особенно в больших геномах растений и животных .
Результирующая (черновая) последовательность генома создается путем объединения секвенированных информационных контигов и последующего использования связывающей информации для создания каркасов. Каркасы расположены вдоль физической карты хромосом, создавая «золотой путь».
Программное обеспечение для сборки
[ редактировать ]Первоначально большинство крупных центров секвенирования ДНК разработали собственное программное обеспечение для сборки получаемых ими последовательностей. Однако ситуация изменилась по мере усложнения программного обеспечения и увеличения количества центров секвенирования. Пример такого ассемблера « Короткий пакет анализа олигонуклеотидов», разработанный BGI для сборки de novo геномов человеческого размера, выравнивания, обнаружения SNP , повторного секвенирования, обнаружения инделей и анализа структурных вариаций. [ 3 ] [ 4 ] [ 5 ]
Аннотация генома
[ редактировать ]С 1980-х годов молекулярная биология и биоинформатика создали потребность в аннотациях ДНК . Аннотация ДНК или аннотация генома — это процесс идентификации прикрепления биологической информации к последовательностям , в частности, определения местоположения генов и определения того, что эти гены делают.
Время завершения
[ редактировать ]При секвенировании генома обычно имеются участки, которые трудно секвенировать (часто участки с высокой повторяющейся ДНК ). Таким образом, «завершенные» последовательности генома редко когда-либо бывают полными, и для более точного описания статуса таких геномных проектов использовались такие термины, как «рабочий проект» или «практически завершенный». Даже когда каждая пара оснований последовательности генома определена, все равно могут присутствовать ошибки, поскольку секвенирование ДНК не является абсолютно точным процессом. Можно также утверждать, что проект полного генома должен включать последовательности митохондрий и (для растений) хлоропластов , поскольку эти органеллы имеют свои собственные геномы.
Часто сообщается, что целью секвенирования генома является получение информации о полном наборе генов в этой конкретной последовательности генома. Доля генома, кодирующая гены, может быть очень маленькой (особенно у эукариот , таких как человек, у которых кодирующая ДНК может составлять лишь несколько процентов всей последовательности). Однако не всегда возможно (или желательно) секвенировать только кодирующие области отдельно. Кроме того, по мере того, как ученые будут лучше понимать роль этой некодирующей ДНК (часто называемой «мусорной ДНК »), станет более важным иметь полную последовательность генома в качестве основы для понимания генетики и биологии любого данного организма.
Во многих отношениях геномные проекты не ограничиваются только определением последовательности ДНК организма. Такие проекты могут также включать в себя предсказание генов, чтобы выяснить, где в геноме находятся гены и что они делают. Также могут быть связанные проекты по секвенированию EST или мРНК, чтобы помочь выяснить, где на самом деле находятся гены.
Исторические и технологические перспективы
[ редактировать ]Исторически сложилось так, что при секвенировании геномов эукариот (таких как червь Caenorhabditis elegans ) было обычным сначала составить карту генома, чтобы получить ряд ориентиров по всему геному. Вместо того, чтобы секвенировать хромосому за один раз, ее следует секвенировать по частям (с предварительным знанием того, где примерно этот фрагмент расположен на большей хромосоме). Изменения в технологии и, в частности, повышение вычислительной мощности компьютеров означают, что теперь геномы можно секвенировать за один раз (хотя у этого подхода есть оговорки по сравнению с традиционным подходом).
Усовершенствования в технологии секвенирования ДНК привели к тому, что стоимость секвенирования новой последовательности генома неуклонно снижается (с точки зрения стоимости пары оснований ), а новые технологии также означают, что геномы можно секвенировать гораздо быстрее.
Когда исследовательские агентства решают, какие новые геномы секвенировать, упор делается на виды, которые либо имеют большое значение в качестве модельного организма , либо имеют отношение к здоровью человека (например, патогенные бактерии или переносчики болезней, такие как например, патогенные бактерии или переносчики болезней, такие как комары комары ), либо виды, имеющие коммерческое значение ( ). например, домашний скот и сельскохозяйственные растения). Вторичный акцент делается на виды, чьи геномы помогут ответить на важные вопросы молекулярной эволюции (например, обыкновенный шимпанзе ).
В будущем, вероятно, секвенировать геном станет еще дешевле и быстрее. Это позволит определить полные последовательности генома многих разных особей одного и того же вида. Что касается людей, это позволит нам лучше понять аспекты генетического разнообразия человека .
Примеры
[ редактировать ]У многих организмов есть проекты генома, которые либо уже завершены, либо будут завершены в ближайшее время, в том числе:
- Люди , Homo sapiens ; см. проект генома человека
- Люди, Homo sapiens ; см. Проект «Геном человека» – Написать
- Палео-эскимосский , [ 4 ] древний человек
- Неандерталец , Homo sapiens neanderthalensis (частичный); см. Проект генома неандертальца.
- Обыкновенный шимпанзе Pan troglodytes ; см. проект «Геном шимпанзе».
- Шерстистый мамонт Mammuthus primigenius [ 6 ]
- Домашняя корова , [ 7 ] [ 8 ] Бос Телец
- Геном крупного рогатого скота
- Консорциум по секвенированию генома медоносных пчел
- Геном лошади [ 9 ]
- HRDetect
- Проект микробиома человека
- Международная программа генома винограда
- Международный проект HapMap
- Проект повторного секвенирования генома более 150 томатов
- Проект «100 000 геномов»
- Проект генома 100 тысяч патогенов
- Международный консорциум по фенотипированию мышей IMPC
- Проект фенотипирования нокаутных мышей KOMP2
- Секвойя гигантская , Sequoiadendron giganteum [ 10 ]
См. также
[ редактировать ]- Объединенный институт генома
- Illumina , частная компания, занимающаяся секвенированием генома
- Knome , частная компания, предлагающая анализ и секвенирование генома
- Модельный организм
- Национальный центр биотехнологической информации
Ссылки
[ редактировать ]- ^ Певснер, Джонатан (2009). Биоинформатика и функциональная геномика (2-е изд.). Хобокен, Нью-Джерси: Уайли-Блэквелл. ISBN 9780470085851 .
- ^ «Потенциальные преимущества проекта исследования генома человека» . Министерство энергетики , Информация о проекте «Геном человека». 09.10.2009. Архивировано из оригинала 8 июля 2013 г. Проверено 18 июня 2010 г.
- ^ Ли Р, Чжу Х, Жуань Дж, Цянь В, Фанг Х, Ши З, Ли Ю, Ли С, Шан Г, Кристиансен К, Ли С, Ян Х, Ван Дж, Ван Дж (февраль 2010 г.). «Сборка геномов человека de novo с помощью массово параллельного секвенирования короткого чтения» . Геномные исследования . 20 (2): 265–272. дои : 10.1101/гр.097261.109 . ISSN 1549-5469 . ПМЦ 2813482 . ПМИД 20019144 .
- ^ Jump up to: а б Расмуссен М., Ли Й., Линдгрин С., Педерсен Дж.С., Альбрехтсен А., Мольтке И., Метспалу М., Метспалу Е., Кивисилд Т., Гупта Р., Берталан М., Нильсен К., Гилберт М.Т., Ван Й., Рагхаван М., Кампос П.Ф., Камп Х.М. , Уилсон А.С., Гледхилл А., Тридико С., Банс М., Лоренцен Э.Д., Бинладен Дж., Го Х, Чжао Дж., Чжан Х., Чжан Х., Ли З., Чен М., Орландо Л., Кристиансен К., Бак М., Томмерап Н., Бендиксен. C, Пьер Т.Л., Гроннов Б., Мельдгаард М., Андреасен С., Федорова С.А., Осипова Л.П., Хайэм Т.Ф., Рэмси С.Б., Хансен Т.В., Нильсен ФК, Кроуфорд М.Х., Брунак С., Зихеритц-Понтен Т., Виллемс Р., Нильсен Р., Крог А, Ван Дж., Виллерслев Э. (11 февраля 2010 г.). «Последовательность древнего человеческого генома вымершего палеоэскимоса» . Природа . 463 (7282): 757–762. Бибкод : 2010Natur.463..757R . дои : 10.1038/nature08835 . ISSN 1476-4687 . ПМЦ 3951495 . ПМИД 20148029 .
- ^ Ван Дж, Ван В, Ли Р, Ли Й, Тянь Г, Гудман Л, Фань В, Чжан Дж, Ли Джей, Чжан Дж, Го Й, Фэн Б, Ли Х, Лу Й, Фан Икс, Лян Х, Ду Цзы , Ли Д, Чжао Ю, Ху Ю, Ян З, Чжэн Х, Хеллманн И, Иноуе М, Пул Дж, И Х, Чжао Дж, Дуань Дж, Чжоу Ю, Цинь Дж, Ма Л, Ли Г, Ян З, Чжан G, Ян Б, Ю С, Лян Ф, Ли В, Ли С, Ли Д, Ни П, Жуань Дж, Ли Q, Чжу Х, Лю Д, Лу З, Ли Н, Го Г, Чжан Дж, Йе Дж, Фан Л, Хао Ц, Чен Ц, Лян Ю, Су Ю, Сан А, Пин С, Ян С, Чен Ф, Ли Л, Чжоу К, Чжэн Х, Жэнь Ю, Ян Л, Гао Ю, Ян Г, Ли З ,Фэн Х, Кристиансен К., Вонг Г.К., Нильсен Р., Дурбин Р., Болунд 456 . Чжан ( 7218 ): 60–65. : 2008Natur.456 ...60W doi : 10.1038 /nature07484 . Л. , 2716080. ПМЦ . ПМИД 18987735 Бибкод
- ^ Гош, Паллаб (23 апреля 2015 г.). «Секвенирование генома мамонта завершено» . Новости Би-би-си .
- ^ Йейтс, Диана (23 апреля 2009 г.). «Что делает корову коровой? Последовательность генома проливает свет на эволюцию жвачных животных» (пресс-релиз) . ЭврекАлерт! . Проверено 22 декабря 2012 г.
- ^ Элсик, К.Г.; Элсик, РЛ; Теллам, КК; Уорли, РА; Гиббс, DM; Музный, генеральный директор; Вайншток, Д.Л.; Адельсон, Э.Э.; Эйхлер, Л.; Ельницкий Р.; Гиго, ДЛ; Хамерник, С.М.; Каппес, штат Ха; Левин, диджей; Линн, ФРВ; Николас, А.; Реймонд, М.; Райнкельс, LC; Скоу, Э.М.; Здобнов Л.; Шук, Дж.; Вомак, Т.; Алиото, SE; Антонаракис, А.; Асташин, CE; Чаппл, Х.-К.; Чен, Дж.; Храст, Ф.; Камара, О.; и др. (2009). «Последовательность генома тауринового крупного рогатого скота: окно в биологию и эволюцию жвачных животных» . Наука . 324 (5926): 522–528. Бибкод : 2009Sci...324..522A . дои : 10.1126/science.1169588 . ПМК 2943200 . ПМИД 19390049 .
- ^ «Выпуск 2007 г.: Собранный геном лошади» . Национальный институт исследования генома человека (NHGRI) . Проверено 19 апреля 2018 г.
- ^ Скотт, Элисон Д; Зимин, Алексей В; Пуйу, Даниэла; Уоркман, Рэйчел; Бриттон, Моника; Заман, Сумайра; Кабальеро, Мэдисон; Прочтите, Эндрю С.; Богданов, Адам Дж; Бернс, Эмили; Вегжин, Джилл; Тимп, Уинстон; Зальцберг, Стивен Л; Нил, Дэвид Б. (1 ноября 2020 г.). «Эталонная последовательность генома гигантской секвойи» . G3: Гены, геномы, генетика . 10 (11): 3907–3919. дои : 10.1534/g3.120.401612 . ПМЦ 7642918 . ПМИД 32948606 .
Внешние ссылки
[ редактировать ]- ЗОЛОТО: Онлайн-база данных геномов
- База данных геномного проекта
- Утилита именования белков
- НАДСЕМЬЯ
- EchinoBase. Архивировано 25 октября 2016 г. на Wayback Machine. Геномная база данных иглокожих (ранее SpBase, база данных генома морских ежей).
- НРКПБ .
- Глобальный альянс по геномике беспозвоночных (GIGA). Архивировано 21 января 2021 г. в Wayback Machine.
- Добро пожаловать в Институт Сэнгера
- Велком Геном Кампус