Jump to content

Браузер генома UCSC

Браузер генома UCSC
Содержание
Описание Браузер генома UCSC
Контакт
Исследовательский центр Калифорнийский университет Санта-Крус
Лаборатория Центр биомолекулярной науки и инженерии Инженерной школы Баскина
Первичное цитирование Наварро Гонсалес и др. (2021) [1]
Доступ
Веб-сайт геном .ucsc .edu

Браузер генома UCSC это онлайновый и загружаемый браузер генома, размещенный Калифорнийским университетом в Санта-Крус (UCSC). [2] [3] [4] Это интерактивный веб-сайт, предлагающий доступ к данным о последовательностях геномов различных видов позвоночных и беспозвоночных , а также основных модельных организмов , интегрированных с большой коллекцией согласованных аннотаций. Браузер — это графическое средство просмотра, оптимизированное для поддержки быстрой интерактивной работы, и представляет собой набор веб-инструментов с открытым исходным кодом, созданный на базе базы данных MySQL для быстрой визуализации, анализа и запроса данных на многих уровнях. Базу данных браузера генома, инструменты просмотра, загружаемые файлы данных и документацию можно найти на веб-сайте UCSC Genome Bioinformatics.

Первоначально созданный и до сих пор управляемый Джимом Кентом , тогда аспирантом, и Дэвидом Хаусслером , профессором компьютерных наук (ныне биомолекулярной инженерии) в Калифорнийском университете в Санта-Крус в 2000 году, UCSC Genome Browser начинался как ресурс для распространения первые плоды проекта « Геном человека» . При финансовой поддержке Медицинского института Говарда Хьюза и Национального института исследований генома человека NHGRI (одного из Национальных институтов здравоохранения США ) браузер предлагал графическое отображение первой полнохромосомной черновой сборки последовательности генома человека. Сегодня браузер используется генетиками, молекулярными биологами и врачами, а также студентами и преподавателями эволюции для доступа к геномной информации. [5]

Геномы UCSC

За годы, прошедшие с момента его создания, браузер UCSC расширился и теперь включает в себя последовательности генома всех видов позвоночных и отдельных беспозвоночных, для которых доступны геномные последовательности с высоким охватом. [6] сейчас включает 108 видов . Высокий охват необходим, чтобы обеспечить перекрытие и направлять строительство более крупных смежных регионов. Геномные последовательности с меньшим покрытием включены в треки множественного выравнивания в некоторых браузерах, но фрагментированный характер этих сборок не делает их подходящими для создания полнофункциональных браузеров. (подробнее о треках с множественным выравниванием ниже). Виды, размещенные с помощью полнофункциональных геномных браузеров, показаны в таблице. [7]

Разновидность
человекообразные обезьяны бабуин , бонобо , шимпанзе , гиббон , горилла , человек , орангутан
не обезьянообразные приматы кустарниковая обезьяна , золотая курносая обезьяна , зеленая обезьяна , игрунка , мышиный лемур , хоботная обезьяна , макака-резус , беличья обезьяна , долгопят , древесная землеройка
млекопитающие, не относящиеся к приматам альпака , броненосец , бизон , коричневый киви , кошка , китайский хомяк , китайский панголин , корова , собака , дельфин , хорек , слон , морская свинка , гавайский тюлень-монах , ёж , лошадь , крыса-кенгуру , маленькая коричневая летучая мышь , малайский летающий лемур , ламантин , мегабат , малый полосатик , мышь , голый землекоп , опоссум , панда , свинья , пищуха , утконос , кролик , овца , землеройка , крыса , даман , ленивец , белка , тасманский дьявол , тенрек , валлаби , белый носорог
хордовые немлекопитающие Африканская когтистая лягушка , американский аллигатор , атлантическая треска , волнистый попугайчик , курица , целакант , слоновая акула фугу , подвязочная змея , , , беркут минога , ящерица , медака , средний зяблик , нильская тилапия , расписная черепаха , колюшка , тетраодон , нанорана паркери , индейка , Xenopus тропический , полосатый зяблик , рыбка данио
беспозвоночные Anopheles gambiae , Apis mellifera , Caenorhabditis spp (5), калифорнийский морской заяц , Ciona интестиналис , Drosophila spp. (11), ланцетник , Pristionchus pacificus , морская асцидия , морской еж , дрожжи.
вирусы Эболавирус , SARS-CoV-2 коронавирус

Помимо этих 108 видов и их сборок, браузер генома UCSC также предлагает концентраторы сборок — доступные через Интернет каталоги геномных данных, которые можно просматривать в браузере и включать сборки, которые не размещены в нем изначально. Там пользователи могут загружать и аннотировать уникальные сборки, для которых UCSC не предоставляет базу данных аннотаций. Полный список видов и их сборок можно просмотреть на портале GenArk , включая 2589 сборок, размещенных как в базе данных браузера генома UCSC, так и в центрах сборок. Пример можно увидеть в сборочном центре проекта «Геномы позвоночных» .

Функциональность браузера

[ редактировать ]

Большой объем данных о биологических системах, накапливающийся в литературе, вызывает необходимость сбора и обработки информации с использованием инструментов биоинформатики . Браузер генома UCSC представляет разнообразную коллекцию наборов данных аннотаций (известных как «треки» и представленных графически), включая выравнивания мРНК, картирование элементов повторов ДНК, предсказания генов, данные об экспрессии генов, данные об ассоциации с заболеваниями (представляющие связь генов с заболеваниями) и карты коммерчески доступных генных чипов (например, Illumina и Agilent ). Основная парадигма отображения состоит в том, чтобы показать последовательность генома в горизонтальном измерении и показать графическое представление местоположений мРНК, прогнозов генов и т. д. Цветные блоки вдоль оси координат показывают места выравнивания различных типов данных. . Возможность показать это большоеРазнообразие типов данных на одной оси координат делает браузер удобным инструментом для вертикальной интеграции данных. [8]

Чтобы найти конкретный ген или геномную область, пользователь может ввести название гена, последовательность ДНК, номер доступа для РНК, название геномной цитологической полосы (например, 20p13 для полосы 13 на коротком плече chr20). или положение хромосомы (chr17:38,450,000-38,531,000 для области вокруг гена BRCA1 ).

Представление данных в графическом формате позволяет браузеру представить ссылку доступа к подробной информации о любой из аннотаций. Страница сведений о гене трека UCSC Genes содержит большое количество ссылок на более конкретную информацию о гене во многих других ресурсах данных, таких как Online Mendelian Inheritance in Man ( OMIM ) и SwissProt .

Браузер UCSC, предназначенный для представления сложных и объемных данных, оптимизирован по скорости. Предварительно сопоставив миллионы последовательностей РНК из GenBank с каждой из 244 сборок генома (многие из 108 видов имеют более одной сборки), браузер обеспечивает мгновенный доступ к сопоставлению любой РНК с любым из размещенных видов.

Множественные генные продукты гена FOXP2 (вверху) и эволюционная консервативность, показанные в множественном выравнивании (внизу)

Сопоставление многих типов данных позволяет исследователям отображать именно ту комбинацию данных, которая ответит на конкретные вопросы. Функция вывода в формате pdf/postscript позволяет экспортировать изображение, готовое к съемке, для публикации в научных журналах.

Одна уникальная и полезная функция, которая отличает браузер UCSC от других браузеров генома, — это постоянно меняющийся характер отображения. Может отображаться последовательность любого размера, от одного основания ДНК до всей хромосомы (chr1 человека = 245 миллионов оснований, МБ) с полными аннотациями. Исследователи могут отображать один ген, один экзон или целую полосу хромосом, показывая десятки или сотни генов и любую комбинацию множества аннотаций. Удобная функция перетаскивания и масштабирования позволяет пользователю выбрать любую область изображения генома и развернуть ее на весь экран.

Исследователи также могут использовать браузер для отображения своих собственных данных с помощью инструмента «Пользовательские треки». Эта функция позволяет пользователям загружать файлы собственных данных и просматривать их в контексте сборки эталонного генома. Пользователи также могут использовать данные, размещенные в UCSC, создавая подмножества данных по своему выбору с помощью инструмента «Обозреватель таблиц» (например, только SNP , которые изменяют аминокислотную последовательность белка) и отображать это конкретное подмножество данных в браузере. как пользовательский трек.

Любое представление браузера, созданное пользователем, включая те, которые содержат пользовательские треки, могут быть переданы другим пользователям с помощью инструмента «Сохраненные сеансы».

Браузер генома UCSC отслеживает категории: картирование и секвенирование, гены и прогнозирование генов, фенотип и литература, COVID-19, секвенирование одноклеточной РНК, мРНК и EST.
Браузер генома UCSC отслеживает категории: регулирование, сравнительная геномика, вариации, повторы.

Под отображаемыми изображениями браузера UCSC Genome расположены одиннадцать категорий дополнительных треков, которые можно выбрать и отобразить рядом с исходными данными. Исследователи могут выбирать треки, которые лучше всего отражают их запрос, чтобы обеспечить отображение более подходящих данных в зависимости от типа и глубины проводимого исследования. Эти категории следующие:

Категории
Категория Описание Примеры треков
Картирование и секвенирование Это позволяет контролировать стиль отображаемого секвенирования (например, геномные координаты, последовательности, пробелы и т. д.). Он также может отображать трек в процентах, чтобы показать исследователю, является ли конкретный генетический элемент более распространенным в указанной области. Базовая позиция . Возможность отображения , разрыв
Гены и генные предсказания Он предлагает программы для прогнозирования генов и базы данных, из которых можно отображать известные гены. Различные треки позволяют пользователю отображать модели генов , области, кодирующие белки , некодирующие РНК и т. д. Пользователи могут быстро сравнить свой запрос с заранее выбранными наборами генов, чтобы найти корреляции между известными наборами генов. GENCODE v24 , Генеидные гены , Pfam в гене UCSC
Фенотип и литература Базы данных, содержащие определенные стили данных фенотипа . Эти треки предназначены в первую очередь для использования врачами и другими специалистами, занимающимися генетическими нарушениями (например, генетиками, студентами естественных и медицинских факультетов). Пользователи могут отображать трек, показывающий геномные положения вариантов природных и искусственных аминокислот. OMIM Alleles , Cancer Gene Expr Супер-трек
COVID-19 В нем показаны данные полногеномных ассоциативных исследований (GWAS) и экспериментов по выявлению вариантов для выявления генетических вариантов, связанных с тяжестью и восприимчивостью к заболеванию COVID-19 . COVID GWAS v3 , COVID GWAS v4 , Редкие вредные варианты
Секвенирование одноклеточной РНК Он предоставляет данные об экспрессии РНК на уровне отдельных клеток ( scRNA-Seq ) из различных тканей человека (например, почек, толстой кишки, сердца, мышц, плаценты, мононуклеарных клеток периферической крови и т. д.). Кровь (PBMC) , Атлас клеток сердца , Колон Ван
мРНК и EST На нем показаны метки экспрессированных последовательностей (EST) и информационная РНК . EST представляют собой последовательности однократного чтения, обычно длиной около 500 оснований, которые обычно представляют собой фрагменты транскрибируемых генов. Треки мРНК позволяют отображать данные выравнивания мРНК у людей, а также у других видов. Существуют также треки, позволяющие сравнивать их с областями EST, которые демонстрируют признаки сплайсинга при выравнивании с геномом. EST человека , Другие EST , Другие мРНК
Выражение Он предлагает генетические данные и связанную с ними экспрессию генов в областях тканей. Это позволяет пользователям узнать, связан ли конкретный ген или последовательность с различными тканями организма. Треки экспрессии также позволяют отображать согласованные данные о тканях, которые экспрессируют запрашиваемую область. GTEx Джин , Аффи U133
Регулирование Информация, относящаяся к регуляции транскрипции, из различных исследований. Пользователи могут настроить треки регулирования, чтобы добавить график отображения в браузер генома. Эти дисплеи позволяют получить более подробную информацию о регуляторных регионах, сайтах связывания факторов транскрипции , сайтах связывания РНК, регуляторных вариантах, гаплотипах и других регуляторных элементах . Настройки супер-трека правил ENCODE , ORegAnno
Сравнительная геномика Он показывает данные о сохранении последовательностей , включая приматов, позвоночных, млекопитающих и других. Сравнительные сопоставления дают графическое представление об эволюционных отношениях между видами. Это делает его полезным инструментом как для исследователя, который может визуализировать области сохранения среди группы видов и делать прогнозы о функциональных элементах в неизвестных регионах ДНК, так и в классе в качестве инструмента для иллюстрации одного из наиболее убедительных аргументов в пользу эволюция видов. Трек Conservation на человеческой ассамблее ясно показывает, что чем дальше в эволюционное время (этот трек включает 100 видов), тем меньше гомологии последовательностей остается, но функционально важные участки генома (например, экзоны и контрольные элементы, но не интроны) обычно) сохраняются гораздо дальше в эволюционном времени. Сохранение , Кактус 241-полосный , Минусы 30 приматов
Вариация Он сравнивает искомую последовательность с известными вариантами. Например, все содержимое каждой версии базы данных dbSNP от NCBI сопоставляется с геномами человека, мыши и других людей. Сюда входят плоды проекта «1000 геномов», как только они будут выпущены в dbSNP. Другие типы данных о вариациях включают данные о вариациях числа копий ( CNV ) и частоты аллелей человеческой популяции из проекта HapMap . Общие SNP(150) , Все SNP(146) , Помеченные SNP(144)
Повторы Позволяет отслеживать различные типы повторяющихся последовательностей в запросе. Пользователи могут быстро увидеть, содержит ли указанный им поиск большое количество повторяющихся последовательностей, и соответствующим образом настроить свой поиск или отслеживать отображение. ПовторМаскер , Микросателлит , WM + SDust

Инструменты анализа

[ редактировать ]

На сайте UCSC размещен набор инструментов анализа генома, включая полнофункциональный графический интерфейс для анализа информации в базе данных браузера, инструмент выравнивания последовательностей в формате FASTA BLAT. [9] это также полезно для простого поиска последовательностей в массивной последовательности (геном человека = 3,23 миллиарда оснований [Гб]) любого из представленных геномов.

Инструмент LiftOver использует выравнивание всего генома, чтобы обеспечить преобразование последовательностей из одной сборки в другую или между видами. Инструмент Genome Graphs позволяет пользователям просматривать все хромосомы одновременно и отображать результаты полногеномных ассоциативных исследований (GWAS). Сортировщик генов отображает гены, сгруппированные по параметрам, не связанным с местоположением генома, например, по характеру экспрессии в тканях.

Открытый исходный код/зеркала

[ редактировать ]

База кода браузера UCSC имеет открытый исходный код для некоммерческого использования и локально дублируется многими исследовательскими группами, что позволяет отображать данные в частном порядке в контексте общедоступных данных. Браузер UCSC зеркально отображается в нескольких местах по всему миру, как показано в таблице.

Официальные зеркальные сайты
Европейское зеркало — поддерживается UCSC в Университете Билефельда , Германия.
Азиатское зеркало — поддерживается UCSC в RIKEN , Иокогама, Япония.

Код браузера также используется в отдельных установках браузером генома малярии UCSC и браузером Archaea.

См. также

[ редактировать ]
  1. ^ Наварро Гонсалес, Дж; Цвейг, А.С.; Спейр, ML; Шмельтер, Д; Розенблум, КР; Рэйни, Би Джей; Пауэлл, CC; Нассар, ЛР; Молдинг, Северная Дакота; Ли, СМ; Ли, Британская Колумбия; Хинрикс, А.С.; Файф, AC; Фернандес, JD; Диканс, М; Клоусон, Х; Каспер, Дж; Бенет-Пажес, А; Барбер, врач общей практики; Хаусслер, Д; Кун, Р.М.; Хойсслер, М; Кент, Вашингтон (8 января 2021 г.). «База данных UCSC Genome Browser: обновление 2021 года» . Исследования нуклеиновых кислот . 49 (Д1): Д1046–Д1057. дои : 10.1093/nar/gkaa1070 . ISSN   0305-1048 . ПМК   7779060 . ПМИД   33221922 .
  2. ^ Фудзита П.А., Рид Б., Цвейг А.С., Хинрихс А.С., Карольчик Д., Клайн М.С., Голдман М., Барбер Г.П., Клоусон Х., Коэльо А., Дикханс М., Дрессер Т.Р., Джардин Б.М., Харт Р.А., Хиллман-Джексон Дж., Сюй Ф, Киркуп В., Кун Р.М., Лернед К., Ли Ч., Мейер Л.Р., Пол А., Рэйни Б.Дж., Розенблум К.Р., Смит К.Э., Хаусслер Д., Кент У.Дж. (январь 2011 г.). «База данных браузера генома UCSC: обновление 2011 г.» . Нуклеиновые кислоты Рез . 39 (Проблема с базой данных): D876-82. дои : 10.1093/нар/gkq963 . ПМК   3242726 . ПМИД   20959295 .
  3. ^ Кент В.Дж., Сагнет К.В., Фьюри Т.С., Роскин К.М., Прингл Т.Х., Залер А.М., Хаусслер Д. (июнь 2002 г.). «Обозреватель генома человека в UCSC» . Геном Рез . 12 (6): 996–1006. дои : 10.1101/гр.229102 . ПМК   186604 . ПМИД   12045153 .
  4. ^ Кун, Р.М.; Карольчик Д.; Цвейг, А.С.; Ван, Т.; Смит, Кентукки; Розенблум, КР; Рхед, Б.; Рэйни, Би Джей; Пол, А.; Фазан, М.; Мейер, Л. (1 января 2009 г.). «База данных браузера генома UCSC: обновление 2009 г.» . Исследования нуклеиновых кислот . 37 (База данных): D755–D761. дои : 10.1093/нар/gkn875 . ISSN   0305-1048 . ПМЦ   2686463 . ПМИД   18996895 .
  5. ^ «История | Институт геномики» . genomics.ucsc.edu . Проверено 7 августа 2022 г.
  6. ^ «Высокий охват» здесь означает шестикратное покрытие или Общая последовательность в шесть раз превышает размер генома.
  7. ^ «UCSC Genome Browser: Благодарности» . genome.ucsc.edu . Проверено 27 июля 2022 г.
  8. ^ Наварро Гонсалес, Хаиро; Цвейг, Энн С.; Спейр, Мэтью Л.; Шмельтер, Дэниел; Розенблум, Кейт Р.; Рэйни, Брайан Дж.; Пауэлл, Коннер К.; Нассар, Луис Р.; Молдинг, Натан Д.; Ли, Кристофер М.; Ли, Брайан Т. (08 января 2021 г.). «База данных UCSC Genome Browser: обновление 2021 года» . Исследования нуклеиновых кислот . 49 (Д1): Д1046–Д1057. дои : 10.1093/nar/gkaa1070 . ISSN   1362-4962 . ПМК   7779060 . ПМИД   33221922 .
  9. ^ Кент, У.Дж. (апрель 2002 г.). «BLAT — BLAST-подобный инструмент выравнивания» . Геном Рез . 12 (4): 656–64. дои : 10.1101/гр.229202 . ПМК   187518 . ПМИД   11932250 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 505820a97949752f244836b55367c2c8__1698300660
URL1:https://arc.ask3.ru/arc/aa/50/c8/505820a97949752f244836b55367c2c8.html
Заголовок, (Title) документа по адресу, URL1:
UCSC Genome Browser - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)