Jump to content

Репрезентативные последовательности

В социальных науках и других областях репрезентативные последовательности — это целые последовательности, которые лучше всего характеризуют или суммируют набор последовательностей. [1] В биоинформатике репрезентативные последовательности также обозначают подстроки последовательности, которые характеризуют последовательность. [2] [3]

Социальные науки

[ редактировать ]
Репрезентативные последовательности, охватывающие 27% последовательностей совместного проживания в 2000 году в возрасте от 15 до 30 лет (выдержка из биографических данных из Швейцарской панели домохозяйств)

В анализе последовательностей в социальных науках репрезентативные последовательности используются для суммирования наборов последовательностей, описывающих, например, семейный жизненный путь или профессиональную карьеру нескольких тысяч людей. [4]

Идентификация репрезентативных последовательностей [1] [4] исходит из попарных различий между последовательностями. Одним из типичных решений является медоидная последовательность, т. е. наблюдаемая последовательность, которая минимизирует сумму своих расстояний до всех других последовательностей в наборе. Другое решение — это самая плотная наблюдаемая последовательность, т. е. последовательность, в окрестности которой находится наибольшее число других последовательностей. Когда разнообразие последовательностей велико, одного представителя часто недостаточно, чтобы эффективно охарактеризовать набор. В таких случаях осуществляется поиск как можно меньшего набора репрезентативных последовательностей, охватывающего (т. е. включающего по меньшей мере в одну окрестность представителя) заданный процент всех последовательностей.

Также рассматривается решение, заключающееся в выборе медоидов групп относительных частот. Более конкретно, метод заключается в сортировке последовательностей (например, по первой главной координате матрицы попарных несходств), разбиении отсортированного списка на группы одинакового размера (называемые группами относительной частоты) и выборе медоидов одинакового размера. группы. [5]

Описанные выше методы идентификации репрезентативных последовательностей были реализованы в пакете R TraMineR . [6]

Биоинформатика

[ редактировать ]

Репрезентативные последовательности представляют собой короткие участки внутри белковых последовательностей , которые можно использовать для аппроксимации эволюционных взаимоотношений этих белков или организмов, из которых они произошли. Репрезентативные последовательности представляют собой смежные подпоследовательности (обычно 300 остатков ) из вездесущих консервативных белков, так что каждое ортологическое семейство репрезентативных последовательностей, взятое отдельно, дает матрицу расстояний , близко согласующуюся с консенсусной матрицей. [7]

Использовать

[ редактировать ]

Белковые последовательности могут предоставить данные о биологической функции и эволюции белков и белковых доменов . Таким образом, группировка и взаимосвязь белковых последовательностей может предоставить информацию как о биологических процессах человека, так и об эволюционном развитии биологических процессов на Земле; такие кластеры последовательностей позволяют эффективно охватывать пространство последовательностей. Кластеры последовательностей могут свести большую базу данных последовательностей к меньшему набору представителей последовательностей , каждый из которых должен представлять свой кластер на уровне последовательностей. Представители последовательностей позволяют эффективно охватить исходную базу данных меньшим количеством последовательностей. База данных представителей последовательностей называется неизбыточной , поскольку сходные (или избыточные) последовательности были удалены при определенном пороге сходства.

См. также

[ редактировать ]

Анализ последовательности в социальных науках

Анализ последовательностей в биоинформатике

  1. ^ Jump up to: а б Габадиньо, Алексис; Ритчард, Гилберт; Штудер, Матиас; Мюллер, Николас С. (2011), Фред, Ана; Дитц, Ян Л.Г.; Лю, Кеченг; Филипе, Хоаким (ред.), «Извлечение и рендеринг репрезентативных последовательностей» , «Обнаружение знаний», «Инжиниринг знаний и управление знаниями» , «Коммуникации в компьютерных и информационных науках», том. 128, Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 94–106, doi : 10.1007/978-3-642-19032-2_7 , ISBN  978-3-642-19031-5 , получено 12 июня 2023 г.
  2. ^ Кури-Моралес, Анхель Ф.; Ортис-Посадас, Марта Р. (2005), Гельбух, Александр; де Альборнос, Альваро; Терашима-Марин, Хьюго (ред.), «Новый подход к представлению последовательностей белков в биоинформатике» , MICAI 2005: Достижения в области искусственного интеллекта , том. 3789, Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 880–889, номер домена : 10.1007/11579427_90 , ISBN.  978-3-540-29896-0 , получено 12 июня 2023 г.
  3. ^ Чен, Уильям Л.; Лиланд, Бертон А.; Дюрант, Джозеф Л.; Гриер, Дэвид Л.; Кристи, Брэдли Д.; Нурс, Джеймс Г.; Тейлор, Кейт Т. (26 сентября 2011 г.). «Автономное представление последовательностей: преодоление разрыва между биоинформатикой и хеминформатикой» . Журнал химической информации и моделирования . 51 (9): 2186–2208. дои : 10.1021/ci2001988 . ISSN   1549-9596 . ПМИД   21800899 .
  4. ^ Jump up to: а б Габадиньо, Алексис; Ритчард, Гилберт (2013). Леви, Рене; Видмер, Эрик Д. (ред.). «Поиск типичных жизненных траекторий применительно к историям родов» . Гендерные жизненные пути: между стандартизацией и индивидуализацией: европейский подход в применении к Швейцарии . Цюрих: ЛИТ: 287–312.
  5. ^ Фасанг, Анетт Ева; Ляо, Тим Футинг (2014). «Визуализация последовательностей в социальных науках: графики последовательности относительной частоты» . Социологические методы и исследования . 43 (4): 643–676. дои : 10.1177/0049124113506563 . hdl : 10419/209702 . ISSN   0049-1241 . S2CID   61487252 .
  6. ^ Габадиньо, Алексис; Ритчард, Гилберт; Мюллер, Николас С.; Студер, Матиас (2011). «Анализ и визуализация последовательностей состояний в R с помощью TraMineR» . Журнал статистического программного обеспечения . 40 (4). дои : 10.18637/jss.v040.i04 . ISSN   1548-7660 .
  7. ^ Берн, Маршалл; Гольдберг, Дэвид (2 ноября 2004 г.). «Автоматический отбор репрезентативных белков для бактериальной филогении» . Эволюционная биология BMC . 5 (34): 34. дои : 10.1186/1471-2148-5-34 . ПМК   1175084 . ПМИД   15927057 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d039b5b6e869afdcd973d44451aa607c__1702150500
URL1:https://arc.ask3.ru/arc/aa/d0/7c/d039b5b6e869afdcd973d44451aa607c.html
Заголовок, (Title) документа по адресу, URL1:
Representative sequences - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)