Репрезентативные последовательности
В социальных науках и других областях репрезентативные последовательности — это целые последовательности, которые лучше всего характеризуют или суммируют набор последовательностей. [1] В биоинформатике репрезентативные последовательности также обозначают подстроки последовательности, которые характеризуют последовательность. [2] [3]
Социальные науки
[ редактировать ]В анализе последовательностей в социальных науках репрезентативные последовательности используются для суммирования наборов последовательностей, описывающих, например, семейный жизненный путь или профессиональную карьеру нескольких тысяч людей. [4]
Идентификация репрезентативных последовательностей [1] [4] исходит из попарных различий между последовательностями. Одним из типичных решений является медоидная последовательность, т. е. наблюдаемая последовательность, которая минимизирует сумму своих расстояний до всех других последовательностей в наборе. Другое решение — это самая плотная наблюдаемая последовательность, т. е. последовательность, в окрестности которой находится наибольшее число других последовательностей. Когда разнообразие последовательностей велико, одного представителя часто недостаточно, чтобы эффективно охарактеризовать набор. В таких случаях осуществляется поиск как можно меньшего набора репрезентативных последовательностей, охватывающего (т. е. включающего по меньшей мере в одну окрестность представителя) заданный процент всех последовательностей.
Также рассматривается решение, заключающееся в выборе медоидов групп относительных частот. Более конкретно, метод заключается в сортировке последовательностей (например, по первой главной координате матрицы попарных несходств), разбиении отсортированного списка на группы одинакового размера (называемые группами относительной частоты) и выборе медоидов одинакового размера. группы. [5]
Описанные выше методы идентификации репрезентативных последовательностей были реализованы в пакете R TraMineR . [6]
Биоинформатика
[ редактировать ]В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
Репрезентативные последовательности представляют собой короткие участки внутри белковых последовательностей , которые можно использовать для аппроксимации эволюционных взаимоотношений этих белков или организмов, из которых они произошли. Репрезентативные последовательности представляют собой смежные подпоследовательности (обычно 300 остатков ) из вездесущих консервативных белков, так что каждое ортологическое семейство репрезентативных последовательностей, взятое отдельно, дает матрицу расстояний , близко согласующуюся с консенсусной матрицей. [7]
Использовать
[ редактировать ]Белковые последовательности могут предоставить данные о биологической функции и эволюции белков и белковых доменов . Таким образом, группировка и взаимосвязь белковых последовательностей может предоставить информацию как о биологических процессах человека, так и об эволюционном развитии биологических процессов на Земле; такие кластеры последовательностей позволяют эффективно охватывать пространство последовательностей. Кластеры последовательностей могут свести большую базу данных последовательностей к меньшему набору представителей последовательностей , каждый из которых должен представлять свой кластер на уровне последовательностей. Представители последовательностей позволяют эффективно охватить исходную базу данных меньшим количеством последовательностей. База данных представителей последовательностей называется неизбыточной , поскольку сходные (или избыточные) последовательности были удалены при определенном пороге сходства.
См. также
[ редактировать ]Анализ последовательности в социальных науках
Анализ последовательностей в биоинформатике
Ссылки
[ редактировать ]- ^ Jump up to: а б Габадиньо, Алексис; Ритчард, Гилберт; Штудер, Матиас; Мюллер, Николас С. (2011), Фред, Ана; Дитц, Ян Л.Г.; Лю, Кеченг; Филипе, Хоаким (ред.), «Извлечение и рендеринг репрезентативных последовательностей» , «Обнаружение знаний», «Инжиниринг знаний и управление знаниями» , «Коммуникации в компьютерных и информационных науках», том. 128, Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 94–106, doi : 10.1007/978-3-642-19032-2_7 , ISBN 978-3-642-19031-5 , получено 12 июня 2023 г.
- ^ Кури-Моралес, Анхель Ф.; Ортис-Посадас, Марта Р. (2005), Гельбух, Александр; де Альборнос, Альваро; Терашима-Марин, Хьюго (ред.), «Новый подход к представлению последовательностей белков в биоинформатике» , MICAI 2005: Достижения в области искусственного интеллекта , том. 3789, Берлин, Гейдельберг: Springer Berlin Heidelberg, стр. 880–889, номер домена : 10.1007/11579427_90 , ISBN. 978-3-540-29896-0 , получено 12 июня 2023 г.
- ^ Чен, Уильям Л.; Лиланд, Бертон А.; Дюрант, Джозеф Л.; Гриер, Дэвид Л.; Кристи, Брэдли Д.; Нурс, Джеймс Г.; Тейлор, Кейт Т. (26 сентября 2011 г.). «Автономное представление последовательностей: преодоление разрыва между биоинформатикой и хеминформатикой» . Журнал химической информации и моделирования . 51 (9): 2186–2208. дои : 10.1021/ci2001988 . ISSN 1549-9596 . ПМИД 21800899 .
- ^ Jump up to: а б Габадиньо, Алексис; Ритчард, Гилберт (2013). Леви, Рене; Видмер, Эрик Д. (ред.). «Поиск типичных жизненных траекторий применительно к историям родов» . Гендерные жизненные пути: между стандартизацией и индивидуализацией: европейский подход в применении к Швейцарии . Цюрих: ЛИТ: 287–312.
- ^ Фасанг, Анетт Ева; Ляо, Тим Футинг (2014). «Визуализация последовательностей в социальных науках: графики последовательности относительной частоты» . Социологические методы и исследования . 43 (4): 643–676. дои : 10.1177/0049124113506563 . hdl : 10419/209702 . ISSN 0049-1241 . S2CID 61487252 .
- ^ Габадиньо, Алексис; Ритчард, Гилберт; Мюллер, Николас С.; Студер, Матиас (2011). «Анализ и визуализация последовательностей состояний в R с помощью TraMineR» . Журнал статистического программного обеспечения . 40 (4). дои : 10.18637/jss.v040.i04 . ISSN 1548-7660 .
- ^ Берн, Маршалл; Гольдберг, Дэвид (2 ноября 2004 г.). «Автоматический отбор репрезентативных белков для бактериальной филогении» . Эволюционная биология BMC . 5 (34): 34. дои : 10.1186/1471-2148-5-34 . ПМК 1175084 . ПМИД 15927057 .