Подпоследовательность
![]() | В этой статье есть несколько проблем. Пожалуйста, помогите улучшить его или обсудите эти проблемы на странице обсуждения . ( Узнайте, как и когда удалять эти шаблонные сообщения )
|
В математике подпоследовательность — это данной последовательности последовательность, которая может быть получена из данной последовательности путем удаления некоторых элементов или их отсутствия без изменения порядка остальных элементов. Например, последовательность является подпоследовательностью полученный после удаления элементов и Отношение одной последовательности как подпоследовательности другой является предпорядком .
Подпоследовательности могут содержать последовательные элементы, которые не были последовательными в исходной последовательности. Подпоследовательность, состоящая из последовательного набора элементов исходной последовательности, например от является подстрокой . Подстрока является уточнением подпоследовательности.
Список всех подпоследовательностей слова « appl » будет выглядеть так: «a », « ap », « al », « ae », « app », « apl », « ape », « ale », « appl », « appe ", " aple ", " apple ", " p ", " pp ", " pl ", " pe ", " ppl ", " ppe ", " ple ", " pple ", " l ", " le " , " e ", "" ( пустая строка ).
Общая последовательность [ править ]
Даны две последовательности и последовательность называется общей подпоследовательностью и если является подпоследовательностью обоих и Например, если
Это не будет самая длинная общая подпоследовательность , поскольку имеет длину только 3, а общая подпоследовательность имеет длину 4. Самая длинная общая подпоследовательность и является
Приложения [ править ]
Подпоследовательности имеют приложения в информатике . [1] особенно в области биоинформатики , где компьютеры используются для сравнения, анализа и хранения ДНК , РНК и белков последовательностей .
Возьмем две последовательности ДНК, содержащие 37 элементов, скажем:
- ПОСЛЕДОВАТЕЛЬНОСТЬ 1 = ACGGTGTCGTGCTATGCTGATGCTGACTTATATGCTA
- ПОСЛЕДОВАТЕЛЬНОСТЬ 2 = CGTTCGGCTATCGTACGTTCTATTCTATGATTTCTAA
Самая длинная общая подпоследовательность последовательностей 1 и 2:
- LCS (SEQ 1 , SEQ 2 ) = CGTTCGGCTATGCTTCTACTTATTCTA
Это можно проиллюстрировать, выделив в исходные последовательности 27 элементов самой длинной общей подпоследовательности:
- SEQ 1 = A CG G T G TCG T GCTATGCT GA T G CT G ACTTAT A T G CTA
- SEQ 2 = CGTTCGGCTAT C G TA C G TTCTA TT CT A T G ATT T CTA A
Другой способ показать это — выровнять две последовательности, то есть расположить элементы самой длинной общей подпоследовательности в одном столбце (обозначенном вертикальной чертой) и ввести специальный символ (здесь — тире) для заполнения возникающих пустые подпоследовательности:
- SEQ 1 = ACGGTGTCGTGCTAT-G--C-TGATGCTGA--CT-T-ATATG-CTA-
- | || ||| ||||| | | | | || | || | || | |||
- SEQ 2 = -C-GT-TCG-GCTATCGTACGT--T-CT-ATTCTATGAT-T-TCTAA
Подпоследовательности используются для определения того, насколько похожи две цепи ДНК, используя основания ДНК: аденин , гуанин , цитозин и тимин .
Теоремы [ править ]
- Каждая бесконечная последовательность действительных чисел имеет бесконечную монотонную подпоследовательность (это лемма, используемая при доказательстве теоремы Больцано-Вейерштрасса ).
- Любая бесконечная ограниченная последовательность в имеет сходящуюся подпоследовательность (это теорема Больцано–Вейерштрасса ).
- Для всех целых чисел и любая конечная последовательность длины не менее содержит монотонно возрастающую подпоследовательность длины или монотонно убывающая подпоследовательность длины (Это теорема Эрдеша–Секереша ).
- Метрическое пространство компактна, если каждая последовательность из имеет сходящуюся подпоследовательность, предел которой находится в .
См. также [ править ]
- Последующий предел - предел некоторой подпоследовательности.
- Ограничить верхний и нижний предел — границы последовательности.
- Задача о самой длинной возрастающей подпоследовательности — задача информатики.
Примечания [ править ]
- ^ В информатике строка часто используется как синоним последовательности , но важно отметить, что подстрока и подпоследовательность не являются синонимами. Подстроки — это последовательные части строки, а подпоследовательности — не обязательно. Это означает, что подстрока строки всегда является подпоследовательностью строки, но подпоследовательность строки не всегда является подстрокой строки, см.: Гасфилд, Дэн (1999) [1997]. Алгоритмы на строках, деревьях и последовательностях: информатика и вычислительная биология . США: Издательство Кембриджского университета. п. 4. ISBN 0-521-58519-8 .
В эту статью включены материалы из подпоследовательности PlanetMath , которая распространяется по лицензии Creative Commons Attribution/Share-Alike License .