Фред (программное обеспечение)
Phred — это компьютерная программа для вызова оснований , то есть идентификации последовательности нуклеиновых оснований на основе данных «следов» флуоресценции, генерируемых автоматическим секвенатором ДНК , который использует метод электрофореза и 4-флуоресцентного красителя. [1] [2] Первоначально разработанный Phred вызывал значительно меньше ошибок в исследуемых наборах данных, чем другие методы, в среднем на 40–50% меньше ошибок. Показатель качества Phred получил широкое распространение для характеристики качества последовательностей ДНК и может использоваться для сравнения эффективности различных методов секвенирования.
Фон
[ редактировать ]с флуоресцентными красителями ДНК Секвенирование — это метод молекулярной биологии , который включает в себя маркировку одноцепочечных последовательностей ДНК различной длины четырьмя флуоресцентными красителями (соответствующими 4 различным основаниям, используемым в ДНК) и последующее разделение последовательностей ДНК с помощью «пластинчатого геля» или капиллярного капилляра. - электрофореза метод (см. Секвенирование ДНК ). Ход электрофореза контролируется ПЗС-матрицей на секвенаторе ДНК, что позволяет получить данные временной «трассировки» (или « хроматограмму ») флуоресцентных «пиков», прошедших точку ПЗС-матрицы. Исследуя пики флуоресценции в следовых данных, мы можем определить порядок отдельных оснований ( нуклеотидных оснований ) в ДНК . Однако, поскольку интенсивность, форма и расположение пика флуоресценции не всегда постоянны или однозначны, иногда бывает сложно или отнимает много времени точно определить (или «вызвать») правильные основания для пиков, если это делается вручную.
Методы автоматического секвенирования ДНК произвели революцию в области молекулярной биологии , генерируя огромные объемы данных о последовательностях ДНК. Однако данные о последовательности производятся со значительно более высокой скоростью, чем можно обрабатывать вручную (т. е. интерпретировать данные трассировки для получения данных о последовательности), создавая тем самым узкое место. Чтобы устранить узкое место, необходимо как автоматизированное программное обеспечение, которое может ускорить обработку с повышенной точностью, так и надежное измерение точности. Для удовлетворения этой потребности . было разработано множество программ Одной из таких программ является Phred.
История
[ редактировать ]Первоначально Phred был задуман в начале 1990-х годов Филом Грином , тогдашним профессором Вашингтонского университета в Сент-Луисе . ЛаДина Хиллиер , Майкл Вендл , Дэвид Фиченек, Тим Глисон, Алан Бланшар и Ричард Мотт также внесли свой вклад в кодовую базу и алгоритм. Грин перешел в Вашингтонский университет в середине 1990-х, после чего разработкой в основном руководили он сам и Брент Юинг. Фред сыграл заметную роль в проекте «Геном человека» , где большие объемы данных о последовательностях обрабатывались автоматизированными сценариями. В то время это была наиболее широко используемая программа для определения оснований как в академических, так и в коммерческих лабораториях секвенирования ДНК из-за ее высокой точности определения оснований . [3] Phred распространяется коммерчески компанией CodonCode Corporation , и используется для выполнения функции «Вызов баз» в программе CodonCode Aligner . Он также используется ассемблером плагина MacVector .
Методы
[ редактировать ]Фред использует четырехэтапную процедуру, описанную Юингом и др. чтобы определить последовательность вызовов оснований на основе отслеживания обработанной последовательности ДНК:
- Прогнозируемые местоположения пиков определяются на основе предположения, что фрагменты в среднем расположены относительно равномерно в большинстве областей геля, чтобы определить правильное количество оснований и их идеализированные равномерно расположенные местоположения в областях, где пики плохо разрешены. шумный или смещенный (как при компрессиях)
- Наблюдаемые пики идентифицируются на графике
- Наблюдаемые пики сопоставляются с предсказанными местоположениями пиков, исключая некоторые пики и разделяя другие; поскольку каждый наблюдаемый пик происходит из определенного массива и, таким образом, связан с одним из четырех оснований (A, G, T или C), упорядоченный список совпадающих наблюдаемых пиков определяет последовательность оснований для следа.
- Несовпадающие наблюдаемые пики проверяются на наличие любого пика, который, по-видимому, представляет собой основание, но не может быть отнесен к предсказанному пику на третьей фазе, и если он обнаружен, соответствующее основание вставляется в последовательность считывания.
Вся процедура быстрая, обычно занимающая менее полсекунды на каждую трассу. Результаты можно вывести в виде файла PHD, который содержит базовые данные в виде троек, состоящих из базового вызова, качества и позиции. [4]
Приложения
[ редактировать ]Phred часто используется вместе с другой программой под названием Phrap , которая представляет собой программу для сборки последовательностей ДНК. Phrap регулярно использовался в некоторых крупнейших проектах секвенирования генома человека и в настоящее время является одной из наиболее широко используемых программ сборки последовательностей ДНК в биотехнологической промышленности. Phrap использует показатели качества Phred для определения высокоточных консенсусных последовательностей и оценки качества консенсусных последовательностей. Phrap также использует показатели качества Phred, чтобы оценить, являются ли расхождения между двумя перекрывающимися последовательностями более вероятными из-за случайных ошибок или из-за разных копий повторяющейся последовательности.
Ссылки
[ редактировать ]- ^ Юинг Б., Хиллиер Л. , Вендл М.К. , Грин П. (1998): Базовый вызов трассировок автоматического секвенсора с использованием phred. I. Оценка точности. Геном Рез. 8 (3): 175–185. PMID 9521921 полная статья
- ^ Юинг, Брент; Грин, Фил (1 марта 1998 г.). «Вызов оснований трассировок автоматического секвенсора с использованием Phred. II. Вероятности ошибок» . Геномные исследования . 8 (3). Лаборатория Колд-Спринг-Харбор: 186–194. дои : 10.1101/гр.8.3.186 . ISSN 1088-9051 . ПМИД 9521922 .
- ^ Рихтерих П. (1998): Оценка ошибок в «необработанных» последовательностях ДНК: проверочное исследование. Геном Рез. 8(3):251–259. ПМИД 9521928
- ^ Грин, Фил; Юинг, Брент. «Документация ФРЕД» . Лаборатория Фила Грина . Университет Вашингтона . Проверено 30 сентября 2021 г.