Jump to content

Алгоритм Гиллеспи

В теории вероятностей алгоритм Гиллеспи (или алгоритм Дуба – Гиллеспи или алгоритм стохастического моделирования , SSA ) генерирует статистически правильную траекторию (возможное решение) системы стохастических уравнений, для которой скорости реакции известны . Он был создан Джозефом Л. Дубом и другими (около 1945 г.), представлен Дэном Гиллеспи в 1976 г. и популяризирован в 1977 г. в статье, где он использует его для эффективного и точного моделирования химических или биохимических систем реакций с использованием ограниченных вычислительных мощностей (см. стохастическое моделирование ). [1] Поскольку компьютеры стали быстрее, этот алгоритм стал использоваться для моделирования все более сложных систем. Алгоритм особенно полезен для моделирования реакций внутри клеток, где количество реагентов невелико и отслеживание каждой реакции возможно с помощью вычислений. Математически это вариант динамического метода Монте-Карло , аналогичный кинетическим методам Монте-Карло . Он широко используется в вычислительной системной биологии . [ нужна ссылка ]

История [ править ]

Процесс, который привел к созданию алгоритма, включает несколько важных шагов. В 1931 году Андрей Колмогоров ввел дифференциальные уравнения, соответствующие эволюции во времени случайных процессов, протекающих скачками, сегодня известные как уравнения Колмогорова (марковский скачкообразный процесс) (упрощенная версия известна как главное уравнение в естественных науках). нашел В 1940 году Уильям Феллер условия, при которых уравнения Колмогорова допускают (собственные) вероятности в качестве решений. В своей Теореме I (работа 1940 года) он устанавливает, что время до следующего прыжка распределялось экспоненциально, а вероятность следующего события пропорциональна скорости. Таким образом, он установил связь уравнений Колмогорова со случайными процессами . Позже Дуб (1942, 1945) расширил решения Феллера за пределы случаев процессов чистого скачка. Этот метод был реализован в компьютерах Дэвидом Джорджем Кендаллом (1950) с использованием компьютера Manchester Mark 1 , а затем использован Морисом С. Бартлеттом (1953) в его исследованиях вспышек эпидемий. Гиллеспи (1977) получил алгоритм другим способом, используя физический аргумент.

Идея алгоритма [ править ]

Традиционные непрерывные и детерминированные биохимические уравнения скорости не позволяют точно предсказать клеточные реакции, поскольку они основаны на объемных реакциях, требующих взаимодействия миллионов молекул. Обычно они моделируются как набор связанных обыкновенных дифференциальных уравнений. Напротив, алгоритм Гиллеспи позволяет дискретно и стохастически моделировать систему с небольшим количеством реагентов, поскольку каждая реакция моделируется явно. Траектория, соответствующая одному моделированию Гиллеспи, представляет собой точную выборку функции массы вероятности, которая является решением основного уравнения .

Физической основой алгоритма является столкновение молекул внутри реакционного сосуда. Предполагается, что столкновения часты, но столкновения с правильной ориентацией и энергией встречаются нечасто. Предполагается, что реакционная среда хорошо перемешана.

Алгоритм [ править ]

В обзоре (Gillespie, 2007) представлены три разные, но эквивалентные формулировки; прямой метод, метод первой реакции и метод первого семейства, причем первые два являются частными случаями второго. Формулировка методов прямой и первой реакции сосредоточена на выполнении обычных шагов обращения Монте-Карло к так называемой «фундаментальной предпосылке стохастической химической кинетики», которая математически представляет собой функцию

где каждый из члены представляют собой функции склонности элементарной реакции, аргумент которой есть , вектор видов имеет значение. параметром является время до следующей реакции (или время пребывания), а это текущее время. Перефразируя Гиллеспи, это выражение читается как «вероятность при условии , что следующая реакция системы произойдет через бесконечно малый интервал времени , и будет иметь стехиометрию, соответствующую Эта формулировка открывает окно для прямых методов и методов первой реакции, подразумевая, что является экспоненциально распределенной случайной величиной, и — это «статистически независимая целочисленная случайная величина с точечными вероятностями ".

Таким образом, метод генерации Монте-Карло заключается в простом рисовании двух псевдослучайных чисел: и на и вычислить

и

наименьшее целое число, удовлетворяющее

Используя этот метод генерации времени пребывания и следующей реакции, алгоритм прямого метода сформулирован Гиллеспи как

1. Initialize the time  and the system's state 
2. With the system in state  at time , evaluate all the  and their sum 
3. Calculate the above value of  and 
4. Effect the next reaction by replacing  and 
5. Record  as desired. Return to step 2, or else end the simulation.

где представляет собой добавление компонент данного вектора изменения состояния . Это семейство алгоритмов требует больших вычислительных затрат, поэтому существует множество модификаций и адаптаций, включая метод следующей реакции (Гибсона и Брука), тау-прыжка , а также гибридные методы, в которых большое количество реагентов моделируются с детерминированным поведением. Адаптированные методы обычно ставят под угрозу точность теории, лежащей в основе алгоритма, поскольку она связана с основным уравнением, но предлагают разумные реализации для значительного сокращения временных рамок. Вычислительная стоимость точных версий алгоритма определяется классом связи реакционной сети. В слабосвязанных сетях количество реакций, на которые влияет любая другая реакция, ограничено небольшой константой. В сильно связанных сетях запуск одной реакции может в принципе повлиять на все остальные реакции. Была разработана точная версия алгоритма с масштабированием в постоянное время для слабосвязанных сетей, позволяющая эффективно моделировать системы с очень большим количеством каналов реакции (Слепой Томпсон Плимптон, 2008). Обобщенный алгоритм Гиллеспи, учитывающий немарковские свойства случайных биохимических событий с задержкой, был разработан Bratsun et al. 2005 г. и независимо Barrio et al. 2006 г., а также (Cai 2007). Подробности смотрите в статьях, цитируемых ниже.

Формулировки частичной склонности, независимо разработанные Ramaswamy et al. (2009, 2010) и Индурхья и Бил (2010) позволяют построить семейство точных версий алгоритма, вычислительная стоимость которого пропорциональна количеству химических веществ в сети, а не (большему) количеству реакций. Эти формулировки могут снизить вычислительные затраты для масштабирования за постоянное время для слабосвязанных сетей и максимально линейно масштабироваться с количеством видов для сильносвязанных сетей. Также был предложен вариант обобщенного алгоритма Гиллеспи с частичной склонностью для реакций с задержками (Рамасвами Сбалзарини, 2011). Использование методов частичной склонности ограничивается элементарными химическими реакциями, т. е. реакциями с участием не более двух различных реагентов. Любую неэлементарную химическую реакцию можно эквивалентно разложить на набор элементарных за счет линейного (по порядку реакции) увеличения размера сети.

Примеры [ править ]

Обратимое связывание A и B с AB димеров образованием

Простой пример может помочь объяснить, как работает алгоритм Гиллеспи. Рассмотрим систему молекул двух А и В. типов В этой системе A и B обратимо связываются вместе с образованием димеров AB так что возможны две реакции: либо A и B реагируют обратимо с образованием димера AB , либо димер AB диссоциирует на A и B. , Константа скорости реакции для данной отдельной молекулы A, реагирующей с данной отдельной молекулой B , равна , а скорость реакции распада димера AB равна .

Если в момент времени t существует по одной молекуле каждого типа, то скорость образования димера равна , а если есть молекулы типа А и молекул типа B , скорость образования димера равна . Если есть димеров, то скорость диссоциации димера равна .

Суммарная скорость реакции, , в момент времени t тогда определяется выражением

Итак, мы описали простую модель с двумя реакциями. Это определение не зависит от алгоритма Гиллеспи. Теперь мы опишем, как применить алгоритм Гиллеспи к этой системе.

В алгоритме мы продвигаемся вперед во времени в два этапа: вычисляем время до следующей реакции и определяем, какая из возможных реакций будет следующей. Предполагается, что реакции полностью случайны, поэтому, если скорость реакции в момент времени t равна , то время δt до возникновения следующей реакции представляет собой случайное число, полученное из экспоненциальной функции распределения со средним значением . Таким образом, мы продвигаем время от t до t + δ t .

График зависимости количества молекул A (черная кривая) и димеров AB от времени. Поскольку мы начали с 10 A и B молекул в момент времени t = 0, количество молекул B всегда равно количеству молекул A и поэтому не показано.

Вероятность того, что эта реакция представляет собой А связывание молекулы с молекулой В , представляет собой просто долю общей скорости реакции этого типа, т. е.

вероятность того, что реакция

Вероятность того, что следующей реакцией будет диссоциация димера AB , равна всего 1 минус это число. Таким образом, с этими двумя вероятностями мы либо образуем димер, уменьшая и на единицу и увеличить на единицу, или диссоциируем димер и увеличиваем и на единицу и уменьшить по одному.

Теперь мы оба продвинули время до t + δ t и выполнили одну реакцию. Алгоритм Гиллеспи просто повторяет эти два шага столько раз, сколько необходимо, чтобы моделировать систему так долго, как мы хотим (т. е. для такого количества реакций). Результат моделирования Гиллеспи, который начинается с и при t =0, и где и , показано справа. Для этих значений параметров в среднем имеется 8 димеры и 2 из A и B , но из-за небольшого числа молекул колебания вокруг этих значений велики. Алгоритм Гиллеспи часто используется для изучения систем, где эти флуктуации важны.

Это был всего лишь простой пример с двумя реакциями. Более сложные системы с большим количеством реакций обрабатываются таким же образом. Все скорости реакций должны рассчитываться на каждом временном шаге, и одна из них выбирается с вероятностью, равной ее дробному вкладу в скорость. Затем время увеличивается, как в этом примере.

Стохастическая самосборка [ править ]

Модель Гарда описывает самосборку липидов в агрегаты. С помощью стохастического моделирования показано появление множества типов агрегатов и их эволюция.

Ссылки [ править ]

  1. ^ Гиллеспи, Дэниел Т. (1 мая 2007 г.). «Стохастическое моделирование химической кинетики» . Ежегодный обзор физической химии . 58 (1): 35–55. Бибкод : 2007ARPC...58...35G . doi : 10.1146/annurev.physchem.58.032806.104637 . ISSN   0066-426X . ПМИД   17037977 .

Дальнейшее чтение [ править ]

Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b1b6c53a0d683e00e627229232605414__1717458840
URL1:https://arc.ask3.ru/arc/aa/b1/14/b1b6c53a0d683e00e627229232605414.html
Заголовок, (Title) документа по адресу, URL1:
Gillespie algorithm - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)