ПробОнто
ПробОнто | |
---|---|
![]() | |
Ключевые слова | Статистика , Распределение вероятностей |
Цель | Проектируйте, внедряйте и поддерживайте базу знаний и онтологию вероятностных распределений. |
Продолжительность | 2015 – |
Веб-сайт | пробонто |
ProbOnto — база знаний и онтология вероятностных распределений . [1] [2] ProbOnto 2.5 (выпущен 16 января 2017 г.) содержит более 150 одно- и многомерных распределений и альтернативных параметризаций, более 220 связей и формул повторной параметризации, поддерживая также кодирование эмпирических и одномерных смешанных распределений .
Введение
[ редактировать ]Изначально ProbOnto был разработан для облегчения кодирования моделей нелинейных смешанных эффектов и их аннотаций на языке разметки фармакометрики (PharmML). [3] [4] разработан ДДМоРе, [5] [6] проект «Инициатива по инновационным лекарственным средствам» . Однако ProbOnto благодаря своей общей структуре может применяться на других платформах и инструментах моделирования для кодирования и аннотирования различных моделей, применимых к дискретным (например, счетным , категориальным и времени до события ) и непрерывным данным.
База знаний
[ редактировать ]
В базе знаний для каждого дистрибутива хранятся:
- Плотность вероятности или массы функции и, где возможно, кумулятивное распределение , опасности и выживания . функции
- Связанные величины, такие как среднее значение, медиана, мода и дисперсия.
- Определения параметров и поддержки /диапазона, а также тип распределения.
- LaTeX и R для математических функций. Код
- Определение модели и ссылки.
Отношения
[ редактировать ]ProbOnto хранит в версии 2.5 более 220 связей между одномерными распределениями с повторной параметризацией в качестве особого случая, см. рисунок. Хотя в литературе этой формой отношений часто пренебрегают, и авторы концентрируют одну конкретную форму для каждого дистрибутива, они имеют решающее значение с точки зрения совместимости. ProbOnto фокусируется на этом аспекте и предлагает более 15 дистрибутивов с альтернативными параметризациями.
Альтернативные параметризации
[ редактировать ]Многие распределения определяются математически эквивалентными, но алгебраически разными формулами. Это приводит к проблемам при обмене моделями между программными инструментами. [7] Следующие примеры иллюстрируют это.
Нормальное распределение
[ редактировать ]Нормальное распределение можно определить как минимум тремя способами.
- Normal1(μ,σ) со средним значением µ и стандартным отклонением σ [8]
- Normal2(μ,y) со средним значением μ и дисперсией y = σ^2 [9] или
Формулы повторной параметризации
[ редактировать ]Следующие формулы можно использовать для перерасчета трех различных форм нормального распределения (мы используем сокращения, т.е. вместо и т. д.)
Логнормальное распределение
[ редактировать ]В случае логнормального распределения вариантов больше. Это связано с тем, что его можно параметризовать параметрами в натуральном и логарифмическом масштабе, см. рисунок.


Доступные формы в ProbOnto 2.0:
- LogNormal1(μ,σ) со средним значением μ и стандартным отклонением σ, оба в логарифмической шкале. [8]
- LogNormal2(μ,y) со средним значением μ и дисперсией y, оба в логарифмическом масштабе.
- LogNormal3(m,σ) с медианой m в естественном масштабе и стандартным отклонением σ в логарифмическом масштабе. [8]
- LogNormal4(m,cv) с медианой m и коэффициентом вариации cv, оба в естественном масштабе.
- LogNormal5(μ,τ) со средним значением μ и точностью τ, оба в логарифмическом масштабе. [12]
- LogNormal6(m,σg ) с медианой m и геометрическим стандартным отклонением σg , оба в естественном масштабе. [13]
- LogNormal7(μ N ,σ N ) со средним значением μ N и стандартным отклонением σ N в естественной шкале. [14]
В базе знаний ProbOnto хранятся такие формулы повторной параметризации, чтобы обеспечить правильный перевод моделей между инструментами.
Примеры повторной параметризации
[ редактировать ]Рассмотрим ситуацию, когда хотелось бы запустить модель с использованием двух разных оптимальных инструментов проектирования, например PFIM. [15] и ПопЭД. [16] Первый поддерживает параметризацию LN2, второй LN7 соответственно. Поэтому требуется повторная параметризация, иначе два инструмента дадут разные результаты.
Для перехода следующие формулы имеют место .
Для перехода следующие формулы имеют место .
Все остальные формулы перепараметризации можно найти в спецификации на сайте проекта. [2]
Онтология
[ редактировать ]База знаний строится на основе простой онтологической модели. По своей сути распределение вероятностей представляет собой экземпляр своего класса, специализацию класса математических объектов. Распределение относится к ряду других индивидуумов, которые являются экземплярами различных категорий в онтологии. Например, это параметры и связанные с ними функции, связанные с заданным распределением вероятностей. Эта стратегия обеспечивает богатое представление атрибутов и связей между объектами предметной области. Онтологию можно рассматривать как концептуальную схему в области математики, и она реализована как база знаний PowerLoom. [17] Версия OWL создается программно с использованием Jena API. [18]
Результаты ProbOnto предоставляются в качестве дополнительных материалов и публикуются на веб-сайте probonto.org или ссылаются на него. Версия ProbOnto для OWL доступна через службу поиска онтологии (OLS). [19] для облегчения простого поиска и визуализации контента. Кроме того, API OLS предоставляет методы для программного доступа к ProbOnto и его интеграции в приложения. ProbOnto также зарегистрирован на портале BioSharing. [20]
ПробОнто в PharmML
[ редактировать ]Интерфейс PharmML предоставляется в виде общей схемы XML для определения распределений и их параметров. Доступ к определяющим функциям, таким как функция плотности вероятности (PDF), функция массы вероятности (PMF), функция риска (HF) и функция выживания (SF), можно получить с помощью методов, предусмотренных в схеме PharmML.
Используйте пример
[ редактировать ]В этом примере показано, как распределение Пуассона с нулевым расширением кодируется с использованием его кодового имени и объявления его параметров («rate» и «probabilityOfZero»). Параметрам модели Lambda и P0 присвоены кодовые имена параметров.
<Distribution>
<po:ProbOnto name="ZeroInflatedPoisson1">
<po:Parameter name="rate">
<ct:Assign>
<ct:SymbRef symbIdRef="Lambda" />
</ct:Assign>
</po:Parameter>
<po:Parameter name="probabilityOfZero">
<ct:Assign>
<ct:SymbRef symbIdRef="P0" />
</ct:Assign>
</po:Parameter>
</po:ProbOnto>
</Distribution>
Чтобы однозначно указать любой данный дистрибутив с помощью ProbOnto, достаточно объявить его кодовое имя и кодовые имена его параметров. Больше примеров и подробную спецификацию можно найти на сайте проекта. [2]
См. также
[ редактировать ]- Список вероятностных распределений
- Онтология (информатика)
- Отношения между распределениями вероятностей
- Язык веб-онтологии
Ссылки
[ редактировать ]- ^ Сват, MJ; Гренон, П; Вималаратне, С (2016). «ProbOnto: онтология и база знаний вероятностных распределений» . Биоинформатика . 32 : 2719. doi : 10.1093/биоинформатика/btw170 . ПМК 5013898 . ПМИД 27153608 .
- ^ Перейти обратно: а б с Основной сайт проекта, URL: http://probonto.org.
- ^ Сват MJ. и др. (2015). Язык разметки фармакометрики (PharmML): открытие новых перспектив для обмена моделями при разработке лекарств. CPT Pharmacometrics Syst Pharmacol, 4(6):316-9.
- ^ Веб-сайт PharmML, URL: http://pharmml.org.
- ^ Веб-сайт проекта DDMoRe, URL: http://ddmore.eu.
- ^ Описание ProbOnto на веб-сайте DDMoRe, URL: http://ddmore.eu/probonto .
- ^ ЛеБауэр Д.С. и др. Перевод функций плотности вероятности: от R к BUGS и обратно, R Journal, 2013.
- ^ Перейти обратно: а б с Форбс и др. Распределение вероятностей (2011), John Wiley & Sons, Inc.
- ^ Wolfram Mathworld, URL: http://mathworld.wolfram.com/NormalDistribution.html
- ^ Пакет R «LaplacesDemon», URL: http://search.r-project.org/library/LaplacesDemon/html/dist.Normal.Precision.html
- ^ Сайерт Р.М., М.Х. ДеГрут, Байесовский анализ и неопределенность в экономике (1987), TheoryRowman & Littlefield
- ^ Ланн, Д. (2012). Книга BUGS: практическое введение в байесовский анализ. Тексты в статистическая наука. ЦРК Пресс.
- ^ Лимперт, Э., Стахел, Вашингтон, и Эббт, М. (2001). Логнормальные распределения в науках: ключи и подсказки. BioScience, 51(5):341-352.
- ^ Нюберг Дж. и др. (2012) PopED - расширенный, распараллеленный инструмент оптимального проектирования для совокупности. Программы вычислительных методов Биомедицина; 108(2):789-805. doi: 10.1016/j.cmpb.2012.05.005
- ^ Retout S, Duffull S, Mentré F (2001)Разработка и внедрение информационной матрицы Фишера для популяции для оценки фармакокинетических дизайнов популяции. Комп Мет Про Биомед 65:141–151
- ^ Команда разработчиков PopED (2016). Руководство PopED, версия 2.13. Технический отчет, Уппсальский университет.
- ^ МакГрегор Р. и др. (1997) Руководство по ткацкому станку. ISI, Университет Южной Калифорнии, Марина дель Рей.
- ^ Макбрайд Б. (2001) Йена: реализация модели RDF и спецификации синтаксиса. В: СемВеб.
- ^ ProbOnto в службе поиска онтологий, URL: http://www.ebi.ac.uk/ols/ontologies/probonto
- ^ ProbOnto в BioSharing, базе данных биологических баз данных, URL: https://biosharing.org/biodbcore-000772.
Внешние ссылки
[ редактировать ]- Официальный сайт
- Диаграмма Лимиса
- Ultimate Univariate Probability Distribution Explorer – скорее всего, самая большая бесплатная коллекция одномерных распределений и их функций.
- UncertML