Jump to content

Кофенетическая корреляция

В статистике , и особенно в биостатистике , кофенетическая корреляция [1] (точнее, кофенетический коэффициент корреляции ) является мерой того, насколько точно дендрограмма сохраняет попарные расстояния между исходными немоделированными точками данных. Хотя он наиболее широко применяется в области биостатистики (обычно для оценки кластерных моделей последовательностей ДНК или других таксономических моделей), его также можно использовать в других областях исследований, где необработанные данные имеют тенденцию собираться в группы или кластеры. [2] Этот коэффициент также был предложен для использования в качестве теста для вложенных кластеров. [3]

Расчет коэффициента кофенетической корреляции

[ редактировать ]

Предположим, что исходные данные { X i } были смоделированы с использованием метода кластеров для создания дендрограммы { T i }; то есть упрощенная модель, в которой «близкие» данные сгруппированы в иерархическое дерево. Определите следующие меры расстояния.

  • , евклидово расстояние между i -м и j -м наблюдениями.
  • , дендрограмматическое расстояние между точками модели и . Это расстояние представляет собой высоту узла, на котором эти две точки впервые соединяются вместе.

Затем, позволив быть средним значением x ( i , j ), и позволяя быть средним значением t ( i , j ), кофенетический коэффициент корреляции c определяется выражением [4]

Программная реализация

[ редактировать ]

можно Вычислить кофенетическую корреляцию в R с помощью пакета dendextend R. [5]

В Python пакет SciPy также имеет реализацию. [6]

В MATLAB набор инструментов Statistic and Machine Learning содержит реализацию. [7]

См. также

[ редактировать ]
  1. ^ Сокаль, Р.Р. и Ф.Дж. Рольф. 1962. Сравнение дендрограмм объективными методами. Таксон, 11:33-40
  2. ^ Дорте Б. Карр, Крис Дж. Янг, Ричард К. Астер и Сяоабинг Чжан, Кластерный анализ для мониторинга сейсмических событий ДВЗЯИ (исследование, подготовленное для Министерства энергетики США )
  3. ^ Рольф, Ф.Дж. и Дэвид Л. Фишер. 1968. Тест на иерархическую структуру в наборах случайных данных. Систематический зоол., 17:407-412 ( ссылка )
  4. ^ Набор инструментов статистики Mathworks
  5. ^ «Введение в дендекстенд» .
  6. ^ «scipy.cluster.hierarchy.cophenet — Справочное руководство SciPy v0.14.0» . docs.scipy.org . Проверено 11 июля 2019 г.
  7. ^ «Кофенетический коэффициент корреляции — кофенет MATLAB» .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1031ddaa4d7dfe2f3459cef487367c2f__1711030920
URL1:https://arc.ask3.ru/arc/aa/10/2f/1031ddaa4d7dfe2f3459cef487367c2f.html
Заголовок, (Title) документа по адресу, URL1:
Cophenetic correlation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)