~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ 9CDC9FA91BF15F464490BB059847C875__1711932420 ✰
Заголовок документа оригинал.:
✰ Non-negative matrix factorization - Wikipedia ✰
Заголовок документа перевод.:
✰ Неотрицательная матричная факторизация — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Non-negative_matrix_factorization ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/9c/75/9cdc9fa91bf15f464490bb059847c875.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/9c/75/9cdc9fa91bf15f464490bb059847c875__translat.html ✰
Дата и время сохранения документа:
✰ 22.06.2024 01:20:53 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 1 April 2024, at 03:47 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Неотрицательная матричная факторизация — Википедия Jump to content

Неотрицательная матричная факторизация

Из Википедии, бесплатной энциклопедии
Иллюстрация приблизительной факторизации неотрицательной матрицы: матрица V представлена ​​двумя меньшими матрицами W и H , которые при умножении приблизительно V. восстанавливают

Факторизация неотрицательной матрицы ( NMF или NNMF ), а также аппроксимация неотрицательной матрицы [1] [2] — это группа алгоритмов многомерного анализа и линейной алгебры где матрица V разлагается , на (обычно) две матрицы W и H со свойством, что все три матрицы не имеют отрицательных элементов. Эта неотрицательность облегчает проверку полученных матриц. Кроме того, в таких приложениях, как обработка аудиоспектрограмм или мышечной активности, рассматриваемым данным присуща неотрицательность. Поскольку в целом задача не является точно решаемой, ее обычно аппроксимируют численно.

NMF находит применение в таких областях, как астрономия , [3] [4] компьютерное зрение , кластеризация документов , [1] вменение недостающих данных , [5] хемометрика , обработка аудиосигналов , рекомендательные системы , [6] [7] и биоинформатика . [8]

История [ править ]

В хемометрике факторизация неотрицательной матрицы имеет долгую историю под названием «разрешение кривой самомоделирования». [9] В этой схеме векторы в правой матрице представляют собой непрерывные кривые, а не дискретные векторы. Также ранняя работа по факторизации неотрицательных матриц была выполнена финской группой исследователей в 1990-х годах под названием факторизация положительной матрицы . [10] [11] [12] Он стал более широко известен как факторизация неотрицательной матрицы после того, как Ли и Сын исследовали свойства алгоритма и опубликовали несколько простых и полезных алгоритмы двух типов факторизаций. [13] [14]

Предыстория [ править ]

Пусть матрица V является произведением матриц W и H ,

Умножение матриц может быть реализовано как вычисление векторов-столбцов V как линейных комбинаций векторов-столбцов в W с использованием коэффициентов, предоставленных столбцами H . То есть каждый столбец V можно вычислить следующим образом:

где v i - i-й вектор - столбец матрицы произведения V , а h i - i -й вектор-столбец матрицы H .

При перемножении матриц размеры факторных матриц могут быть существенно меньше, чем размерности продуктовой матрицы, и именно это свойство лежит в основе НМФ. NMF генерирует факторы со значительно уменьшенными размерностями по сравнению с исходной матрицей. Например, если V матрица размера m × n , W матрица размера m × p , а H матрица размера p × n , то p может быть значительно меньше, чем m и n .

Вот пример, основанный на приложении для интеллектуального анализа текста:

  • Пусть входная матрица (матрица, подлежащая факторингу) будет V с 10 000 строк и 500 столбцами, где слова находятся в строках, а документы - в столбцах. То есть у нас есть 500 документов, проиндексированных по 10000 слов. Отсюда следует, что вектор-столбец v в V представляет документ.
  • Предположим, мы просим алгоритм найти 10 признаков, чтобы сгенерировать матрицу признаков W с 10 000 строк и 10 столбцами и матрицу коэффициентов H с 10 строками и 500 столбцами.
  • Произведение W и H представляет собой матрицу из 10 000 строк и 500 столбцов, той же формы, что и входная матрица V , и, если факторизация сработала, это разумное приближение к входной V. матрице
  • Из приведенного выше рассмотрения матричного умножения следует, что каждый столбец в матрице произведений WH представляет собой линейную комбинацию 10 векторов-столбцов в матрице признаков W с коэффициентами, предоставленными матрицей коэффициентов H .

Этот последний пункт является основой NMF, поскольку мы можем рассматривать каждый исходный документ в нашем примере как созданный из небольшого набора скрытых функций. NMF генерирует эти функции.

Полезно рассматривать каждый признак (вектор-столбец) в матрице признаков W как архетип документа, содержащий набор слов, где значение ячейки каждого слова определяет ранг слова в признаке: чем выше значение ячейки слова, тем выше ранг слова. в функции. Столбец в матрице коэффициентов H представляет исходный документ со значением ячейки, определяющим ранг документа по признаку. Теперь мы можем восстановить документ (вектор-столбец) из нашей входной матрицы с помощью линейной комбинации наших признаков (векторов-столбцов в W где каждый признак взвешивается по значению ячейки признака из столбца документа в H. ) ,

Свойство кластеризации [ править ]

NMF обладает присущим свойством кластеризации, [15] т.е. он автоматически кластеризует столбцы входных данных .

Точнее, приближение к достигается путем нахождения и минимизирующие функцию ошибок (с использованием нормы Фробениуса )

при условии ,

Если мы, кроме того, наложим ограничение ортогональности на , т.е. , то описанная выше минимизация математически эквивалентна минимизации кластеризации K-средних . [15]

Кроме того, вычисленное дает принадлежность к кластеру, т. е. если для всех i k это говорит о том, что входные данные принадлежит -й кластер. Вычисленное дает центроиды кластера, т.е. -th столбец дает центр тяжести кластера -й кластер. Представление этого центроида может быть значительно улучшено с помощью выпуклого NMF.

Когда ограничение ортогональности не налагается явно, ортогональность сохраняется в значительной степени, а также сохраняется свойство кластеризации.

Когда используемая функция ошибок представляет собой расхождение Кульбака-Лейблера , NMF идентичен вероятностному скрытому семантическому анализу (PLSA), популярному методу кластеризации документов. [16]

Типы [ править ]

неотрицательной Приблизительная матрицы факторизация

Обычно количество столбцов W и количество строк H в NMF выбираются так, чтобы произведение WH стало приближением к V . Полное разложение V тогда составит две неотрицательные матрицы W и H а также остаток U , такой, что: V = WH + U. , Элементы остаточной матрицы могут быть как отрицательными, так и положительными.

Когда W и H меньше V, их становится легче хранить и манипулировать ими. Другая причина факторизации V на меньшие матрицы W и H заключается в том, что если цель состоит в том, чтобы приблизительно представить элементы V с помощью значительно меньшего количества данных, тогда необходимо вывести некоторую скрытую структуру в данных.

неотрицательной выпуклой матрицы Факторизация

В стандартном NMF матричный коэффициент W R + м × к , т. е. W может быть чем угодно в этом пространстве. Выпуклый НМФ [17] ограничивает столбцы W выпуклыми комбинациями векторов входных данных . Это значительно улучшает качество представления W. данных Более того, результирующий матричный фактор H становится более разреженным и ортогональным.

ранговая факторизация Неотрицательная

В случае, если ранг V неотрицательный равен его фактическому рангу, V = WH называется факторизацией неотрицательного ранга (NRF). [18] [19] [20] Задача нахождения NRF V , если она существует, как известно, NP-трудна. [21]

функции стоимости регуляризации Различные и

Существуют различные типы факторизации неотрицательных матриц. Различные типы возникают из-за использования разных функций стоимости для измерения расхождения между V и WH и, возможно, из-за W и / или H. регуляризации матриц [1]

Две простые функции дивергенции, изученные Ли и Сыном, - это квадрат ошибки (или норма Фробениуса ) и расширение дивергенции Кульбака-Лейблера на положительные матрицы (исходная дивергенция Кульбака-Лейблера определяется на вероятностных распределениях). Каждое расхождение приводит к использованию другого алгоритма NMF, который обычно минимизирует расхождение с помощью правил итеративного обновления.

Проблема факторизации в версии NMF с квадратичной ошибкой может быть сформулирована как: Дана матрица найти неотрицательные матрицы W и H, минимизирующие функцию

Другой тип НМП для изображений основан на общей норме вариации . [22]

Когда регуляризация L1 (сродни Lasso ) добавляется к NMF с функцией стоимости среднеквадратической ошибки, получающуюся проблему можно назвать неотрицательным разреженным кодированием из -за сходства с разреженного кодирования : проблемой [23] [24] хотя его еще можно называть NMF. [25]

Онлайн НМФ [ править ]

Многие стандартные алгоритмы NMF анализируют все данные вместе; т. е. вся матрица доступна с самого начала. Это может быть неудовлетворительно в приложениях, где слишком много данных не помещается в память, или где данные передаются в потоковом режиме. Одним из таких вариантов использования является совместная фильтрация в системах рекомендаций , где может быть много пользователей и много элементов, которые можно рекомендовать, и было бы неэффективно пересчитывать все, когда в систему добавляется один пользователь или один элемент. Функция стоимости оптимизации в этих случаях может быть такой же, как для стандартного NMF, а может и не быть, но алгоритмы должны быть совершенно другими. [26] [27]

Сверточный NMF [ править ]

Если столбцы V представляют данные, выбранные по пространственным или временным измерениям, например сигналы времени, изображения или видео, функции, которые являются эквивариантными относительно сдвигов по этим измерениям, могут быть изучены с помощью сверточного NMF. В этом случае W является разреженным со столбцами, имеющими локальные окна ненулевого веса, которые являются общими для сдвигов по пространственно-временным измерениям V , представляя ядра свертки . Путем пространственно-временного объединения H и многократного использования полученного представления в качестве входных данных для сверточного NMF можно изучить глубокие иерархии функций. [28]

Алгоритмы [ править ]

Есть несколько способов найти W и H Ли и Сына. : правило мультипликативного обновления [14] стал популярным методом из-за простоты реализации. Этот алгоритм:

инициализировать: W и H неотрицательные.
Затем обновите значения в W и H , вычислив следующее: как индекс итерации.
и
Пока W и H не станут стабильными.

Обратите внимание, что обновления выполняются поэлементно, а не умножением матриц.

Отметим, что мультипликативные множители для W и H , т.е. и члены являются матрицами единиц , когда .

Совсем недавно были разработаны другие алгоритмы. Некоторые подходы основаны на чередовании неотрицательных наименьших квадратов : на каждом шаге такого алгоритма сначала H фиксируется и W находится с помощью решателя неотрицательных наименьших квадратов, затем W фиксируется и H находится аналогичным образом. Процедуры, используемые для решения W и H, могут быть одинаковыми. [29] или другое, поскольку некоторые варианты NMF регуляризируют один из W и H . [23] Конкретные подходы включают методы прогнозируемого градиентного спуска , [29] [30] метод активного набора , [6] [31] оптимальный градиентный метод, [32] и метод поворота принципала блока [33] среди нескольких других. [34]

Текущие алгоритмы неоптимальны, поскольку они гарантируют нахождение только локального, а не глобального минимума функции стоимости. Доказуемо оптимальный алгоритм вряд ли появится в ближайшем будущем, поскольку было показано, что эта проблема обобщает задачу кластеризации k-средних, которая, как известно, является NP-полной . [35] Однако, как и во многих других приложениях интеллектуального анализа данных, локальный минимум может оказаться полезным.

Помимо этапа оптимизации, существенное влияние на NMF оказывает инициализация. Начальные значения, выбранные для W и H, могут влиять не только на скорость сходимости, но и на общую ошибку сходимости. Некоторые варианты инициализации включают полную рандомизацию, SVD , кластеризацию k-средних и более продвинутые стратегии, основанные на этой и других парадигмах. [36]

Графики дробной остаточной дисперсии (FRV) для PCA и последовательного NMF; [4] для PCA теоретические значения представляют собой вклад остаточных собственных значений. Для сравнения, кривые FRV для PCA достигают плоского плато, на котором сигнал не улавливается эффективно; в то время как кривые NMF FRV постоянно снижаются, что указывает на лучшую способность улавливать сигнал. Кривые FRV для NMF также сходятся к более высоким уровням, чем для PCA, что указывает на меньшую переобучение свойства NMF.

Последовательный NMF [ править ]

Последовательное построение компонентов NMF ( W и H ) впервые использовалось для связи NMF с анализом главных компонентов (PCA) в астрономии. [37] Вклад компонентов PCA ранжируется по величине соответствующих им собственных значений; для НМФ его компоненты можно ранжировать эмпирически, когда они строятся поочередно (последовательно), т.е. изучая -й компонент с первым построенные компоненты.

Вклад последовательных компонентов NMF можно сравнить с теоремой Карунена-Лёва , применением PCA, используя график собственных значений. Типичный выбор количества компонентов с помощью PCA основан на точке «колена», затем наличие плоского плато указывает на то, что PCA не обеспечивает эффективный сбор данных, и, наконец, происходит внезапное падение, отражающее захват случайных данных. шумит и попадает в режим переобучения. [38] [39] Для последовательного NMF график собственных значений аппроксимируется графиком кривых дробной остаточной дисперсии, где кривые непрерывно уменьшаются и сходятся к более высокому уровню, чем PCA, [4] что является показателем меньшего переобучения последовательного NMF.

Точный NMF [ править ]

Точные решения для вариантов NMF можно ожидать (за полиномиальное время), когда для матрицы V выполняются дополнительные ограничения . Алгоритм с полиномиальным временем для решения факторизации неотрицательного ранга, если V содержит мономиальную подматрицу ранга, равного ее рангу, был предложен Кэмпбеллом и Пулом в 1981 году. [40] Калофолиас и Галлопулос (2012) [41] решил симметричный аналог этой задачи, где V симметричен и содержит диагональную главную подматрицу ранга r. Их алгоритм работает за O(rm 2 ) время в плотном случае. Арора, Ге, Халперн, Мимно, Мойтра, Зонтаг, Ву и Чжу (2013) предлагают алгоритм полиномиального времени для точного NMF, который работает в случае, когда один из факторов W удовлетворяет условию разделимости. [42]

Связь с другими методами [ править ]

В изучении частей объектов путем неотрицательной матричной факторизации Ли и Сын [43] предложил NMF в основном для разложения изображений по частям. Он сравнивает NMF с векторным квантованием и анализом главных компонент и показывает, что, хотя эти три метода могут быть записаны как факторизация, они реализуют разные ограничения и, следовательно, дают разные результаты.

NMF как вероятностная графическая модель: видимые единицы ( V ) связаны со скрытыми единицами ( H ) через веса W , так что V генерируется из распределения вероятностей со средним значением . [13] : 5 

Позже было показано, что некоторые типы NMF являются примером более общей вероятностной модели, называемой «мультиномиальный PCA». [44] Когда NMF получается путем минимизации расхождения Кульбака-Лейблера , это фактически эквивалентно другому примеру полиномиального PCA, вероятностному скрытому семантическому анализу . [45] обучено методом оценки максимального правдоподобия . Этот метод обычно используется для анализа и кластеризации текстовых данных, а также связан с моделью скрытых классов .

NMF с целью метода наименьших квадратов эквивалентен смягченной форме кластеризации K-средних : матричный фактор W содержит центроиды кластера, а H содержит индикаторы членства в кластере. [15] [46] Это обеспечивает теоретическую основу для использования NMF для кластеризации данных. Однако k-means не обеспечивает неотрицательность своих центроидов, поэтому ближайшая аналогия фактически связана с «полу-NMF». [17]

NMF можно рассматривать как двухслойную направленную графическую модель с одним слоем наблюдаемых случайных величин и одним слоем скрытых случайных величин. [47]

NMF выходит за рамки матриц до тензоров произвольного порядка. [48] [49] [50] Это расширение можно рассматривать как неотрицательный аналог, например, модели PARAFAC .

Другие расширения NMF включают совместную факторизацию нескольких матриц данных и тензоров, где некоторые факторы являются общими. Такие модели полезны для слияния датчиков и реляционного обучения. [51]

NMF — это пример неотрицательного квадратичного программирования , как и машина опорных векторов (SVM). Однако SVM и NMF связаны на более глубоком уровне, чем NQP, что позволяет напрямую применять алгоритмы решения, разработанные для любого из двух методов, к проблемам в обеих областях. [52]

Уникальность [ править ]

Факторизация не уникальна: матрицу и обратную ей матрицу можно использовать для преобразования двух матриц факторизации, например, [53]

Если две новые матрицы и неотрицательны , они образуют другую параметризацию факторизации.

Неотрицательность и применяется, по крайней мере, если B является неотрицательной мономиальной матрицей . В этом простом случае это будет соответствовать масштабированию и перестановке .

Больше контроля над неуникальностью NMF достигается с помощью ограничений разреженности. [54]

Приложения [ править ]

Астрономия [ править ]

В астрономии NMF является многообещающим методом уменьшения размерности в том смысле, что астрофизические сигналы неотрицательны. NMF был применен к спектроскопическим наблюдениям. [55] [3] и прямые визуализирующие наблюдения [4] как метод изучения общих свойств астрономических объектов и последующей обработки астрономических наблюдений. Достижения в области спектроскопических наблюдений Блэнтона и Роуэйса (2007). [3] учитывает неопределенности астрономических наблюдений, что позже улучшено Чжу (2016) [37] где также учитываются недостающие данные и параллельные вычисления включены . Их метод затем был принят Ren et al. (2018) [4] к области прямой визуализации как одному из методов обнаружения экзопланет , особенно для прямой визуализации околозвездных дисков .

Рен и др. (2018) [4] способны доказать устойчивость компонентов НМФ при их последовательном построении (т.е. один за другим), что обеспечивает линейность процесса моделирования НМФ; Свойство линейности используется для разделения звездного света и света, рассеянного экзопланетами и околозвездными дисками .

При прямых изображениях, чтобы выявить слабые экзопланеты и околозвездные диски из ярких окружающих звездных огней, типичный контраст которых составляет от 10⁵ до 10¹⁰, были приняты различные статистические методы. [56] [57] [38] однако свет от экзопланет или околозвездных дисков обычно переоценен, поэтому для восстановления истинного потока приходится применять прямое моделирование. [58] [39] Прямое моделирование в настоящее время оптимизировано для точечных источников. [39] однако не для протяженных источников, особенно для структур неправильной формы, таких как околозвездные диски. В этой ситуации NMF оказался отличным методом, поскольку он менее подгоняется в смысле неотрицательности и разреженности коэффициентов моделирования NMF, поэтому прямое моделирование может выполняться с несколькими коэффициентами масштабирования. [4] вместо трудоемкого повторного сокращения данных в сгенерированных моделях.

Вменение данных [ править ]

Чтобы включить недостающие данные в статистику, NMF может взять недостающие данные, минимизируя при этом свою функцию стоимости, вместо того, чтобы рассматривать эти недостающие данные как нули. [5] Это делает его математически проверенным методом вменения данных в статистике. [5] Доказав сначала, что недостающие данные игнорируются в функции стоимости, а затем доказав, что влияние отсутствующих данных может быть столь же малым, как эффект второго порядка, Рен и др. (2020) [5] изучил и применил такой подход в области астрономии. Их работа сосредоточена на двумерных матрицах, в частности, она включает математический вывод, расчет смоделированных данных и применение к данным, полученным на небе.

Процедура вменения данных с помощью NMF может состоять из двух этапов. Во-первых, когда компоненты NMF известны, Ren et al. (2020) доказали, что влияние отсутствующих данных во время вменения данных («целевое моделирование» в их исследовании) является эффектом второго порядка. Во-вторых, когда компоненты NMF неизвестны, авторы доказали, что влияние отсутствующих данных во время создания компонента представляет собой эффект первого-второго порядка.

В зависимости от способа получения компонентов NMF первый этап, описанный выше, может быть независимым или зависимым от второго. Кроме того, качество вменения может быть повышено при использовании большего количества компонентов NMF, см. рисунок 4 Ren et al. (2020) за иллюстрации. [5]

Анализ текста [ править ]

NMF можно использовать для приложений интеллектуального анализа текста . В этом процессе терминов документа строится матрица с весами различных терминов (обычно взвешенная информация о частоте слов) из набора документов. Эта матрица разбивается на матрицу термина-признака и матрицу признака-документа . Характеристики извлекаются из содержимого документов, а матрица признаков-документов описывает кластеры данных связанных документов.

В одном конкретном приложении иерархический NMF использовался для небольшого подмножества научных рефератов из PubMed . [59] Другая исследовательская группа сгруппировала части Enron. набора данных электронной почты [60] с 65 033 сообщениями и 91 133 терминами в 50 кластерах. [61] NMF также применялся к данным о цитировании: в одном из примеров кластеризация английской Википедии статей и научных журналов основывалась на исходящих научных цитатах в английской Википедии. [62]

Арора, Ге, Халперн, Мимно, Мойтра, Зонтаг, Ву и Чжу (2013) предложили алгоритмы с полиномиальным временем для изучения тематических моделей с использованием NMF. Алгоритм предполагает, что тематическая матрица удовлетворяет условию разделимости, которое часто выполняется в таких условиях. [42]

Хассани, Иранманеш и Мансури (2019) предложили метод агломерации признаков для матриц терминов-документов, который работает с использованием NMF. Алгоритм уменьшает матрицу термин-документ до меньшей матрицы, более подходящей для кластеризации текста. [63]

данных анализ Спектральный

NMF также используется для анализа спектральных данных; одно из таких применений - классификация космических объектов и мусора. [64]

расстояния в предсказание Масштабируемое Интернете

NMF применяется для масштабируемого прогнозирования расстояния в Интернете (времени прохождения туда и обратно). Для сети с хозяева, с помощью НМФ, расстояния всех сквозные ссылки можно предсказать после проведения только измерения. Этот метод был впервые представлен в Интернете. Служба дистанционной оценки (IDES). [65] Впоследствии, в качестве полностью децентрализованного подхода, сетевая система координат Phoenix [66] предлагается. Он обеспечивает лучшую общую точность прогнозирования за счет введения концепции веса.

Нестационарное шумоподавление речи [ править ]

Подавление шума речи было давней проблемой при обработке аудиосигнала . Существует множество алгоритмов шумоподавления, если шум стационарен. Например, фильтр Винера подходит для аддитивного гауссовского шума . Однако, если шум нестационарен, классические алгоритмы шумоподавления обычно имеют плохую производительность, поскольку статистическую информацию о нестационарном шуме трудно оценить. Шмидт и др. [67] используйте NMF для шумоподавления речи в условиях нестационарного шума, что полностью отличается от классических статистических подходов. Основная идея заключается в том, что чистый речевой сигнал может быть редко представлен речевым словарем, а нестационарный шум — нет. Аналогичным образом, нестационарный шум также может быть разреженно представлен словарем шума, а речь - нет.

Алгоритм шумоподавления NMF выглядит следующим образом. Два словаря, один для речи и один для шума, необходимо обучать в автономном режиме. После произнесения зашумленной речи мы сначала вычисляем величину кратковременного преобразования Фурье. Во-вторых, разделите его на две части с помощью NMF: одна может быть редко представлена ​​речевым словарем, а другая часть может быть редко представлена ​​шумовым словарем. В-третьих, та часть, которая представлена ​​речевым словарем, будет оцененной чистой речью.

Популяционная генетика

Разреженный NMF используется в популяционной генетике для оценки индивидуальных коэффициентов примеси, обнаружения генетических кластеров особей в выборке популяции или оценки генетической примеси в выбранных геномах. При генетической кластеризации человека алгоритмы NMF дают оценки, аналогичные оценкам компьютерной программы STRUCTURE, но эти алгоритмы более эффективны в вычислительном отношении и позволяют анализировать большие наборы геномных данных населения. [68]

Биоинформатика [ править ]

NMF успешно применяется в биоинформатике для кластеризации данных об экспрессии генов и метилировании ДНК , а также для поиска генов, наиболее репрезентативных из кластеров. [24] [69] [70] [71] При анализе раковых мутаций он использовался для выявления общих закономерностей мутаций, которые встречаются при многих видах рака и, вероятно, имеют разные причины. [72] Методы NMF могут идентифицировать источники вариаций, такие как типы клеток, подтипы заболеваний, стратификация популяции, состав тканей и клональность опухолей. [73]

Конкретный вариант NMF, а именно неотрицательная матричная трехфакторизация (NMTF), [74] использовался для задач по перепрофилированию лекарств с целью прогнозирования новых белковых мишеней и терапевтических показаний для одобренных лекарств. [75] и сделать вывод о наличии пары синергичных противораковых препаратов. [76]

Ядерная визуализация

NMF, также называемый в этой области факторным анализом, используется с 1980-х годов. [77] для анализа последовательностей изображений в ОФЭКТ и ПЭТ динамической медицинской визуализации . Неуникальность NMF решалась с помощью ограничений разреженности. [78] [79] [80]

Текущее исследование [ править ]

Текущие исследования (с 2010 г.) по факторизации неотрицательных матриц включают, помимо прочего,

  1. Алгоритмический: поиск глобальных минимумов факторов и инициализация факторов. [81]
  2. Масштабируемость: как факторизовать матрицы размером миллион на миллиард, которые являются обычным явлением в интеллектуальном анализе данных в веб-масштабе, например, см. Факторизацию распределенной неотрицательной матрицы (DNMF), [82] Масштабируемая факторизация неотрицательной матрицы (ScalableNMF), [83] Распределенное стохастическое разложение по сингулярным значениям. [84]
  3. Онлайн: как обновить факторизацию при поступлении новых данных без повторных вычислений с нуля, например, см. онлайн CNSC. [85]
  4. Коллективная (совместная) факторизация: факторизация нескольких взаимосвязанных матриц для многопредставленного обучения, например многопредставленная кластеризация, см. CoNMF. [86] и МультиНМФ [87]
  5. Проблема Коэна и Ротблюма 1993 года: всегда ли рациональная матрица имеет НМФ минимальной внутренней размерности, факторы которой также рациональны. В последнее время на эту проблему ответили отрицательно. [88]

См. также [ править ]

Источники и внешние ссылки [ править ]

Примечания [ править ]

  1. ^ Перейти обратно: а б с Суврит Сра; Индерджит С. Диллон (2006). Обобщенные неотрицательные матричные аппроксимации с расходимостями Брегмана (PDF) . Достижения в области нейронных систем обработки информации. ISBN  978-0-262-23253-1 . Викиданные   Q77685465 . {{cite book}}: |journal= игнорируется ( помогите )
  2. ^ Тандон, Рашиш; Сра, Суврит (13 сентября 2010 г.). Аппроксимация разреженной неотрицательной матрицы: новые формулировки и алгоритмы (PDF) (Отчет). Институт биологической кибернетики Макса Планка. Технический отчет № 193.
  3. ^ Перейти обратно: а б с Блэнтон, Майкл Р.; Роуэйс, Сэм (2007). «К-коррекции и преобразования фильтров в ультрафиолетовом, оптическом и ближнем инфракрасном диапазонах». Астрономический журнал . 133 (2): 734–754. arXiv : astro-ph/0606170 . Бибкод : 2007AJ....133..734B . дои : 10.1086/510127 . S2CID   18561804 .
  4. ^ Перейти обратно: а б с д Это ж г Рен, Бин; Пуэйо, Лоран; Чжу, Гуантунь Б.; Дюшен, Гаспар (2018). «Неотрицательная матричная факторизация: надежное извлечение расширенных структур» . Астрофизический журнал . 852 (2): 104. arXiv : 1712.10317 . Бибкод : 2018ApJ...852..104R . дои : 10.3847/1538-4357/aaa1f2 . S2CID   3966513 .
  5. ^ Перейти обратно: а б с д Это Рен, Бин; Пуэйо, Лоран; Чен, Кристина; Шоке, Элоди; Дебес, Джон Х; Дюшен, Гаспар; Менар, Франсуа; Перрин, Маршалл Д. (2020). «Использование вменения данных для разделения сигналов в высококонтрастных изображениях» . Астрофизический журнал . 892 (2): 74. arXiv : 2001.00563 . Бибкод : 2020ApJ...892...74R . дои : 10.3847/1538-4357/ab7024 . S2CID   209531731 .
  6. ^ Перейти обратно: а б Райнер Гемулла; Эрик Нейкамп; Питер Дж. Хаас ; Яннис Сисманис (2011). Крупномасштабная матричная факторизация с распределенным стохастическим градиентным спуском . Учеб. Международная конференция ACM SIGKDD. по обнаружению знаний и интеллектуальному анализу данных. стр. 69–77.
  7. ^ Ян Бао; и другие. (2014). TopicMF: Одновременное использование рейтингов и обзоров для рекомендаций . АААИ.
  8. ^ Бен Мюррелл; и другие. (2011). «Неотрицательная матричная факторизация для изучения моделей эволюции белков, специфичных для выравнивания» . ПЛОС ОДИН . 6 (12): e28898. Бибкод : 2011PLoSO...628898M . дои : 10.1371/journal.pone.0028898 . ПМЦ   3245233 . ПМИД   22216138 .
  9. ^ Уильям Х. Лоутон ; Эдвард А. Сильвестр (1971). «Разрешение кривой самомоделирования». Технометрика . 13 (3): 617–633. дои : 10.2307/1267173 . JSTOR   1267173 .
  10. ^ Пентти Паатеро; У Таппера; Паси Аалто; Маркку Кулмала (1991). «Методы матричной факторизации для анализа данных диффузионных батарей». Журнал аэрозольной науки . 22 : С273–С276. дои : 10.1016/S0021-8502(05)80089-8 . ISSN   0021-8502 . Викиданные   Q58065673 .
  11. ^ Пентти Паатеро; У Таппера (июнь 1994 г.). «Положительная матричная факторизация: неотрицательная факторная модель с оптимальным использованием оценок ошибок значений данных» . Экологометрия . 5 (2): 111–126. дои : 10.1002/ENV.3170050203 . ISSN   1180-4009 . Викиданные   Q29308406 .
  12. ^ Пиа Анттила ; Пентти Паатеро ; У Таппера; Олли Ярвинен (1995). «Идентификация источника массовых влажных осаждений в Финляндии путем факторизации положительной матрицы». Атмосферная среда . 29 (14): 1705–1718. Бибкод : 1995AtmEn..29.1705A . дои : 10.1016/1352-2310(94)00367-Т .
  13. ^ Перейти обратно: а б Дэниел Д. Ли и Х. Себастьян Сын (1999). «Изучение частей объектов путем факторизации неотрицательной матрицы». Природа . 401 (6755): 788–791. Бибкод : 1999Natur.401..788L . дои : 10.1038/44565 . ПМИД   10548103 . S2CID   4428232 .
  14. ^ Перейти обратно: а б Дэниел Д. Ли и Х. Себастьян Сын (2001). Алгоритмы факторизации неотрицательной матрицы (PDF) . Достижения в области нейронных систем обработки информации 13: Материалы конференции 2000 года. МТИ Пресс . стр. 556–562.
  15. ^ Перейти обратно: а б с К. Дин, X. Хе, HD Саймон (2005). «Об эквивалентности неотрицательной матричной факторизации и спектральной кластеризации» . Учеб. Международная конференция SIAM. Интеллектуальный анализ данных, стр. 606–610. май 2005 г.
  16. ^ Дин С., Ли Ю, Пэн В. (2008). «Об эквивалентности неотрицательной матричной факторизации и вероятностной скрытой семантической индексации» (PDF) . Вычислительная статистика и анализ данных . 52 (8): 3913–3927. дои : 10.1016/j.csda.2008.01.011 . Архивировано из оригинала (PDF) 4 марта 2016 г.
  17. ^ Перейти обратно: а б К. Динг, Т. Ли, М. И. Джордан, Факторизация выпуклых и полунеотрицательных матриц, Транзакции IEEE по анализу шаблонов и машинному интеллекту, 32, 45-55, 2010 г.
  18. ^ Берман, А.; Р. Дж. Племмонс (1974). «Обратные неотрицательные матрицы». Линейная и полилинейная алгебра . 2 (2): 161–172. дои : 10.1080/03081087408817055 .
  19. ^ А. Берман; Р. Дж. Племмонс (1994). Неотрицательные матрицы в математических науках . Филадельфия: СИАМ.
  20. ^ Томас, LB (1974). «Задача 73-14. Ранговая факторизация неотрицательных матриц». СИАМ преп . 16 (3): 393–394. дои : 10.1137/1016064 .
  21. ^ Вавасис, С.А. (2009). «О сложности факторизации неотрицательной матрицы». СИАМ Дж. Оптим . 20 (3): 1364–1377. arXiv : 0708.4149 . дои : 10.1137/070709967 . S2CID   7150400 .
  22. ^ Чжан, Т.; Фанг, Б.; Лю, В.; Тан, ГГ; Он, Г.; Вэнь, Дж. (2008). «Факторизация неотрицательной матрицы на основе нормы полной вариации для идентификации дискриминантного представления шаблонов изображений». Нейрокомпьютинг . 71 (10–12): 1824–1831. doi : 10.1016/j.neucom.2008.01.022 .
  23. ^ Перейти обратно: а б Хойер, Патрик О. (2002). Неотрицательное разреженное кодирование . Учеб. Семинар IEEE по нейронным сетям для обработки сигналов. arXiv : cs/0202009 .
  24. ^ Перейти обратно: а б Лео Тасламан и Бьёрн Нильссон (2012). «Среда для регуляризованной неотрицательной матричной факторизации с применением к анализу данных экспрессии генов» . ПЛОС Один . 7 (11): е46331. Бибкод : 2012PLoSO...746331T . дои : 10.1371/journal.pone.0046331 . ПМЦ   3487913 . ПМИД   23133590 .
  25. ^ Се, CJ; Диллон, Исландия (2011). Методы быстрого координатного спуска с выбором переменных для факторизации неотрицательной матрицы (PDF) . Материалы 17-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных - KDD '11. п. 1064. дои : 10.1145/2020408.2020577 . ISBN  9781450308137 .
  26. ^ Фунг, Йик-Хинг; Ли, Чун-Хунг; Чунг, Уильям К. (2 ноября 2007 г.). Прогнозирование участия в онлайн-дискуссии с использованием неотрицательной матричной факторизации . Wi-Iatw '07. Компьютерное общество IEEE. стр. 284–287. ISBN  9780769530284 – через dl.acm.org.
  27. ^ Найян Гуань; Даченг Тао; Чжиган Ло и Бо Юань (июль 2012 г.). «Онлайн-факторизация неотрицательной матрицы с устойчивой стохастической аппроксимацией». Транзакции IEEE в нейронных сетях и системах обучения . 23 (7): 1087–1099. дои : 10.1109/TNNLS.2012.2197827 . ПМИД   24807135 . S2CID   8755408 .
  28. ^ Бенке, С. (2003). «Обнаружение иерархических особенностей речи с использованием сверточной неотрицательной матричной факторизации» . Материалы Международной совместной конференции по нейронным сетям, 2003 г. Том. 4. Портленд, Орегон, США: IEEE. стр. 2758–2763. дои : 10.1109/IJCNN.2003.1224004 . ISBN  978-0-7803-7898-8 . S2CID   3109867 .
  29. ^ Перейти обратно: а б Линь, Чи-Джен (2007). «Методы прогнозируемого градиента для факторизации неотрицательных матриц» (PDF) . Нейронные вычисления . 19 (10): 2756–2779. CiteSeerX   10.1.1.308.9135 . дои : 10.1162/neco.2007.19.10.2756 . ПМИД   17716011 . S2CID   2295736 .
  30. ^ Линь, Чи-Джен (2007). «О сходимости алгоритмов мультипликативного обновления для факторизации неотрицательных матриц». Транзакции IEEE в нейронных сетях . 18 (6): 1589–1596. CiteSeerX   10.1.1.407.318 . дои : 10.1109/TNN.2007.895831 . S2CID   2183630 .
  31. ^ Хёнсу Ким и Хэсон Пак (2008). «Факторизация неотрицательной матрицы на основе метода наименьших квадратов с переменным неотрицательностью и метода активного множества» (PDF) . Журнал SIAM по матричному анализу и приложениям . 30 (2): 713–730. CiteSeerX   10.1.1.70.3485 . дои : 10.1137/07069239x .
  32. ^ Найян Гуань; Даченг Тао; Чжиган Ло; Бо Юань (июнь 2012 г.). «NeNMF: оптимальный градиентный метод для факторизации неотрицательной матрицы». Транзакции IEEE по обработке сигналов . 60 (6): 2882–2898. Бибкод : 2012ITSP...60.2882G . дои : 10.1109/TSP.2012.2190406 . S2CID   8143231 .
  33. ^ Джингу Ким и Пак Хэсон (2011). «Быстрая факторизация неотрицательной матрицы: метод и сравнения, подобные активному множеству». SIAM Журнал по научным вычислениям . 58 (6): 3261–3281. Бибкод : 2011ГАО...33.3261К . CiteSeerX   10.1.1.419.798 . дои : 10.1137/110821172 .
  34. ^ Джингу Ким; Юньлун Хэ и Хэсун Пак (2013). «Алгоритмы неотрицательной матричной и тензорной факторизации: единое представление, основанное на системе спуска блочных координат» (PDF) . Журнал глобальной оптимизации . 33 (2): 285–319. дои : 10.1007/s10898-013-0035-4 . S2CID   11197117 .
  35. ^ Дин, К.; Он, X. и Саймон, HD (2005). «Об эквивалентности неотрицательной матричной факторизации и спектральной кластеризации». Учеб. SIAM Конференция по интеллектуальному анализу данных . Том. 4. С. 606–610. дои : 10.1137/1.9781611972757.70 . ISBN  978-0-89871-593-4 .
  36. ^ Хафшеджани, Саджад Фатхи; Моаберфард, Захра (ноябрь 2022 г.). «Инициализация факторизации неотрицательной матрицы: всесторонний обзор» . Международный журнал науки о данных и аналитики . 16 (1): 119–134. arXiv : 2109.03874 . дои : 10.1007/s41060-022-00370-9 . ISSN   2364-415X .
  37. ^ Перейти обратно: а б Чжу, Гуантунь Б. (19 декабря 2016 г.). «Неотрицательная матричная факторизация (NMF) с гетероскедастическими неопределенностями и отсутствующими данными». arXiv : 1612.06037 [ astro-ph.IM ].
  38. ^ Перейти обратно: а б Саммер, Реми; Пуэйо, Лоран; Ларкин, Джеймс (2012). «Обнаружение и характеристика экзопланет и дисков с использованием проекций на собственных изображениях Карунена-Лоэва». Письма астрофизического журнала . 755 (2): Л28. arXiv : 1207.4197 . Бибкод : 2012ApJ...755L..28S . дои : 10.1088/2041-8205/755/2/L28 . S2CID   51088743 .
  39. ^ Перейти обратно: а б с Пуэйо, Лоран (2016). «Обнаружение и характеристика экзопланет с использованием проекций на собственных изображениях Кархунен-Лёве: перспективное моделирование» . Астрофизический журнал . 824 (2): 117. arXiv : 1604.06097 . Бибкод : 2016ApJ...824..117P . дои : 10.3847/0004-637X/824/2/117 . S2CID   118349503 .
  40. ^ Кэмпбелл, СЛ; Дж. Д. Пул (1981). «Вычисление факторизаций неотрицательного ранга» . Приложение линейной алгебры . 35 : 175–182. дои : 10.1016/0024-3795(81)90272-х .
  41. ^ Калофолиас, В.; Галлопулос, Э. (2012). «Вычисление симметричных неотрицательных ранговых факторизаций» (PDF) . Приложение линейной алгебры . 436 (2): 421–435. дои : 10.1016/j.laa.2011.03.016 .
  42. ^ Перейти обратно: а б Арора, Санджив; Ге, Ронг; Халперн, Йони; Мимно, Дэвид; Мойтра, Анкур; Зонтаг, Дэвид; Ву, Ичен; Чжу, Майкл (2013). Практический алгоритм тематического моделирования с доказуемыми гарантиями . Материалы 30-й Международной конференции по машинному обучению. arXiv : 1212.4777 . Бибкод : 2012arXiv1212.4777A .
  43. ^ Ли, Дэниел Д.; Себастьян, Сын, Х. (1999). «Изучение частей объектов путем факторизации неотрицательной матрицы» (PDF) . Природа . 401 (6755): 788–791. Бибкод : 1999Natur.401..788L . дои : 10.1038/44565 . ПМИД   10548103 . S2CID   4428232 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  44. ^ Рэй Бантайн (2002). Вариационные расширения EM и полиномиального PCA (PDF) . Учеб. Европейская конференция по машинному обучению (ECML-02). ЛНАИ. Том. 2430. стр. 23–34.
  45. ^ Эрик Гаусье и Сирил Гутт (2005). Связь между PLSA и NMF и последствия (PDF) . Учеб. 28-я международная конференция ACM SIGIR по исследованиям и разработкам в области информационного поиска (SIGIR-05). стр. 601–602. Архивировано из оригинала (PDF) 28 сентября 2007 г. Проверено 29 января 2007 г.
  46. ^ Рон Засс и Амнон Шашуа (2005). « Объединяющий подход к жесткой и вероятностной кластеризации ». Международная конференция по компьютерному зрению (ICCV), Пекин, Китай, октябрь 2005 г.
  47. ^ Макс Веллинг; и другие. (2004). Экспоненциальные семейные гармонии с применением к информационному поиску . НИПС.
  48. ^ Пентти Паатеро (1999). «Мультилинейный двигатель: управляемая таблицами программа наименьших квадратов для решения полилинейных задач, включая n-стороннюю модель параллельного факторного анализа». Журнал вычислительной и графической статистики . 8 (4): 854–888. дои : 10.2307/1390831 . JSTOR   1390831 .
  49. ^ Макс Веллинг и Маркус Вебер (2001). «Положительная тензорная факторизация». Буквы для распознавания образов . 22 (12): 1255–1261. Бибкод : 2001PaReL..22.1255W . CiteSeerX   10.1.1.21.24 . дои : 10.1016/S0167-8655(01)00070-8 .
  50. ^ Джингу Ким и Пак Хэсон (2012). Быстрая неотрицательная тензорная факторизация с помощью метода, подобного активному множеству (PDF) . Высокопроизводительные научные вычисления: алгоритмы и приложения. Спрингер. стр. 311–326.
  51. ^ Кенан Йылмаз; А. Тайлан Джемгил и Умут Симсекли (2011). Обобщенная связанная тензорная факторизация (PDF) . НИПС.
  52. ^ Вамси К. Потлуру; Сергей М. Плис; Мортен Моруп; Винс Д. Калхун и Терран Лейн (2009). Эффективные мультипликативные обновления для машин опорных векторов . Материалы конференции SIAM 2009 г. по интеллектуальному анализу данных (SDM). стр. 1218–1229.
  53. ^ Вэй Сюй; Синь Лю и Ихонг Гун (2003). Кластеризация документов на основе факторизации неотрицательной матрицы . Материалы 26-й ежегодной международной конференции ACM SIGIR по исследованиям и разработкам в области информационного поиска. Нью-Йорк: Ассоциация вычислительной техники . стр. 267–273.
  54. ^ Эггерт, Дж.; Корнер, Э. (2004). «Разреженное кодирование и NMF». 2004 Международная совместная конференция IEEE по нейронным сетям (номер по каталогу IEEE 04CH37541) . Том. 4. С. 2529–2533. дои : 10.1109/IJCNN.2004.1381036 . ISBN  978-0-7803-8359-3 . S2CID   17923083 .
  55. ^ Берне, О.; Джоблин, К. ; Девиль, Ю.; Смит, доктор медицинских наук; Рапачоли, М.; Бернард, JP; Томас, Дж.; Рич, В.; Абергель, А. (1 июля 2007 г.). «Анализ выброса очень мелких частиц пыли по данным спектроскопии Спитцера с использованием методов слепого разделения сигналов» . Астрономия и астрофизика . 469 (2): 575–586. arXiv : astro-ph/0703072 . Бибкод : 2007A&A...469..575B . дои : 10.1051/0004-6361:20066282 . ISSN   0004-6361 .
  56. ^ Лафреньер, Давид; Мароид, Кристиан; Дойон, Рене; Бармен, Трэвис (2009). «Обнаружение HST/NICMOS HR 8799 b в 1998 году». Письма астрофизического журнала . 694 (2): L148. arXiv : 0902.3247 . Бибкод : 2009ApJ...694L.148L . дои : 10.1088/0004-637X/694/2/L148 . S2CID   7332750 .
  57. ^ Амара, Адам; Кванц, Саша П. (2012). «PYNPOINT: пакет обработки изображений для поиска экзопланет». Ежемесячные уведомления Королевского астрономического общества . 427 (2): 948. arXiv : 1207.6637 . Бибкод : 2012MNRAS.427..948A . дои : 10.1111/j.1365-2966.2012.21918.x . S2CID   119200505 .
  58. ^ Ваххадж, Захед; Сьеса, Лукас А.; Мавет, Дмитрий; Ян, Бин; Кановас, Гектор; де Бур, Джозуа; Касасс, Симон; Менар, Франсуа; Шрайбер, Матиас Р.; Лю, Майкл С.; Биллер, Бет А.; Нильсен, Эрик Л.; Хейворд, Томас Л. (2015). «Улучшение соотношения сигнал/шум при прямом получении изображений экзопланет и околозвездных дисков с помощью MLOCI». Астрономия и астрофизика . 581 (24): А24. arXiv : 1502.03092 . Бибкод : 2015A&A...581A..24W . дои : 10.1051/0004-6361/201525837 . S2CID   20174209 .
  59. ^ Нильсен, Финн Аруп; Балслев, Даниэла; Хансен, Ларс Кай (2005). «Изучение задней поясной извилины: разделение компонентов памяти и боли» (PDF) . НейроИмидж . 27 (3): 520–522. doi : 10.1016/j.neuroimage.2005.04.034 . ПМИД   15946864 . S2CID   18509039 .
  60. ^ Коэн, Уильям (4 апреля 2005 г.). «Набор данных электронной почты Enron» . Проверено 26 августа 2008 г.
  61. ^ Берри, Майкл В.; Браун, Мюррей (2005). «Наблюдение за электронной почтой с использованием факторизации неотрицательной матрицы». Теория вычислительной и математической организации . 11 (3): 249–264. дои : 10.1007/s10588-005-5380-5 . S2CID   16249147 .
  62. ^ Нильсен, Финн Аруп (2008). Кластеризация научных цитат в Википедии . Викимания . arXiv : 0805.1154 .
  63. ^ Хасани, Али; Иранманеш, Амир; Мансури, Наджме (12 ноября 2019 г.). «Интеллектуальный анализ текста с использованием неотрицательной матричной факторизации и скрытого семантического анализа». arXiv : 1911.04705 [ cs.LG ].
  64. ^ Берри, Майкл В.; Браун, Мюррей; Лэнгвилл, Эми Н.; Паукак, В. Пол; Племмонск, Роберт Дж. (15 сентября 2007 г.). «Алгоритмы и приложения для приближенной факторизации неотрицательных матриц». Вычислительная статистика и анализ данных . 52 (1): 155–173. дои : 10.1016/j.csda.2006.11.006 .
  65. ^ Юн Мао; Лоуренс Сол и Джонатан М. Смит (2006). «IDES: служба оценки расстояния в Интернете для больших сетей». Журнал IEEE по избранным областям коммуникаций . 24 (12): 2273–2284. CiteSeerX   10.1.1.136.3837 . дои : 10.1109/JSAC.2006.884026 . S2CID   12931155 .
  66. ^ Ян Чен; Сяо Ван; Конг Ши; и другие. (2011). «Феникс: сетевая система координат на основе веса с использованием матричной факторизации» (PDF) . Транзакции IEEE по управлению сетями и услугами . 8 (4): 334–347. CiteSeerX   10.1.1.300.2851 . дои : 10.1109/tnsm.2011.110911.100079 . S2CID   8079061 . Архивировано из оригинала (PDF) 14 ноября 2011 г.
  67. ^ Шмидт, Миннесота, Дж. Ларсен и FT Сяо. (2007). « Снижение шума ветра с использованием неотрицательного разреженного кодирования », Машинное обучение для обработки сигналов, Семинар IEEE , 431–436.
  68. ^ Фришо Э., Матье Ф., Труйон Т., Бушар Г., Франсуа О. (2014). «Быстрая и эффективная оценка индивидуальных коэффициентов происхождения» . Генетика . 196 (4): 973–983. дои : 10.1534/genetics.113.160572 . ПМЦ   3982712 . ПМИД   24496008 .
  69. ^ Девараджан, К. (2008). «Неотрицательная матричная факторизация: инструмент анализа и интерпретации в вычислительной биологии» . PLOS Вычислительная биология . 4 (7): e1000029. Бибкод : 2008PLSCB...4E0029D . дои : 10.1371/journal.pcbi.1000029 . ПМК   2447881 . ПМИД   18654623 .
  70. ^ Хёнсу Ким и Хэсон Пак (2007). «Разреженная неотрицательная матричная факторизация с помощью чередующихся наименьших квадратов с неотрицательными ограничениями для анализа данных микрочипов» . Биоинформатика . 23 (12): 1495–1502. doi : 10.1093/биоинформатика/btm134 . ПМИД   17483501 .
  71. ^ Швальбе, Э. (2013). «Профилирование метилирования ДНК медуллобластомы позволяет провести надежную подклассификацию и улучшить прогнозирование результатов с использованием биопсий, фиксированных формалином» . Акта Нейропатологика . 125 (3): 359–371. дои : 10.1007/s00401-012-1077-2 . ПМК   4313078 . ПМИД   23291781 .
  72. ^ Александров Людмил Борисович; Ник-Зайнал, Серена; Ведж, Дэвид К.; Кэмпбелл, Питер Дж.; Страттон, Майкл Р. (31 января 2013 г.). «Расшифровка признаков мутационных процессов, происходящих при раке человека» . Отчеты по ячейкам . 3 (1): 246–259. дои : 10.1016/j.celrep.2012.12.008 . ISSN   2211-1247 . ПМЦ   3588146 . ПМИД   23318258 .
  73. ^ Стейн-О'Брайен, Женевьева Л.; Арора, Раман; Калхейн, Эдин К.; Фаворов Александр Владимирович; Гармир, Лана X.; Грин, Кейси С.; Гофф, Лоял А.; Ли, Ифэн; Нгом, Алун; Окс, Майкл Ф.; Сюй, Яньсюнь (01 октября 2018 г.). «Введите матрицу: факторизация раскрывает знания, полученные от омиков» . Тенденции в генетике . 34 (10): 790–805. дои : 10.1016/j.tig.2018.07.003 . ISSN   0168-9525 . ПМК   6309559 . ПМИД   30143323 .
  74. ^ Дин; Ли; Пэн; Парк (2006). «Ортогональные неотрицательные матричные t-факторизации для кластеризации». Материалы 12-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных . стр. 126–135. дои : 10.1145/1150402.1150420 . ISBN  1595933395 . S2CID   165018 .
  75. ^ Седдия; Пиноли; Кери; Массероли (2020). «Техника матричного факторизации для прогнозирования повторного использования лекарств». Журнал IEEE по биомедицинской и медицинской информатике . 24 (11): 3162–3172. дои : 10.1109/JBHI.2020.2991763 . ПМИД   32365039 . S2CID   218504587 .
  76. ^ Пиноли; Седдия; Кери; Массероли (2021). «Прогнозирование синергизма лекарств с помощью трифакторизации неотрицательной матрицы». Транзакции IEEE/ACM по вычислительной биологии и биоинформатике . ПП (4): 1956–1967. дои : 10.1109/TCBB.2021.3091814 . ПМИД   34166199 . S2CID   235634059 .
  77. ^ ДиПаола; Базен; Обри; Ауренго; Кавайолес; Херри; Кан (1982). «Обработка динамических последовательностей в ядерной медицине». IEEE Trans Nucl Sci . 29 (4): 1310–21. Бибкод : 1982ИТНС...29.1310Д . дои : 10.1109/tns.1982.4332188 . S2CID   37186516 .
  78. ^ Ситек; Гулльберг; Хьюсман (2002). «Коррекция неоднозначных решений в факторном анализе с использованием штрафной цели наименьших квадратов». IEEE Трансмедицинская визуализация . 21 (3): 216–25. дои : 10.1109/42.996340 . ПМИД   11989846 . S2CID   6553527 .
  79. ^ Бучко; Митра; Бейкер; Ягуст; Гуллберг (2015). «Применение кластерного инициируемого факторного анализа (CIFA) для классификации тканей при динамической ПЭТ головного мозга» . Журнал церебрального кровотока и метаболизма . 35 (7): 1104–11. дои : 10.1038/jcbfm.2015.69 . ПМК   4640278 . ПМИД   25899294 .
  80. ^ Абдала; Бучко; Митра; Гуллберг (2015). «Реконструкция 4-D динамических изображений ОФЭКТ из противоречивых проекций с использованием алгоритма FADS, инициализированного сплайном (SIFADS)» . IEEE Трансмедицинская визуализация . 34 (1): 216–18. дои : 10.1109/TMI.2014.2352033 . ПМИД   25167546 . S2CID   11060831 .
  81. ^ К. Буцидис и Э. Галлопулос (2008). «Инициализация на основе SVD: преимущество для факторизации неотрицательной матрицы». Распознавание образов . 41 (4): 1350–1362. Бибкод : 2008PatRe..41.1350B . CiteSeerX   10.1.1.137.8281 . дои : 10.1016/j.patcog.2007.09.010 .
  82. ^ Чао Лю; Хун-чжи Ян; Цзиньлян Фан; Ли-Вэй Хэ и И-Мин Ван (2010). «Факторизация распределенной неотрицательной матрицы для диадического анализа данных в веб-масштабе на MapReduce» (PDF) . Материалы 19-й Международной конференции по всемирной паутине .
  83. ^ Цзянтао Инь; Ликсин Гао и Чжунфэй (Марк) Чжан (2014). «Масштабируемая факторизация неотрицательной матрицы с блочными обновлениями» (PDF) . Материалы Европейской конференции по машинному обучению, принципам и практике обнаружения знаний в базах данных .
  84. ^ «Апач Махаут» . mahout.apache.org . Проверено 14 декабря 2019 г.
  85. ^ Донг Ван; Равичандер Випперла; Ник Эванс; Томас Фан Чжэн (2013). «Онлайн-обучение неотрицательным сверточным шаблонам для речевых сигналов» (PDF) . Транзакции IEEE по обработке сигналов . 61 (1): 44–56. Бибкод : 2013ITSP...61...44W . CiteSeerX   10.1.1.707.7348 . дои : 10.1109/tsp.2012.2222381 . S2CID   12530378 . Архивировано из оригинала (PDF) 19 апреля 2015 г. Проверено 19 апреля 2015 г.
  86. ^ Сяннань Хэ; Мин-Йен Кан; Пейчу Се и Сяо Чен (2014). «Многопредставленная кластеризация элементов Web 2.0 на основе комментариев» (PDF) . Материалы 23-й Международной конференции по всемирной паутине . Архивировано из оригинала (PDF) 2 апреля 2015 г. Проверено 22 марта 2015 г.
  87. ^ Цзялу Лю; Чи Ван; Цзин Гао и Цзявэй Хан (2013). «Многопредставленная кластеризация посредством совместной неотрицательной матричной факторизации». Материалы Международной конференции SIAM по интеллектуальному анализу данных 2013 г. (PDF) . стр. 252–260. CiteSeerX   10.1.1.301.1771 . дои : 10.1137/1.9781611972832.28 . ISBN  978-1-61197-262-7 . S2CID   4968 . {{cite book}}: |journal= игнорируется ( помогите )
  88. ^ Чистиков, Дмитрий; Кифер, Стефан; Марушич, Инес; Ширмохаммади, Махса; Уоррелл, Джеймс (22 мая 2016 г.). «Неотрицательная матричная факторизация требует иррациональности». arXiv : 1605.06848 [ cs.CC ].

Другие [ править ]

Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: 9CDC9FA91BF15F464490BB059847C875__1711932420
URL1:https://en.wikipedia.org/wiki/Non-negative_matrix_factorization
Заголовок, (Title) документа по адресу, URL1:
Non-negative matrix factorization - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)