Неотрицательная матричная факторизация
Часть серии о |
Машинное обучение и интеллектуальный анализ данных |
---|
Факторизация неотрицательной матрицы ( NMF или NNMF ), а также аппроксимация неотрицательной матрицы [ 1 ] [ 2 ] — это группа алгоритмов многомерного анализа и линейной алгебры , где матрица V разлагается на (обычно) две матрицы W и H со свойством, что все три матрицы не имеют отрицательных элементов. Эта неотрицательность облегчает проверку полученных матриц. Кроме того, в таких приложениях, как обработка аудиоспектрограмм или мышечной активности, рассматриваемым данным присуща неотрицательность. Поскольку в целом задача не является точно решаемой, ее обычно аппроксимируют численно.
NMF находит применение в таких областях, как астрономия , [ 3 ] [ 4 ] компьютерное зрение , кластеризация документов , [ 1 ] вменение недостающих данных , [ 5 ] хемометрика , обработка аудиосигналов , рекомендательные системы , [ 6 ] [ 7 ] и биоинформатика . [ 8 ]
История
[ редактировать ]В хемометрике факторизация неотрицательной матрицы имеет долгую историю под названием «разрешение кривой самомоделирования». [ 9 ] В этой схеме векторы в правой матрице представляют собой непрерывные кривые, а не дискретные векторы. Также ранняя работа по факторизации неотрицательных матриц была выполнена финской группой исследователей в 1990-х годах под названием факторизация положительной матрицы . [ 10 ] [ 11 ] [ 12 ] Он стал более широко известен как факторизация неотрицательной матрицы после того, как Ли и Сын исследовали свойства алгоритма и опубликовали несколько простых и полезных алгоритмы двух типов факторизаций. [ 13 ] [ 14 ]
Фон
[ редактировать ]Пусть матрица V является произведением матриц W и H ,
Умножение матриц может быть реализовано как вычисление векторов-столбцов V как линейных комбинаций векторов-столбцов в W с использованием коэффициентов, предоставленных столбцами H . То есть каждый столбец V можно вычислить следующим образом:
где v i - i -й вектор-столбец матрицы произведения V, а h i - i -й вектор-столбец матрицы H .
При перемножении матриц размеры факторных матриц могут быть значительно меньше размерностей продуктовой матрицы, и именно это свойство лежит в основе НМФ. NMF генерирует факторы со значительно уменьшенными размерностями по сравнению с исходной матрицей. Например, если V — матрица размера m × n , W — матрица размера m × p , а H — матрица размера p × n , то p может быть значительно меньше, чем m и n .
Вот пример, основанный на приложении для интеллектуального анализа текста:
- Пусть входная матрица (матрица, подлежащая факторингу) будет V с 10 000 строк и 500 столбцами, где слова находятся в строках, а документы - в столбцах. То есть у нас есть 500 документов, проиндексированных по 10000 слов. Отсюда следует, что вектор-столбец v в V представляет документ.
- Предположим, мы просим алгоритм найти 10 признаков, чтобы сгенерировать матрицу признаков W с 10 000 строк и 10 столбцами и матрицу коэффициентов H с 10 строками и 500 столбцами.
- Произведение W и H представляет собой матрицу из 10 000 строк и 500 столбцов, той же формы, что и входная матрица , и, если факторизация сработала, это разумное приближение к входной матрице V. V
- Из приведенного выше рассмотрения матричного умножения следует, что каждый столбец в матрице произведений WH представляет собой линейную комбинацию 10 векторов-столбцов в матрице признаков W с коэффициентами, предоставленными матрицей коэффициентов H .
Этот последний пункт является основой NMF, поскольку мы можем рассматривать каждый исходный документ в нашем примере как созданный из небольшого набора скрытых функций. NMF генерирует эти функции.
Полезно рассматривать каждый признак (вектор-столбец) в матрице признаков W как архетип документа, содержащий набор слов, где значение ячейки каждого слова определяет ранг слова в признаке: чем выше значение ячейки слова, тем выше ранг слова. в функции. Столбец в матрице коэффициентов H представляет исходный документ со значением ячейки, определяющим ранг документа по признаку. Теперь мы можем восстановить документ (вектор-столбец) из нашей входной матрицы с помощью линейной комбинации наших признаков (векторов-столбцов в W где каждый признак взвешивается по значению ячейки признака из столбца документа в H. ) ,
Кластеризация собственности
[ редактировать ]NMF обладает присущим свойством кластеризации, [ 15 ] т.е. он автоматически кластеризует столбцы входных данных .
Точнее, приближение к достигается путем нахождения и минимизирующие функцию ошибок (с использованием нормы Фробениуса )
при условии ,
Если мы, кроме того, наложим ограничение ортогональности на , то есть , то описанная выше минимизация математически эквивалентна минимизации кластеризации K-средних . [ 15 ]
Кроме того, вычисленное дает принадлежность к кластеру, т. е. если для всех i ≠ k это говорит о том, что входные данные принадлежит -й кластер. Вычисленное дает центроиды кластера, т.е. -th столбец дает центр тяжести кластера -й кластер. Представление этого центроида может быть значительно улучшено с помощью выпуклого NMF.
Когда ограничение ортогональности не налагается явно, ортогональность сохраняется в значительной степени, а также сохраняется свойство кластеризации.
Когда используемая функция ошибок представляет собой расхождение Кульбака-Лейблера , NMF идентичен вероятностному скрытому семантическому анализу (PLSA), популярному методу кластеризации документов. [ 16 ]
Типы
[ редактировать ]Приблизительная неотрицательная матричная факторизация
[ редактировать ]Обычно количество столбцов W и количество строк H в NMF выбираются так, чтобы произведение WH стало приближением к V . Полное разложение V тогда составляет две неотрицательные матрицы W и H а также остаток U , такой что: V = WH + U. , Элементы остаточной матрицы могут быть как отрицательными, так и положительными.
Когда W и H меньше V, их становится легче хранить и манипулировать ими. Другая причина факторизации V на меньшие матрицы W и H заключается в том, что если цель состоит в том, чтобы приблизительно представить элементы V с помощью значительно меньшего количества данных, то необходимо вывести некоторую скрытую структуру в данных.
Факторизация выпуклой неотрицательной матрицы
[ редактировать ]В стандартном NMF матричный коэффициент W ∈ R + м × к , т. е. W может быть чем угодно в этом пространстве. Выпуклый НМФ [ 17 ] ограничивает столбцы W выпуклыми комбинациями векторов входных данных . значительно улучшает качество представления данных W. Это Более того, результирующий матричный фактор H становится более разреженным и ортогональным.
Факторизация неотрицательного ранга
[ редактировать ]В случае, если ранг V неотрицательный равен его фактическому рангу, V = WH называется факторизацией неотрицательного ранга (NRF). [ 18 ] [ 19 ] [ 20 ] Задача нахождения NRF V , если она существует, как известно, NP-трудна. [ 21 ]
Различные функции стоимости и регуляризации
[ редактировать ]Существуют различные типы факторизации неотрицательных матриц. Различные типы возникают из-за использования разных функций стоимости для измерения расхождения между V и WH и, возможно, из-за W и / или H. регуляризации матриц [ 1 ]
Две простые функции дивергенции, изученные Ли и Сыном, - это квадрат ошибки (или норма Фробениуса ) и расширение дивергенции Кульбака-Лейблера на положительные матрицы (исходная дивергенция Кульбака-Лейблера определяется на вероятностных распределениях). Каждое расхождение приводит к использованию другого алгоритма NMF, который обычно минимизирует расхождение с помощью правил итеративного обновления.
Проблема факторизации в версии NMF с квадратичной ошибкой может быть сформулирована как: Дана матрица найти неотрицательные матрицы W и H, минимизирующие функцию
Другой тип НМП для изображений основан на общей норме вариации . [ 22 ]
Когда регуляризация L1 (сродни Lasso ) добавляется к NMF с функцией стоимости среднеквадратической ошибки, получающуюся проблему можно назвать неотрицательным разреженным кодированием из-за сходства с проблемой разреженного кодирования : [ 23 ] [ 24 ] хотя его еще можно называть NMF. [ 25 ]
Онлайн НМФ
[ редактировать ]Многие стандартные алгоритмы NMF анализируют все данные вместе; т. е. вся матрица доступна с самого начала. Это может быть неудовлетворительно в приложениях, где слишком много данных не помещается в память, или где данные передаются в потоковом режиме. Одним из таких применений является совместная фильтрация в системах рекомендаций , где может быть много пользователей и множество элементов, которые можно рекомендовать, и было бы неэффективно пересчитывать все, когда в систему добавляется один пользователь или один элемент. Функция стоимости оптимизации в этих случаях может быть такой же, как для стандартного NMF, а может и не быть, но алгоритмы должны быть совершенно другими. [ 26 ] [ 27 ]
Сверточный НМФ
[ редактировать ]Если столбцы V представляют данные, выбранные по пространственным или временным измерениям, например сигналы времени, изображения или видео, функции, которые являются эквивариантными относительно сдвигов по этим измерениям, могут быть изучены с помощью сверточного NMF. В этом случае W является разреженным со столбцами, имеющими локальные окна ненулевого веса, которые являются общими для сдвигов по пространственно-временным измерениям V , представляя ядра свертки . Путем пространственно-временного объединения H и многократного использования полученного представления в качестве входных данных для сверточного NMF можно изучить глубокие иерархии функций. [ 28 ]
Алгоритмы
[ редактировать ]Есть несколько способов W и H найти : правило мультипликативного обновления Ли и Сына. [ 14 ] был популярным методом из-за простоты реализации. Этот алгоритм:
- инициализировать: W и H неотрицательные.
- Затем обновите значения в W и H, вычислив следующее: как индекс итерации.
- и
- Пока W и H не станут стабильными.
Обратите внимание, что обновления выполняются поэлементно, а не умножением матриц.
Отметим, что мультипликативные множители для W и H , т.е. и члены являются матрицами единиц, когда .
Совсем недавно были разработаны другие алгоритмы. Некоторые подходы основаны на чередовании неотрицательных наименьших квадратов : на каждом шаге такого алгоритма сначала H фиксируется и W находится с помощью решателя неотрицательных наименьших квадратов, затем W фиксируется и H находится аналогичным образом. Процедуры, используемые для решения W и H, могут быть одинаковыми. [ 29 ] или другое, поскольку некоторые варианты NMF регуляризируют один из W и H . [ 23 ] Конкретные подходы включают методы прогнозируемого градиентного спуска , [ 29 ] [ 30 ] метод активного набора , [ 6 ] [ 31 ] оптимальный градиентный метод, [ 32 ] и метод поворота принципала блока [ 33 ] среди нескольких других. [ 34 ]
Текущие алгоритмы неоптимальны, поскольку они гарантируют нахождение только локального, а не глобального минимума функции стоимости. Доказуемо оптимальный алгоритм вряд ли появится в ближайшем будущем, поскольку было показано, что проблема обобщает задачу кластеризации k-средних, которая, как известно, является NP-полной . [ 35 ] Однако, как и во многих других приложениях интеллектуального анализа данных, локальный минимум может оказаться полезным.
Помимо этапа оптимизации, существенное влияние на NMF оказывает инициализация. Начальные значения, выбранные для W и H, могут влиять не только на скорость сходимости, но и на общую ошибку сходимости. Некоторые варианты инициализации включают полную рандомизацию, SVD , кластеризацию k-средних и более продвинутые стратегии, основанные на этой и других парадигмах. [ 36 ]
Последовательный НМФ
[ редактировать ]Последовательное построение компонентов NMF ( W и H ) впервые использовалось для связи NMF с анализом главных компонентов (PCA) в астрономии. [ 37 ] Вклад компонентов PCA ранжируется по величине соответствующих им собственных значений; для НМФ его компоненты можно ранжировать эмпирически, когда они строятся поочередно (последовательно), т.е. изучая -й компонент с первым построенные компоненты.
Вклад последовательных компонентов NMF можно сравнить с теоремой Карунена-Лёва , применением PCA, используя график собственных значений. Типичный выбор количества компонентов с помощью PCA основан на точке «колена», затем наличие плоского плато указывает на то, что PCA не обеспечивает эффективный сбор данных, и, наконец, происходит внезапное падение, отражающее захват случайных данных. шумит и попадает в режим переобучения. [ 38 ] [ 39 ] Для последовательного NMF график собственных значений аппроксимируется графиком кривых дробной остаточной дисперсии, где кривые непрерывно уменьшаются и сходятся к более высокому уровню, чем PCA, [ 4 ] что является показателем меньшего переобучения последовательного NMF.
Точный НМФ
[ редактировать ]Точные решения для вариантов NMF можно ожидать (за полиномиальное время), когда для матрицы V выполняются дополнительные ограничения . Алгоритм с полиномиальным временем для решения факторизации неотрицательного ранга, если V содержит мономиальную подматрицу ранга, равного ее рангу, был предложен Кэмпбеллом и Пулом в 1981 году. [ 40 ] Калофолиас и Галлопулос (2012) [ 41 ] решил симметричный аналог этой задачи, где V симметричен и содержит диагональную главную подматрицу ранга r. Их алгоритм работает за O(rm 2 ) время в плотном случае. Арора, Ге, Халперн, Мимно, Мойтра, Зонтаг, Ву и Чжу (2013) предлагают алгоритм полиномиального времени для точного NMF, который работает в случае, когда один из факторов W удовлетворяет условию разделимости. [ 42 ]
Связь с другими методами
[ редактировать ]В изучении частей объектов путем неотрицательной матричной факторизации Ли и Сын [ 43 ] предложил NMF в основном для разложения изображений по частям. Он сравнивает NMF с векторным квантованием и анализом главных компонент и показывает, что, хотя эти три метода могут быть записаны как факторизация, они реализуют разные ограничения и, следовательно, дают разные результаты.
Позже было показано, что некоторые типы NMF являются примером более общей вероятностной модели, называемой «мультиномиальный PCA». [ 44 ] Когда NMF получается путем минимизации расхождения Кульбака-Лейблера , это фактически эквивалентно другому примеру полиномиального PCA, вероятностному скрытому семантическому анализу . [ 45 ] обучено методом оценки максимального правдоподобия . Этот метод обычно используется для анализа и кластеризации текстовых данных, а также связан с моделью скрытых классов .
NMF с целью метода наименьших квадратов эквивалентен смягченной форме кластеризации K-средних : матричный фактор W содержит центроиды кластера, а H содержит индикаторы членства в кластере. [ 15 ] [ 46 ] Это обеспечивает теоретическую основу для использования NMF для кластеризации данных. Однако k-means не обеспечивает неотрицательность своих центроидов, поэтому ближайшая аналогия фактически связана с «полу-NMF». [ 17 ]
NMF можно рассматривать как двухслойную направленную графическую модель с одним слоем наблюдаемых случайных величин и одним слоем скрытых случайных величин. [ 47 ]
NMF выходит за рамки матриц до тензоров произвольного порядка. [ 48 ] [ 49 ] [ 50 ] Это расширение можно рассматривать как неотрицательный аналог, например, модели PARAFAC .
Другие расширения NMF включают совместную факторизацию нескольких матриц данных и тензоров, где некоторые факторы являются общими. Такие модели полезны для слияния датчиков и реляционного обучения. [ 51 ]
NMF — это пример неотрицательного квадратичного программирования , как и машина опорных векторов (SVM). Однако SVM и NMF связаны на более глубоком уровне, чем NQP, что позволяет напрямую применять алгоритмы решения, разработанные для любого из двух методов, к проблемам в обеих областях. [ 52 ]
Уникальность
[ редактировать ]Факторизация не уникальна: матрицу и обратную ей матрицу можно использовать для преобразования двух матриц факторизации, например, [ 53 ]
Если две новые матрицы и неотрицательны , они образуют другую параметризацию факторизации.
Неотрицательность и применяется, по крайней мере, если B является неотрицательной мономиальной матрицей . В этом простом случае это будет соответствовать масштабированию и перестановке .
Больше контроля над неуникальностью NMF достигается с помощью ограничений разреженности. [ 54 ]
Приложения
[ редактировать ]Астрономия
[ редактировать ]В астрономии NMF является многообещающим методом уменьшения размерности в том смысле, что астрофизические сигналы неотрицательны. NMF был применен к спектроскопическим наблюдениям. [ 55 ] [ 3 ] и прямые визуализирующие наблюдения [ 4 ] как метод изучения общих свойств астрономических объектов и последующей обработки астрономических наблюдений. Достижения в спектроскопических наблюдениях Блэнтона и Роуэйса (2007). [ 3 ] учитывает неопределенности астрономических наблюдений, что позже улучшено Чжу (2016) [ 37 ] где также учитываются недостающие данные и параллельные вычисления включены . Их метод затем был принят Ren et al. (2018) [ 4 ] к области прямой визуализации как одному из методов обнаружения экзопланет , особенно для прямой визуализации околозвездных дисков .
Рен и др. (2018) [ 4 ] способны доказать устойчивость компонентов НМФ при их последовательном построении (т.е. один за другим), что обеспечивает линейность процесса моделирования НМФ; Свойство линейности используется для разделения звездного света и света, рассеянного экзопланетами и околозвездными дисками .
При прямых изображениях, чтобы выявить слабые экзопланеты и околозвездные диски из ярких окружающих звездных огней, типичный контраст которых составляет от 10⁵ до 10¹⁰, были приняты различные статистические методы: [ 56 ] [ 57 ] [ 38 ] однако свет от экзопланет или околозвездных дисков обычно переоценен, поэтому для восстановления истинного потока необходимо применить прямое моделирование. [ 58 ] [ 39 ] Прямое моделирование в настоящее время оптимизировано для точечных источников, [ 39 ] однако не для протяженных источников, особенно для структур неправильной формы, таких как околозвездные диски. В этой ситуации NMF оказался отличным методом, поскольку он менее подгоняется в смысле неотрицательности и разреженности коэффициентов моделирования NMF, поэтому прямое моделирование может выполняться с несколькими коэффициентами масштабирования. [ 4 ] вместо трудоемкого повторного сокращения данных в сгенерированных моделях.
Вменение данных
[ редактировать ]Чтобы включить недостающие данные в статистику, NMF может взять недостающие данные, минимизируя при этом свою функцию стоимости, вместо того, чтобы рассматривать эти недостающие данные как нули. [ 5 ] Это делает его математически проверенным методом вменения данных в статистике. [ 5 ] Сначала доказав, что недостающие данные игнорируются в функции стоимости, а затем доказав, что влияние отсутствующих данных может быть столь же малым, как эффект второго порядка, Рен и др. (2020) [ 5 ] изучил и применил такой подход в области астрономии. Их работа сосредоточена на двумерных матрицах, в частности, она включает математический вывод, расчет смоделированных данных и их применение к данным, полученным на небе.
Процедура вменения данных с помощью NMF может состоять из двух этапов. Во-первых, когда компоненты NMF известны, Ren et al. (2020) доказали, что влияние отсутствующих данных во время вменения данных («целевое моделирование» в их исследовании) является эффектом второго порядка. Во-вторых, когда компоненты NMF неизвестны, авторы доказали, что влияние отсутствующих данных во время создания компонента представляет собой эффект первого-второго порядка.
В зависимости от способа получения компонентов NMF первый этап, описанный выше, может быть независимым или зависимым от второго. Кроме того, качество вменения может быть повышено при использовании большего количества компонентов NMF, см. рисунок 4 Ren et al. (2020) за иллюстрации. [ 5 ]
Анализ текста
[ редактировать ]NMF можно использовать для приложений интеллектуального анализа текста . В этом процессе терминов документа строится матрица с весами различных терминов (обычно взвешенная информация о частоте слов) из набора документов. Эта матрица разбивается на матрицу термина-признака и матрицу признака-документа . Характеристики извлекаются из содержимого документов, а матрица признаков-документов описывает кластеры данных связанных документов.
В одном конкретном приложении иерархический NMF использовался для небольшого подмножества научных рефератов из PubMed . [ 59 ] Другая исследовательская группа сгруппировала части Enron . набора данных электронной почты [ 60 ] с 65 033 сообщениями и 91 133 терминами в 50 кластерах. [ 61 ] NMF также применялся к данным цитирования: в одном из примеров кластеризация английской Википедии статей и научных журналов основывалась на исходящих научных цитатах в английской Википедии. [ 62 ]
Арора, Ге, Халперн, Мимно, Мойтра, Зонтаг, Ву и Чжу (2013) предложили алгоритмы с полиномиальным временем для изучения тематических моделей с использованием NMF. Алгоритм предполагает, что тематическая матрица удовлетворяет условию разделимости, которое часто выполняется в таких условиях. [ 42 ]
Хассани, Иранманеш и Мансури (2019) предложили метод агломерации признаков для матриц терминов-документов, который работает с использованием NMF. Алгоритм уменьшает матрицу термин-документ до меньшей матрицы, более подходящей для кластеризации текста. [ 63 ]
Спектральный анализ данных
[ редактировать ]NMF также используется для анализа спектральных данных; одно из таких применений - классификация космических объектов и мусора. [ 64 ]
Масштабируемое прогнозирование расстояния в Интернете
[ редактировать ]NMF применяется для масштабируемого прогнозирования расстояния в Интернете (времени прохождения туда и обратно). Для сети с хозяева, с помощью НМФ, расстояния всех сквозные ссылки можно предсказать после проведения только измерения. Этот метод был впервые представлен в Интернете. Служба дистанционной оценки (IDES). [ 65 ] Впоследствии, в качестве полностью децентрализованного подхода, сетевая система координат Phoenix [ 66 ] предлагается. Он обеспечивает лучшую общую точность прогнозирования за счет введения концепции веса.
Нестационарное шумоподавление речи
[ редактировать ]Подавление шума речи было давней проблемой при обработке аудиосигнала . Существует множество алгоритмов шумоподавления, если шум стационарен. Например, фильтр Винера подходит для аддитивного гауссовского шума . Однако, если шум нестационарен, классические алгоритмы шумоподавления обычно имеют плохую производительность, поскольку статистическую информацию о нестационарном шуме трудно оценить. Шмидт и др. [ 67 ] используйте NMF для шумоподавления речи в условиях нестационарного шума, что полностью отличается от классических статистических подходов. Основная идея заключается в том, что чистый речевой сигнал может быть редко представлен речевым словарем, а нестационарный шум — нет. Аналогичным образом, нестационарный шум также может быть разреженно представлен словарем шума, а речь - нет.
Алгоритм шумоподавления NMF выглядит следующим образом. Два словаря, один для речи и один для шума, необходимо обучать в автономном режиме. После произнесения зашумленной речи мы сначала вычисляем величину кратковременного преобразования Фурье. Во-вторых, разделите его на две части с помощью NMF: одна может быть редко представлена речевым словарем, а другая часть может быть редко представлена шумовым словарем. В-третьих, та часть, которая представлена речевым словарем, будет оцененной чистой речью.
Популяционная генетика
[ редактировать ]Разреженный NMF используется в популяционной генетике для оценки индивидуальных коэффициентов примеси, обнаружения генетических кластеров особей в выборке популяции или оценки генетической примеси в выбранных геномах. При генетической кластеризации человека алгоритмы NMF дают оценки, аналогичные оценкам компьютерной программы STRUCTURE, но эти алгоритмы более эффективны в вычислительном отношении и позволяют анализировать большие наборы геномных данных населения. [ 68 ]
Биоинформатика
[ редактировать ]NMF успешно применяется в биоинформатике для кластеризации данных об экспрессии генов и метилировании ДНК , а также для поиска генов, наиболее репрезентативных из кластеров. [ 24 ] [ 69 ] [ 70 ] [ 71 ] При анализе раковых мутаций он использовался для выявления общих закономерностей мутаций, которые встречаются при многих видах рака и, вероятно, имеют разные причины. [ 72 ] Методы NMF могут идентифицировать источники вариаций, такие как типы клеток, подтипы заболеваний, стратификация популяции, состав тканей и клональность опухолей. [ 73 ]
Конкретный вариант NMF, а именно неотрицательная матричная трехфакторизация (NMTF), [ 74 ] использовался для задач по перепрофилированию лекарств с целью прогнозирования новых белковых мишеней и терапевтических показаний для одобренных лекарств. [ 75 ] и сделать вывод о наличии пары синергичных противораковых препаратов. [ 76 ]
Ядерная визуализация
[ редактировать ]NMF, также называемый в этой области факторным анализом, используется с 1980-х годов. [ 77 ] для анализа последовательностей изображений в ОФЭКТ и ПЭТ динамической медицинской визуализации . Неуникальность NMF решалась с помощью ограничений разреженности. [ 78 ] [ 79 ] [ 80 ]
Текущие исследования
[ редактировать ]Этот раздел необходимо обновить . ( февраль 2024 г. ) |
Текущие исследования (с 2010 г.) по факторизации неотрицательных матриц включают, помимо прочего,
- Алгоритмический: поиск глобальных минимумов факторов и инициализация факторов. [ 81 ]
- Масштабируемость: как факторизовать матрицы размером миллион на миллиард, которые являются обычным явлением в интеллектуальном анализе данных в веб-масштабе, например, см. Факторизацию распределенной неотрицательной матрицы (DNMF), [ 82 ] Масштабируемая факторизация неотрицательной матрицы (ScalableNMF), [ 83 ] Распределенное стохастическое разложение по сингулярным значениям. [ 84 ]
- Онлайн: как обновить факторизацию при поступлении новых данных без повторных вычислений с нуля, например, см. онлайн CNSC. [ 85 ]
- Коллективная (совместная) факторизация: факторизация нескольких взаимосвязанных матриц для многопредставленного обучения, например многопредставленная кластеризация, см. CoNMF. [ 86 ] и МультиНМФ [ 87 ]
- Проблема Коэна и Ротблюма 1993 года: всегда ли рациональная матрица имеет НМФ минимальной внутренней размерности, факторы которой также рациональны. В последнее время на эту проблему ответили отрицательно. [ 88 ]
См. также
[ редактировать ]- Полилинейная алгебра
- Мультилинейное обучение подпространству
- Тензор
- Тензорное разложение
- Тензорное программное обеспечение
Источники и внешние ссылки
[ редактировать ]Примечания
[ редактировать ]- ^ Перейти обратно: а б с Диллон, Индерджит С.; Сра, Суврит (2005). «Обобщенные неотрицательные матричные аппроксимации с расходимостями Брегмана» . Достижения в области нейронных систем обработки информации 18 [Нейронные системы обработки информации, NIPS 2005, 5-8 декабря 2005 г., Ванкувер, Британская Колумбия, Канада] . стр. 283–290.
- ^ Тандон, Рашиш; Сра, Суврит (13 сентября 2010 г.). Аппроксимация разреженной неотрицательной матрицы: новые формулировки и алгоритмы (PDF) (Отчет). Институт биологической кибернетики Макса Планка. Технический отчет № 193.
- ^ Перейти обратно: а б с Блэнтон, Майкл Р.; Роуэйс, Сэм (2007). «К-коррекции и преобразования фильтров в ультрафиолетовом, оптическом и ближнем инфракрасном диапазонах». Астрономический журнал . 133 (2): 734–754. arXiv : astro-ph/0606170 . Бибкод : 2007AJ....133..734B . дои : 10.1086/510127 . S2CID 18561804 .
- ^ Перейти обратно: а б с д и ж г Рен, Бин; Пуэйо, Лоран; Чжу, Гуантунь Б.; Дюшен, Гаспар (2018). «Неотрицательная матричная факторизация: надежное извлечение расширенных структур» . Астрофизический журнал . 852 (2): 104. arXiv : 1712.10317 . Бибкод : 2018ApJ...852..104R . дои : 10.3847/1538-4357/aaa1f2 . S2CID 3966513 .
- ^ Перейти обратно: а б с д и Рен, Бин; Пуэйо, Лоран; Чен, Кристина; Шоке, Элоди; Дебес, Джон Х; Дюшен, Гаспар; Менар, Франсуа; Перрин, Маршалл Д. (2020). «Использование вменения данных для разделения сигналов в высококонтрастных изображениях» . Астрофизический журнал . 892 (2): 74. arXiv : 2001.00563 . Бибкод : 2020ApJ...892...74R . дои : 10.3847/1538-4357/ab7024 . S2CID 209531731 .
- ^ Перейти обратно: а б Райнер Гемулла; Эрик Нейкамп; Питер Дж. Хаас ; Яннис Сисманис (2011). Крупномасштабная матричная факторизация с распределенным стохастическим градиентным спуском . Учеб. Международная конференция ACM SIGKDD. по обнаружению знаний и интеллектуальному анализу данных. стр. 69–77.
- ^ Ян Бао; и др. (2014). TopicMF: Одновременное использование рейтингов и обзоров для рекомендаций . АААИ.
- ^ Бен Мюррелл; и др. (2011). «Неотрицательная матричная факторизация для изучения моделей эволюции белков, специфичных для выравнивания» . ПЛОС ОДИН . 6 (12): e28898. Бибкод : 2011PLoSO...628898M . дои : 10.1371/journal.pone.0028898 . ПМЦ 3245233 . ПМИД 22216138 .
- ^ Уильям Х. Лоутон ; Эдвард А. Сильвестр (1971). «Разрешение кривой самомоделирования». Технометрика . 13 (3): 617–633. дои : 10.2307/1267173 . JSTOR 1267173 .
- ^ Пентти Паатеро; У Таппера; Паси Аалто; Маркку Кулмала (1991). «Методы матричной факторизации для анализа данных диффузионных батарей». Журнал аэрозольной науки . 22 : С273–С276. дои : 10.1016/S0021-8502(05)80089-8 . ISSN 0021-8502 . Викиданные Q58065673 .
- ^ Пентти Паатеро; У Таппера (июнь 1994 г.). «Положительная матричная факторизация: неотрицательная факторная модель с оптимальным использованием оценок ошибок значений данных» . Экологометрия . 5 (2): 111–126. дои : 10.1002/ENV.3170050203 . ISSN 1180-4009 . Викиданные Q29308406 .
- ^ Пиа Анттила ; Пентти Паатеро ; У Таппера; Олли Ярвинен (1995). «Идентификация источника массовых влажных осаждений в Финляндии путем факторизации положительной матрицы». Атмосферная среда . 29 (14): 1705–1718. Бибкод : 1995AtmEn..29.1705A . дои : 10.1016/1352-2310(94)00367-Т .
- ^ Перейти обратно: а б Дэниел Д. Ли и Х. Себастьян Сын (1999). «Изучение частей объектов путем факторизации неотрицательной матрицы». Природа . 401 (6755): 788–791. Бибкод : 1999Natur.401..788L . дои : 10.1038/44565 . ПМИД 10548103 . S2CID 4428232 .
- ^ Перейти обратно: а б Дэниел Д. Ли и Х. Себастьян Сын (2001). Алгоритмы факторизации неотрицательной матрицы (PDF) . Достижения в области нейронных систем обработки информации 13: Материалы конференции 2000 года. МТИ Пресс . стр. 556–562.
- ^ Перейти обратно: а б с К. Дин, X. Хе, HD Саймон (2005). «Об эквивалентности неотрицательной матричной факторизации и спектральной кластеризации» . Учеб. Международная конференция SIAM. Интеллектуальный анализ данных, стр. 606-610. май 2005 г.
- ^ Дин С., Ли Ю, Пэн В. (2008). «Об эквивалентности неотрицательной матричной факторизации и вероятностной скрытой семантической индексации» (PDF) . Вычислительная статистика и анализ данных . 52 (8): 3913–3927. дои : 10.1016/j.csda.2008.01.011 . Архивировано из оригинала (PDF) 4 марта 2016 г.
- ^ Перейти обратно: а б К. Динг, Т. Ли, М. И. Джордан, Факторизация выпуклых и полунеотрицательных матриц, Транзакции IEEE по анализу шаблонов и машинному интеллекту, 32, 45-55, 2010 г.
- ^ Берман, А.; Р. Дж. Племмонс (1974). «Обратные неотрицательные матрицы». Линейная и полилинейная алгебра . 2 (2): 161–172. дои : 10.1080/03081087408817055 .
- ^ А. Берман; Р. Дж. Племмонс (1994). Неотрицательные матрицы в математических науках . Филадельфия: СИАМ.
- ^ Томас, LB (1974). «Задача 73-14. Ранговая факторизация неотрицательных матриц». СИАМ преп . 16 (3): 393–394. дои : 10.1137/1016064 .
- ^ Вавасис, С.А. (2009). «О сложности факторизации неотрицательной матрицы». СИАМ Дж. Оптим . 20 (3): 1364–1377. arXiv : 0708.4149 . дои : 10.1137/070709967 . S2CID 7150400 .
- ^ Чжан, Т.; Фанг, Б.; Лю, В.; Тан, ГГ; Он, Г.; Вэнь, Дж. (2008). «Факторизация неотрицательной матрицы на основе нормы полной вариации для идентификации дискриминантного представления шаблонов изображений». Нейрокомпьютинг . 71 (10–12): 1824–1831. doi : 10.1016/j.neucom.2008.01.022 .
- ^ Перейти обратно: а б Хойер, Патрик О. (2002). Неотрицательное разреженное кодирование . Учеб. Семинар IEEE по нейронным сетям для обработки сигналов. arXiv : cs/0202009 .
- ^ Перейти обратно: а б Лео Тасламан и Бьёрн Нильссон (2012). «Среда для регуляризованной неотрицательной матричной факторизации с применением к анализу данных экспрессии генов» . ПЛОС Один . 7 (11): е46331. Бибкод : 2012PLoSO...746331T . дои : 10.1371/journal.pone.0046331 . ПМЦ 3487913 . ПМИД 23133590 .
- ^ Се, CJ; Диллон, Исландия (2011). Методы быстрого координатного спуска с выбором переменных для факторизации неотрицательной матрицы (PDF) . Материалы 17-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных - KDD '11. п. 1064. дои : 10.1145/2020408.2020577 . ISBN 9781450308137 .
- ^ Фунг, Йик-Хинг; Ли, Чун-Хунг; Чунг, Уильям К. (2 ноября 2007 г.). Прогнозирование участия в онлайн-дискуссии с использованием неотрицательной матричной факторизации . Wi-Iatw '07. Компьютерное общество IEEE. стр. 284–287. ISBN 9780769530284 – через dl.acm.org.
- ^ Найян Гуань; Даченг Тао; Чжиган Ло и Бо Юань (июль 2012 г.). «Онлайн-факторизация неотрицательной матрицы с устойчивой стохастической аппроксимацией». Транзакции IEEE в нейронных сетях и системах обучения . 23 (7): 1087–1099. дои : 10.1109/TNNLS.2012.2197827 . ПМИД 24807135 . S2CID 8755408 .
- ^ Бенке, С. (2003). «Обнаружение иерархических особенностей речи с использованием сверточной неотрицательной матричной факторизации» . Материалы Международной совместной конференции по нейронным сетям, 2003 г. Том. 4. Портленд, Орегон, США: IEEE. стр. 2758–2763. дои : 10.1109/IJCNN.2003.1224004 . ISBN 978-0-7803-7898-8 . S2CID 3109867 .
- ^ Перейти обратно: а б Линь, Чи-Джен (2007). «Методы прогнозируемого градиента для факторизации неотрицательных матриц» (PDF) . Нейронные вычисления . 19 (10): 2756–2779. CiteSeerX 10.1.1.308.9135 . дои : 10.1162/neco.2007.19.10.2756 . ПМИД 17716011 . S2CID 2295736 .
- ^ Линь, Чи-Джен (2007). «О сходимости алгоритмов мультипликативного обновления для факторизации неотрицательных матриц». Транзакции IEEE в нейронных сетях . 18 (6): 1589–1596. CiteSeerX 10.1.1.407.318 . дои : 10.1109/TNN.2007.895831 . S2CID 2183630 .
- ^ Хёнсу Ким и Хэсон Пак (2008). «Факторизация неотрицательной матрицы на основе метода наименьших квадратов с переменным неотрицательностью и метода активного множества» (PDF) . Журнал SIAM по матричному анализу и его приложениям . 30 (2): 713–730. CiteSeerX 10.1.1.70.3485 . дои : 10.1137/07069239x .
- ^ Найян Гуань; Даченг Тао; Чжиган Ло; Бо Юань (июнь 2012 г.). «NeNMF: метод оптимального градиента для факторизации неотрицательной матрицы». Транзакции IEEE по обработке сигналов . 60 (6): 2882–2898. Бибкод : 2012ITSP...60.2882G . дои : 10.1109/TSP.2012.2190406 . S2CID 8143231 .
- ^ Джингу Ким и Пак Хэсон (2011). «Быстрая факторизация неотрицательной матрицы: метод, подобный активному множеству, и сравнения». Журнал SIAM по научным вычислениям . 58 (6): 3261–3281. Бибкод : 2011ГАО...33.3261К . CiteSeerX 10.1.1.419.798 . дои : 10.1137/110821172 .
- ^ Джингу Ким; Юньлун Хэ и Хэсун Пак (2013). «Алгоритмы неотрицательной матричной и тензорной факторизации: единое представление, основанное на системе спуска блочных координат» (PDF) . Журнал глобальной оптимизации . 33 (2): 285–319. дои : 10.1007/s10898-013-0035-4 . S2CID 11197117 .
- ^ Дин, К.; Он, X. и Саймон, HD (2005). «Об эквивалентности неотрицательной матричной факторизации и спектральной кластеризации». Учеб. SIAM Конференция по интеллектуальному анализу данных . Том. 4. С. 606–610. дои : 10.1137/1.9781611972757.70 . ISBN 978-0-89871-593-4 .
- ^ Хафшеджани, Саджад Фатхи; Моаберфард, Захра (ноябрь 2022 г.). «Инициализация факторизации неотрицательной матрицы: всесторонний обзор». Международный журнал науки о данных и аналитики . 16 (1): 119–134. arXiv : 2109.03874 . дои : 10.1007/s41060-022-00370-9 . ISSN 2364-415X .
- ^ Перейти обратно: а б Чжу, Гуантунь Б. (19 декабря 2016 г.). «Неотрицательная матричная факторизация (NMF) с гетероскедастическими неопределенностями и отсутствующими данными». arXiv : 1612.06037 [ astro-ph.IM ].
- ^ Перейти обратно: а б Саммер, Реми; Пуэйо, Лоран; Ларкин, Джеймс (2012). «Обнаружение и характеристика экзопланет и дисков с использованием проекций на собственных изображениях Карунена-Лоэва». Письма астрофизического журнала . 755 (2): Л28. arXiv : 1207.4197 . Бибкод : 2012ApJ...755L..28S . дои : 10.1088/2041-8205/755/2/L28 . S2CID 51088743 .
- ^ Перейти обратно: а б с Пуэйо, Лоран (2016). «Обнаружение и характеристика экзопланет с использованием проекций на собственных изображениях Кархунен-Лёве: перспективное моделирование» . Астрофизический журнал . 824 (2): 117. arXiv : 1604.06097 . Бибкод : 2016ApJ...824..117P . дои : 10.3847/0004-637X/824/2/117 . S2CID 118349503 .
- ^ Кэмпбелл, СЛ; Дж. Д. Пул (1981). «Вычисление факторизаций неотрицательного ранга» . Приложение линейной алгебры . 35 : 175–182. дои : 10.1016/0024-3795(81)90272-х .
- ^ Калофолиас, В.; Галлопулос, Э. (2012). «Вычисление симметричных неотрицательных ранговых факторизаций» (PDF) . Приложение линейной алгебры . 436 (2): 421–435. дои : 10.1016/j.laa.2011.03.016 .
- ^ Перейти обратно: а б Арора, Санджив; Ге, Ронг; Халперн, Йони; Мимно, Дэвид; Мойтра, Анкур; Зонтаг, Дэвид; Ву, Ичен; Чжу, Майкл (2013). Практический алгоритм тематического моделирования с доказуемыми гарантиями . Материалы 30-й Международной конференции по машинному обучению. arXiv : 1212.4777 . Бибкод : 2012arXiv1212.4777A .
- ^ Ли, Дэниел Д.; Себастьян, Сын, Х. (1999). «Изучение частей объектов путем факторизации неотрицательной матрицы» (PDF) . Природа . 401 (6755): 788–791. Бибкод : 1999Natur.401..788L . дои : 10.1038/44565 . ПМИД 10548103 . S2CID 4428232 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Рэй Бантайн (2002). Вариационные расширения EM и полиномиального PCA (PDF) . Учеб. Европейская конференция по машинному обучению (ECML-02). ЛНАИ. Том. 2430. стр. 23–34.
- ^ Эрик Гаусье и Сирил Гутт (2005). Связь между PLSA и NMF и последствия (PDF) . Учеб. 28-я международная конференция ACM SIGIR по исследованиям и разработкам в области информационного поиска (SIGIR-05). стр. 601–602. Архивировано из оригинала (PDF) 28 сентября 2007 г. Проверено 29 января 2007 г.
- ^ Рон Засс и Амнон Шашуа (2005). « Объединяющий подход к жесткой и вероятностной кластеризации ». Международная конференция по компьютерному зрению (ICCV), Пекин, Китай, октябрь 2005 г.
- ^ Макс Веллинг; и др. (2004). Экспоненциальные семейные гармонии с применением к информационному поиску . НИПС.
- ^ Пентти Паатеро (1999). «Мультилинейный двигатель: управляемая таблицами программа наименьших квадратов для решения полилинейных задач, включая модель n-стороннего параллельного факторного анализа». Журнал вычислительной и графической статистики . 8 (4): 854–888. дои : 10.2307/1390831 . JSTOR 1390831 .
- ^ Макс Веллинг и Маркус Вебер (2001). «Положительная тензорная факторизация». Буквы для распознавания образов . 22 (12): 1255–1261. Бибкод : 2001PaReL..22.1255W . CiteSeerX 10.1.1.21.24 . дои : 10.1016/S0167-8655(01)00070-8 .
- ^ Джингу Ким и Пак Хэсон (2012). Быстрая неотрицательная тензорная факторизация с помощью метода, подобного активному множеству (PDF) . Высокопроизводительные научные вычисления: алгоритмы и приложения. Спрингер. стр. 311–326.
- ^ Кенан Йылмаз; А. Тайлан Джемгил и Умут Симсекли (2011). Обобщенная связанная тензорная факторизация (PDF) . НИПС.
- ^ Вамси К. Потлуру; Сергей М. Плис; Мортен Моруп; Винс Д. Калхун и Терран Лейн (2009). Эффективные мультипликативные обновления для машин опорных векторов . Материалы конференции SIAM 2009 г. по интеллектуальному анализу данных (SDM). стр. 1218–1229.
- ^ Вэй Сюй; Синь Лю и Ихонг Гун (2003). Кластеризация документов на основе факторизации неотрицательной матрицы . Материалы 26-й ежегодной международной конференции ACM SIGIR по исследованиям и разработкам в области информационного поиска. Нью-Йорк: Ассоциация вычислительной техники . стр. 267–273.
- ^ Эггерт, Дж.; Корнер, Э. (2004). «Разреженное кодирование и NMF». 2004 г. Международная совместная конференция IEEE по нейронным сетям (номер по каталогу IEEE 04CH37541) . Том. 4. С. 2529–2533. дои : 10.1109/IJCNN.2004.1381036 . ISBN 978-0-7803-8359-3 . S2CID 17923083 .
- ^ Берне, О.; Джоблин, К. ; Девиль, Ю.; Смит, доктор медицинских наук; Рапачоли, М.; Бернард, JP; Томас, Дж.; Рич, В.; Абергель, А. (1 июля 2007 г.). «Анализ выбросов очень мелких частиц пыли по данным спектроскопии Спитцера с использованием слепых методов разделения сигналов» . Астрономия и астрофизика . 469 (2): 575–586. arXiv : astro-ph/0703072 . Бибкод : 2007A&A...469..575B . дои : 10.1051/0004-6361:20066282 . ISSN 0004-6361 .
- ^ Лафреньер, Давид; Мароид, Кристиан; Дойон, Рене; Бармен, Трэвис (2009). «Обнаружение HST/NICMOS HR 8799 b в 1998 году». Письма астрофизического журнала . 694 (2): L148. arXiv : 0902.3247 . Бибкод : 2009ApJ...694L.148L . дои : 10.1088/0004-637X/694/2/L148 . S2CID 7332750 .
- ^ Амара, Адам; Кванц, Саша П. (2012). «PYNPOINT: пакет обработки изображений для поиска экзопланет». Ежемесячные уведомления Королевского астрономического общества . 427 (2): 948. arXiv : 1207.6637 . Бибкод : 2012MNRAS.427..948A . дои : 10.1111/j.1365-2966.2012.21918.x . S2CID 119200505 .
- ^ Ваххадж, Захед; Сьеса, Лукас А.; Мавет, Дмитрий; Ян, Бин; Кановас, Гектор; де Бур, Джозуа; Касасс, Симон; Менар, Франсуа; Шрайбер, Матиас Р.; Лю, Майкл С.; Биллер, Бет А.; Нильсен, Эрик Л.; Хейворд, Томас Л. (2015). «Улучшение соотношения сигнал/шум при прямом получении изображений экзопланет и околозвездных дисков с помощью MLOCI». Астрономия и астрофизика . 581 (24): А24. arXiv : 1502.03092 . Бибкод : 2015A&A...581A..24W . дои : 10.1051/0004-6361/201525837 . S2CID 20174209 .
- ^ Нильсен, Финн Аруп; Балслев, Даниэла; Хансен, Ларс Кай (2005). «Изучение задней поясной извилины: разделение между компонентами памяти и боли» (PDF) . НейроИмидж . 27 (3): 520–522. doi : 10.1016/j.neuroimage.2005.04.034 . ПМИД 15946864 . S2CID 18509039 .
- ^ Коэн, Уильям (4 апреля 2005 г.). «Набор данных электронной почты Enron» . Проверено 26 августа 2008 г.
- ^ Берри, Майкл В.; Браун, Мюррей (2005). «Наблюдение за электронной почтой с использованием факторизации неотрицательной матрицы». Теория вычислительной и математической организации . 11 (3): 249–264. дои : 10.1007/s10588-005-5380-5 . S2CID 16249147 .
- ^ Нильсен, Год Финна (2008). Кластеризация научных цитат в Википедии Викимания arXiv : 0805.1154 .
- ^ Хасани, Али; Иранманеш, Амир; Мансури, Наджме (12 ноября 2019 г.). «Интеллектуальный анализ текста с использованием неотрицательной матричной факторизации и скрытого семантического анализа». arXiv : 1911.04705 [ cs.LG ].
- ^ Берри, Майкл В.; Браун, Мюррей; Лэнгвилл, Эми Н.; Паукак, В. Пол; Племмонск, Роберт Дж. (15 сентября 2007 г.). «Алгоритмы и приложения для приближенной факторизации неотрицательных матриц». Вычислительная статистика и анализ данных . 52 (1): 155–173. дои : 10.1016/j.csda.2006.11.006 .
- ^ Юн Мао; Лоуренс Сол и Джонатан М. Смит (2006). «IDES: служба оценки расстояния в Интернете для больших сетей». Журнал IEEE по избранным областям коммуникаций . 24 (12): 2273–2284. CiteSeerX 10.1.1.136.3837 . дои : 10.1109/JSAC.2006.884026 . S2CID 12931155 .
- ^ Ян Чен; Сяо Ван; Конг Ши; и др. (2011). «Феникс: сетевая система координат на основе веса с использованием матричной факторизации» (PDF) . Транзакции IEEE по управлению сетями и услугами . 8 (4): 334–347. CiteSeerX 10.1.1.300.2851 . дои : 10.1109/tnsm.2011.110911.100079 . S2CID 8079061 . Архивировано из оригинала (PDF) 14 ноября 2011 г.
- ^ Шмидт, Миннесота, Дж. Ларсен и FT Сяо. (2007). « Снижение шума ветра с использованием неотрицательного разреженного кодирования », Машинное обучение для обработки сигналов, Семинар IEEE , 431–436.
- ^ Фришо Э., Матье Ф., Труйон Т., Бушар Г., Франсуа О. (2014). «Быстрая и эффективная оценка индивидуальных коэффициентов происхождения» . Генетика . 196 (4): 973–983. дои : 10.1534/genetics.113.160572 . ПМЦ 3982712 . ПМИД 24496008 .
- ^ Девараджан, К. (2008). «Неотрицательная матричная факторизация: инструмент анализа и интерпретации в вычислительной биологии» . PLOS Вычислительная биология . 4 (7): e1000029. Бибкод : 2008PLSCB...4E0029D . дои : 10.1371/journal.pcbi.1000029 . ПМК 2447881 . ПМИД 18654623 .
- ^ Хёнсу Ким и Хэсон Пак (2007). «Разреженная неотрицательная матричная факторизация с помощью чередующихся наименьших квадратов с неотрицательными ограничениями для анализа данных микрочипов» . Биоинформатика . 23 (12): 1495–1502. doi : 10.1093/биоинформатика/btm134 . ПМИД 17483501 .
- ^ Швальбе, Э. (2013). «Профилирование метилирования ДНК медуллобластомы позволяет провести надежную подклассификацию и улучшить прогнозирование результатов с использованием биопсий, фиксированных формалином» . Акта Нейропатологика . 125 (3): 359–371. дои : 10.1007/s00401-012-1077-2 . ПМК 4313078 . ПМИД 23291781 .
- ^ Александров Людмил Борисович; Ник-Зайнал, Серена; Ведж, Дэвид К.; Кэмпбелл, Питер Дж.; Страттон, Майкл Р. (31 января 2013 г.). «Расшифровка признаков мутационных процессов, происходящих при раке человека» . Отчеты по ячейкам . 3 (1): 246–259. дои : 10.1016/j.celrep.2012.12.008 . ISSN 2211-1247 . ПМЦ 3588146 . ПМИД 23318258 .
- ^ Стейн-О'Брайен, Женевьева Л.; Арора, Раман; Калхейн, Эдин К.; Фаворов Александр Владимирович; Гармир, Лана X.; Грин, Кейси С.; Гофф, Лоял А.; Ли, Ифэн; Нгом, Алун; Окс, Майкл Ф.; Сюй, Яньсюнь (01 октября 2018 г.). «Введите матрицу: факторизация раскрывает знания, полученные от омиков» . Тенденции в генетике . 34 (10): 790–805. дои : 10.1016/j.tig.2018.07.003 . ISSN 0168-9525 . ПМК 6309559 . ПМИД 30143323 .
- ^ Дин; Ли; Пэн; Парк (2006). «Ортогональные неотрицательные матричные t-факторизации для кластеризации». Материалы 12-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных . стр. 126–135. дои : 10.1145/1150402.1150420 . ISBN 1595933395 . S2CID 165018 .
- ^ Седдия; Пиноли; Кери; Массероли (2020). «Техника матричного факторизации для прогнозирования повторного использования лекарств». Журнал IEEE по биомедицинской и медицинской информатике . 24 (11): 3162–3172. дои : 10.1109/JBHI.2020.2991763 . ПМИД 32365039 . S2CID 218504587 .
- ^ Пиноли; Седдия; Кери; Массероли (2021). «Прогнозирование синергизма лекарств с помощью трифакторизации неотрицательной матрицы». Транзакции IEEE/ACM по вычислительной биологии и биоинформатике . ПП (4): 1956–1967. дои : 10.1109/TCBB.2021.3091814 . ПМИД 34166199 . S2CID 235634059 .
- ^ ДиПаола; Базен; Обри; Ауренго; Кавайолес; Херри; Кан (1982). «Обработка динамических последовательностей в ядерной медицине». IEEE Trans Nucl Sci . 29 (4): 1310–21. Бибкод : 1982ИТНС...29.1310Д . дои : 10.1109/tns.1982.4332188 . S2CID 37186516 .
- ^ Ситек; Гуллберг; Хьюсман (2002). «Коррекция неоднозначных решений в факторном анализе с использованием штрафной цели наименьших квадратов». IEEE Трансмедицинская визуализация . 21 (3): 216–25. дои : 10.1109/42.996340 . ПМИД 11989846 . S2CID 6553527 .
- ^ Бучко; Митра; Бейкер; Ягуст; Гуллберг (2015). «Применение кластерного инициируемого факторного анализа (CIFA) для классификации тканей при динамической ПЭТ головного мозга» . Журнал церебрального кровотока и метаболизма . 35 (7): 1104–11. дои : 10.1038/jcbfm.2015.69 . ПМК 4640278 . ПМИД 25899294 .
- ^ Абдала; Бучко; Митра; Гуллберг (2015). «Реконструкция 4-D динамических изображений ОФЭКТ из противоречивых проекций с использованием алгоритма FADS, инициализированного сплайном (SIFADS)» . IEEE Трансмедицинская визуализация . 34 (1): 216–18. дои : 10.1109/TMI.2014.2352033 . ПМИД 25167546 . S2CID 11060831 .
- ^ К. Буцидис и Э. Галлопулос (2008). «Инициализация на основе SVD: преимущество для факторизации неотрицательной матрицы». Распознавание образов . 41 (4): 1350–1362. Бибкод : 2008PatRe..41.1350B . CiteSeerX 10.1.1.137.8281 . дои : 10.1016/j.patcog.2007.09.010 .
- ^ Чао Лю; Хун-чжи Ян; Цзиньлян Фан; Ли-Вэй Хэ и И-Мин Ван (2010). «Факторизация распределенной неотрицательной матрицы для диадического анализа данных в веб-масштабе на MapReduce» (PDF) . Материалы 19-й Международной конференции по всемирной паутине .
- ^ Цзянтао Инь; Ликсин Гао и Чжунфэй (Марк) Чжан (2014). «Масштабируемая факторизация неотрицательной матрицы с блочными обновлениями» (PDF) . Материалы Европейской конференции по машинному обучению, принципам и практике обнаружения знаний в базах данных .
- ^ «Апач Махаут» . mahout.apache.org . Проверено 14 декабря 2019 г.
- ^ Донг Ван; Равичандер Випперла; Ник Эванс; Томас Фан Чжэн (2013). «Онлайн-обучение неотрицательным сверточным шаблонам для речевых сигналов» (PDF) . Транзакции IEEE по обработке сигналов . 61 (1): 44–56. Бибкод : 2013ITSP...61...44W . CiteSeerX 10.1.1.707.7348 . дои : 10.1109/tsp.2012.2222381 . S2CID 12530378 . Архивировано из оригинала (PDF) 19 апреля 2015 г. Проверено 19 апреля 2015 г.
- ^ Сяннань Хэ; Мин-Йен Кан; Пейчу Се и Сяо Чен (2014). «Многопредставленная кластеризация элементов Web 2.0 на основе комментариев» (PDF) . Материалы 23-й Международной конференции по всемирной паутине . Архивировано из оригинала (PDF) 2 апреля 2015 г. Проверено 22 марта 2015 г.
- ^ Цзялу Лю; Чи Ван; Цзин Гао и Цзявэй Хан (2013). «Многопредставленная кластеризация посредством совместной неотрицательной матричной факторизации». Материалы Международной конференции SIAM по интеллектуальному анализу данных 2013 г. (PDF) . стр. 252–260. CiteSeerX 10.1.1.301.1771 . дои : 10.1137/1.9781611972832.28 . ISBN 978-1-61197-262-7 . S2CID 4968 .
- ^ Чистиков, Дмитрий; Кифер, Стефан; Марушич, Инес; Ширмохаммади, Махса; Уоррелл, Джеймс (22 мая 2016 г.). «Неотрицательная матричная факторизация требует иррациональности». arXiv : 1605.06848 [ cs.CC ].
Другие
[ редактировать ]- Дж. Шен; Г.В. Израиль (1989). «Модель рецептора, использующая специальную технику неотрицательного преобразования окружающего аэрозоля» . Атмосферная среда . 23 (10): 2289–2298. Бибкод : 1989AtmEn..23.2289S . дои : 10.1016/0004-6981(89)90190-X .
- Пентти Паатеро (1997). «Формулировка надежного неотрицательного факторного анализа методом наименьших квадратов». Хемометрика и интеллектуальные лабораторные системы . 37 (1): 23–35. дои : 10.1016/S0169-7439(96)00044-5 .
- Рауль Компасс (2007). «Обобщенная мера дивергенции для факторизации неотрицательной матрицы». Нейронные вычисления . 19 (3): 780–791. дои : 10.1162/neco.2007.19.3.780 . ПМИД 17298233 . S2CID 5337451 .
- Лю, WX; Чжэн, NN и Ю, QB (2006). «Неотрицательная матричная факторизация и ее применение в распознавании образов». Китайский научный бюллетень . 51 (17–18): 7–18. Бибкод : 2006ЧСБу..51....7Л . дои : 10.1007/s11434-005-1109-6 . S2CID 15445516 .
- Нгок-Дьеп Хо; Пол Ван Доорен и Винсент Блондель (2008). «Методы спуска для факторизации неотрицательных матриц». arXiv : 0801.3199 [ cs.NA ].
- Эндрю Чихоцкий ; Рафал Здунек и Шун-ичи Амари (2008). «Неотрицательная матрица и тензорная факторизация». Журнал обработки сигналов IEEE . 25 (1): 142–145. Бибкод : 2008ISPM...25R.142C . дои : 10.1109/MSP.2008.4408452 . S2CID 9997603 .
- Седрик Февотт; Нэнси Бертен и Жан-Луи Дюрье (2009). «Неотрицательная матричная факторизация с расхождением Итакура-Сайто: применение к музыкальному анализу». Нейронные вычисления . 21 (3): 793–830. дои : 10.1162/neco.2008.04-08-771 . ПМИД 18785855 . S2CID 13208611 .
- Али Тайлан Джемгил (2009). «Байесовский вывод для моделей факторизации неотрицательной матрицы» . Вычислительный интеллект и нейронаука . 2009 (2): 1–17. дои : 10.1155/2009/785152 . ПМЦ 2688815 . ПМИД 19536273 .
- Анджей Чихоцкий, Мортен Мруп и др.: «Достижения в области неотрицательных матриц и тензорной факторизации», Hindawi Publishing Corporation, ISBN 978-9774540455 (2008).
- Анджей Цихоцкий, Рафал Здунек, Ань Хай Фан и Шун-ичи Амари: «Неотрицательные матричные и тензорные факторизации: приложения к исследовательскому многоходовому анализу данных и слепому разделению источников», Уайли, ISBN 978-0470746660 (2009).
- Андри Мирзал: «Неотрицательные матричные факторизации для кластеризации и LSI: теория и программирование», LAP LAMBERT Academic Publishing, ISBN 978-3844324891 (2011).
- Юн Сян: «Слепое разделение источников: анализ зависимых компонентов», Springer, ISBN 978-9812872265 (2014).
- Ганеш Р. Найк (ред.): «Методы факторизации неотрицательной матрицы: достижения в теории и приложениях», Springer, ISBN 978-3662517000 (2016).
- Джулиан Беккер: «Неотрицательная матричная факторизация с адаптивными элементами для разделения монофонических аудиоисточников: 1», Shaker Verlag GmbH, Германия, ISBN 978-3844048148 (2016).
- Джен-Цунг Чиен: «Разделение источников и машинное обучение», Academic Press, ISBN 978-0128177969 (2018).
- Сёдзи Макино (ред.): «Разделение аудиоисточников», Springer, ISBN 978-3030103033 (2019).
- Николас Гиллис: «Неотрицательная матричная факторизация», SIAM, ISBN 978-1-611976-40-3 (2020).