Jump to content

U-Net

U-Net — это сверточная нейронная сеть , разработанная для сегментации биомедицинских изображений на факультете компьютерных наук Фрайбургского университета . [1] Сеть основана на полностью сверточной нейронной сети. [2] чья архитектура была изменена и расширена для работы с меньшим количеством обучающих изображений и для более точной сегментации . Сегментация изображения размером 512×512 занимает меньше секунды на современном (2015 г.) графическом процессоре с использованием архитектуры U-Net. [1]

Архитектура U-Net также использовалась в моделях диффузии для итеративного шумоподавления изображений. [3] Эта технология лежит в основе многих современных моделей генерации изображений, таких как DALL-E , Midjourney и Stable Diffusion .

Описание [ править ]

Архитектура U-Net основана на так называемой «полностью сверточной сети», предложенной Лонгом, Шелхамером и Дарреллом в 2014 году. [2]

Основная идея состоит в том, чтобы дополнить обычную контрактную сеть последовательными слоями, где операции объединения заменяются операторами повышения дискретизации . Следовательно, эти слои увеличивают разрешение вывода. Затем последующий сверточный слой может научиться собирать точный результат на основе этой информации. [1]

Одним из важных изменений в U-Net является то, что в части повышающей дискретизации имеется большое количество функциональных каналов, которые позволяют сети распространять контекстную информацию на уровни с более высоким разрешением. Как следствие, расширяющийся путь более или менее симметричен сжимающейся части и имеет U-образную архитектуру. Сеть использует только действительную часть каждой свертки без каких-либо полностью связанных слоев. [2] Чтобы предсказать пиксели в граничной области изображения, недостающий контекст экстраполируется путем зеркального отражения входного изображения. Эта стратегия мозаики важна для применения сети к большим изображениям, поскольку в противном случае разрешение будет ограничено памятью графического процессора .

История [ править ]

U-Net была создана Олафом Роннебергером, Филиппом Фишером и Томасом Броксом в 2015 году, о чем сообщается в статье «U-Net: сверточные сети для сегментации биомедицинских изображений». [1] Это улучшение и развитие FCN: Эван Шелхамер, Джонатан Лонг, Тревор Даррелл (2014). «Полностью сверточные сети для семантической сегментации». [2]

Сетевая архитектура [ править ]

Сеть состоит из сужающегося и расширяющегося путей, что придает ей U-образную архитектуру. Путь сокращения представляет собой типичную сверточную сеть, состоящую из многократного применения сверток , за каждой из которых следует выпрямленная линейная единица (ReLU) и операция максимального объединения . Во время сжатия пространственная информация уменьшается, а информация о характеристиках увеличивается. Расширенный путь объединяет особенности и пространственную информацию посредством последовательности восходящих сверток и конкатенаций с функциями высокого разрешения из сужающегося пути. [4]

Это пример архитектуры U-Net для создания масок изображения k размером 256x256 для изображения RGB размером 256x256 пикселей.

Приложения [ править ]

Существует множество приложений U-Net для сегментации биомедицинских изображений , таких как сегментация изображений мозга («BRATS»). [5] ) и сегментация изображений печени ("siliver07" [6] ), а также предсказание сайта связывания белка. [7] Реализации U-Net также нашли применение в физических науках, например, при анализе микрофотографий материалов. [8] [9] [10] Варианты U-Net также применялись для реконструкции медицинских изображений. [11] Вот некоторые варианты и применения U-Net:

  1. Пиксельная регрессия с использованием U-Net и его приложения для панорамирования; [12]
  2. 3D U-Net: обучение плотной объемной сегментации по разреженным аннотациям; [13]
  3. TernausNet: U-Net с кодировщиком VGG11, предварительно обученным на ImageNet для сегментации изображений. [14]
  4. Преобразование изображения в изображение для оценки флуоресцентных пятен [15]
  5. В предсказании сайта связывания структуры белка. [7]

Ссылки [ править ]

  1. Перейти обратно: Перейти обратно: а б с д Роннебергер О., Фишер П., Брокс Т. (2015). «U-Net: сверточные сети для сегментации биомедицинских изображений». arXiv : 1505.04597 [ cs.CV ].
  2. Перейти обратно: Перейти обратно: а б с д Шелхамер Э., Лонг Дж., Даррел Т. (ноябрь 2014 г.). «Полностью сверточные сети для семантической сегментации». Транзакции IEEE по анализу шаблонов и машинному интеллекту . 39 (4): 640–651. arXiv : 1411.4038 . дои : 10.1109/TPAMI.2016.2572683 . ПМИД   27244717 . S2CID   1629541 .
  3. ^ Хо, Джонатан (2020). «Вероятностные модели диффузии с шумоподавлением». arXiv : 2006.11239 [ cs.LG ].
  4. ^ «Код U-Net» .
  5. ^ «MICCAI BraTS 2017: Объем | Секция анализа биомедицинских изображений (SBIA) | Медицинская школа Перельмана при Пенсильванском университете» . www.med.upenn.edu . Проверено 24 декабря 2018 г.
  6. ^ «SLIVER07: Дом» . www.sliver07.org . Проверено 24 декабря 2018 г.
  7. Перейти обратно: Перейти обратно: а б Назем Ф., Гасеми Ф., Фассихи А., Денави А.М. (апрель 2021 г.). «3D U-Net: основанный на вокселях метод предсказания структуры белка на сайте связывания». Журнал биоинформатики и вычислительной биологии . 19 (2): 2150006. doi : 10.1142/S0219720021500062 . ПМИД   33866960 . S2CID   233300145 .
  8. ^ Чен, Фу-Сян Рикудо; Линь, Чиа-Ю; Сяо, Хуэй-Ин; Цзянь, Чэн-Юань; Ян, Юн-Чэн; Линь, Чун-Лян (14 февраля 2023 г.). «Среда обнаружения атомных дефектов двумерных материалов на основе глубокого обучения» . Научные данные . 10 (1): 91. doi : 10.1038/s41597-023-02004-6 . ISSN   2052-4463 . ПМК   9929095 . ПМИД   36788235 .
  9. ^ Ши, Пэн; Дуань, Мэнмэн; Ян, Лифан; Фэн, Вэй; Дин, Ляньхун; Цзян, Лиу (22 июня 2022 г.). «Улучшенный метод сегментации изображений U-Net и его применение для статистики размеров металлических зерен» . Материалы . 15 (13): 4417. дои : 10.3390/ma15134417 . ISSN   1996-1944 гг . ПМЦ   9267311 . ПМИД   35806543 .
  10. ^ Патрик, Мэтью Дж; Экстайн, Джеймс К.; Лопес, Хавьер Р.; Тодерас, Сильвия; Ашер, Сара А; Ванг, Сильвия I; Левин, Стейси; Рикман, Джеффри М; Бармак, Катаюн (15 ноября 2023 г.). «Автоматическое обнаружение границ зерен для изображений просвечивающей электронной микроскопии в светлом поле через U-Net» . Микроскопия и микроанализ . arXiv : 2312.09392 . дои : 10.1093/micmic/ozad115 . ISSN   1431-9276 . ПМИД   37966960 .
  11. ^ Андерссон Дж., Альстрем Х., Куллберг Дж. (сентябрь 2019 г.). «Разделение сигналов воды и жира при градиентном эхо-сканировании всего тела с использованием сверточных нейронных сетей» . Магнитный резонанс в медицине . 82 (3): 1177–1186. дои : 10.1002/mrm.27786 . ПМК   6618066 . ПМИД   31033022 .
  12. ^ Яо В., Цзэн Цз., Лянь С., Тан Х. (27 октября 2018 г.). «Пиксельная регрессия с использованием U-Net и ее применения для панорамирования». Нейрокомпьютинг . 312 : 364–371. дои : 10.1016/j.neucom.2018.05.103 . ISSN   0925-2312 . S2CID   207119255 .
  13. ^ Чичек О, Абдулкадир А, Линкамп С.С., Брокс Т., Роннебергер О (2016). «3D U-Net: изучение плотной объемной сегментации по разреженным аннотациям». arXiv : 1606.06650 [ cs.CV ].
  14. ^ Игловиков В, Швец А (2018). «TernausNet: U-Net с кодировщиком VGG11, предварительно обученным на ImageNet для сегментации изображений». arXiv : 1801.05746 [ cs.CV ].
  15. ^ Кандел М.Э., Хе Ю.Р., Ли Ю.Дж., Чен Т.Х., Салливан К.М., Айдин О. и др. (декабрь 2020 г.). «Фазовая визуализация с вычислительной специфичностью (PICS) для измерения изменений сухой массы в субклеточных компартментах» . Природные коммуникации . 11 (1): 6256. arXiv : 2002.08361 . дои : 10.1038/s41467-020-20062-x . ПМЦ   7721808 . ПМИД   33288761 .

Реализации [ править ]

  • Tensorflow Unet от Дж. Акерета (2017)
  • Исходный код U-Net из отдела распознавания образов и обработки изображений факультета компьютерных наук Фрайбургского университета, Германия.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 16c580972d923382385d6b6baf0307fe__1715334060
URL1:https://arc.ask3.ru/arc/aa/16/fe/16c580972d923382385d6b6baf0307fe.html
Заголовок, (Title) документа по адресу, URL1:
U-Net - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)