~~~~~~~~~~~~~~~~~~~~ Arc.Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~ 
Номер скриншота №:
✰ 1D2BBE3289432130BFC9DECC528A9F27__1718270040 ✰
Заголовок документа оригинал.:
✰ Google Neural Machine Translation - Wikipedia ✰
Заголовок документа перевод.:
✰ Нейронный машинный перевод Google — Википедия ✰
Снимок документа находящегося по адресу (URL):
✰ https://en.wikipedia.org/wiki/Google_Neural_Machine_Translation ✰
Адрес хранения снимка оригинал (URL):
✰ https://arc.ask3.ru/arc/aa/1d/27/1d2bbe3289432130bfc9decc528a9f27.html ✰
Адрес хранения снимка перевод (URL):
✰ https://arc.ask3.ru/arc/aa/1d/27/1d2bbe3289432130bfc9decc528a9f27__translat.html ✰
Дата и время сохранения документа:
✰ 18.06.2024 09:30:25 (GMT+3, MSK) ✰
Дата и время изменения документа (по данным источника):
✰ 13 June 2024, at 12:14 (UTC). ✰ 

~~~~~~~~~~~~~~~~~~~~~~ Ask3.Ru ~~~~~~~~~~~~~~~~~~~~~~ 
Сервисы Ask3.ru: 
 Архив документов (Снимки документов, в формате HTML, PDF, PNG - подписанные ЭЦП, доказывающие существование документа в момент подписи. Перевод сохраненных документов на русский язык.)https://arc.ask3.ruОтветы на вопросы (Сервис ответов на вопросы, в основном, научной направленности)https://ask3.ru/answer2questionТоварный сопоставитель (Сервис сравнения и выбора товаров) ✰✰
✰ https://ask3.ru/product2collationПартнерыhttps://comrades.ask3.ru


Совет. Чтобы искать на странице, нажмите Ctrl+F или ⌘-F (для MacOS) и введите запрос в поле поиска.
Arc.Ask3.ru: далее начало оригинального документа

Нейронный машинный перевод Google — Википедия Jump to content

Нейронный машинный перевод Google

Из Википедии, бесплатной энциклопедии

Google Neural Machine Translation (GNMT) — это система нейронного машинного перевода (NMT), разработанная Google и представленная в ноябре 2016 года, которая использовала искусственную нейронную сеть для повышения беглости и точности в Google Translate . [1] [2] [3] [4] Нейронная сеть состояла из двух основных блоков, кодера и декодера, оба имели архитектуру LSTM шириной 1024, прямой связи с 8 слоями шириной 1024 каждый и простой однослойный механизм соединяющий их. [4] [5] Общее количество параметров по разным оценкам превышает 160 миллионов. [6] около 210 миллионов, [7] 278 миллионов [8] или 380 миллионов. [9] К 2020 году систему заменила другая система глубокого обучения на основе преобразователей . [10]

GNMT улучшила качество перевода, применив на основе примеров (EBMT) метод машинного перевода , при котором система учится на миллионах примеров языкового перевода. [2] Предложенная GNMT архитектура системного обучения была впервые протестирована на более чем ста языках, поддерживаемых Google Translate. [2] Благодаря большой комплексной структуре система со временем учится создавать более качественные и естественные переводы. [1] GNMT пытается переводить целые предложения за раз, а не по частям. [1] Сеть GNMT может выполнять межъязыковой машинный перевод, кодируя семантику предложения, а не запоминая пофазный перевод. [2] [11]

История [ править ]

Проект Google Brain был создан в 2011 году в «секретной исследовательской лаборатории Google X». [12] Сотрудник Google Джефф Дин , исследователь Google Грег Коррадо и Стэнфордского университета профессор компьютерных наук Эндрю Нг . [13] [14] [15] Работа Нга привела к величайшим прорывам в Google и Стэнфорде. [12]

В ноябре 2016 года была представлена ​​система нейронного машинного перевода Google (GNMT). С тех пор Google Translate начал использовать нейронный машинный перевод (NMT) вместо предыдущих статистических методов (SMT). [1] [16] [17] [18] который использовался с октября 2007 года с использованием собственной собственной технологии SMT. [19] [20]

Обучение GNMT в то время требовало больших усилий и, по оценкам OpenAI на 2021 год, занимало порядка 100 PFLOP/с*день (до 10 22 FLOP) вычислений, что на 1,5 порядка больше, чем у модели Seq2seq 2014 года. [21] (но примерно в 2 раза меньше, чем GPT-J-6B в 2021 г.) [22] ).

Система NMT Google Translate использует большую искусственную нейронную сеть, способную к глубокому обучению . [1] [2] [3] Используя миллионы примеров, GNMT повышает качество перевода, [2] использование более широкого контекста для вывода наиболее релевантного перевода. Затем результат перестраивается и адаптируется для подхода к грамматически обоснованному человеческому языку. [1] Предложенная GNMT архитектура системного обучения была впервые протестирована на более чем ста языках, поддерживаемых Google Translate. [2] GNMT не создавала свой собственный универсальный интерлингва, а стремилась найти общее между многими языками, используя идеи психологии и лингвистики. [23] В ноябре 2016 года новая система перевода была впервые включена для восьми языков: на английский и французский, немецкий, испанский, португальский, китайский, японский, корейский и турецкий и обратно. [24] В марте 2017 года были включены три дополнительных языка: русский, хинди и вьетнамский, а также тайский, поддержка которого была добавлена ​​позже. [25] [26] В том же месяце с помощью сообщества Google Translate была добавлена ​​поддержка иврита и арабского языка. [27] В середине апреля 2017 года Google Нидерланды объявила о поддержке голландского и других европейских языков, родственных английскому. [28] В конце апреля 2017 года была добавлена ​​дополнительная поддержка девяти индийских языков: хинди, бенгали, маратхи, гуджарати, пенджаби, тамильского, телугу, малаялам и каннада. [29]

К 2020 году Google изменила методологию использования другой системы нейронных сетей на основе трансформаторов и постепенно отказалась от NMT. [30]

Оценка [ править ]

Утверждается, что система GNMT представляет собой улучшение по сравнению с прежним Google Translate в том смысле, что она сможет обрабатывать «нулевой перевод», то есть напрямую переводить один язык на другой (например, с японского на корейский). [2] Раньше Google Translate сначала переводил исходный язык на английский, а затем переводил английский на целевой язык , а не переводил напрямую с одного языка на другой. [11]

Исследование, проведенное в июле 2019 года в журнале Annals of Internal Medicine, показало, что «Google Translate — это жизнеспособный и точный инструмент для перевода исследований, проводимых не на английском языке». Только одно разногласие между рецензентами, читавшими результаты машинного перевода испытаний, было связано с ошибкой перевода. Поскольку многие медицинские исследования исключены из систематических обзоров, поскольку рецензенты не понимают языка, GNMT может уменьшить предвзятость и повысить точность таких обзоров. [31]

Языки, поддерживаемые GNMT [ править ]

По состоянию на декабрь 2021 года все языки Google Translate поддерживают GNMT, последним из которых является латынь.

  1. Африканский
  2. албанский
  3. амхарский
  4. арабский
  5. Армянский
  6. азербайджанский
  7. Баскский
  8. белорусский
  9. Бенгальский
  10. Боснийский
  11. болгарский
  12. бирманский
  13. каталонский
  14. кебуано
  15. Жевать
  16. Китайский упрощенный )
  17. Китайский традиционный )
  18. корсиканец
  19. хорватский
  20. Чешский
  21. датский
  22. Голландский
  23. Английский
  24. эсперанто
  25. эстонский
  26. Филиппинский ( Тагальский )
  27. финский
  28. Французский
  29. галисийский
  30. грузинский
  31. Немецкий
  32. Греческий
  33. Гуджарати
  34. гаитянский креольский
  35. Хауса
  36. гавайский
  37. иврит
  38. Неа
  39. Хмонг
  40. Венгерский
  41. исландский
  42. Игбо
  43. индонезийский
  44. ирландский
  45. итальянский
  46. Японский
  47. яванский
  48. Каннада
  49. казахский
  50. кхмерский
  51. Киньяруанда
  52. Корейский
  53. Kurdish (Kurmanjiкурдский
  54. киргизский
  55. туберкулез
  56. латинский
  57. Латышский
  58. Литовский
  59. Люксембургский
  60. македонский
  61. малагасийский
  62. малайский
  63. малаялам
  64. мальтийский
  65. маори
  66. Маратхи
  67. Монгольский
  68. непальский
  69. Норвежский ( букмол )
  70. Одия
  71. пушту
  72. персидский
  73. Польский
  74. португальский
  75. Пенджаби ( Гурмукхи )
  76. румынский
  77. Русский
  78. Самоанец
  79. Шотландский гэльский
  80. сербский
  81. Шона
  82. Синдхи
  83. сингальский
  84. словацкий
  85. словенский
  86. Сомали
  87. сото
  88. испанский
  89. суданский
  90. суахили
  91. Шведский
  92. таджикский
  93. тамильский
  94. татарский
  95. телугу
  96. тайский
  97. турецкий
  98. туркменский
  99. украинец
  100. Урду
  101. уйгурский
  102. Узбекский
  103. вьетнамский
  104. валлийский
  105. Западно-Фризский
  106. коса
  107. идиш
  108. Йоруба
  109. Зулу

См. также [ править ]

Ссылки [ править ]

  1. ^ Перейти обратно: а б с д Это ж Барак Туровский (15 ноября 2016 г.), «Найдено в переводе: более точные и беглые предложения в Google Translate» , блог Google , получено 11 января 2017 г.
  2. ^ Перейти обратно: а б с д Это ж г час Майк Шустер; Мелвин Джонсон; Нихил Торат (22 ноября 2016 г.), «Нулевой перевод с помощью многоязычной нейронной системы машинного перевода Google» , исследовательский блог Google , получено 11 января 2017 г.
  3. ^ Перейти обратно: а б Гил Фьюстер (5 января 2017 г.), «Потрясающее объявление об искусственном интеллекте от Google, которое вы, вероятно, пропустили» , freeCodeCamp , получено 11 января 2017 г.
  4. ^ Перейти обратно: а б Ву, Юнхуэй; Шустер, Майк; Чен, Чжифэн; Ле, Куок В.; Норузи, Мохаммед (2016). «Система нейронного машинного перевода Google: преодоление разрыва между человеческим и машинным переводом». arXiv : 1609.08144 . Бибкод : 2016arXiv160908144W . {{cite journal}}: Для цитирования журнала требуется |journal= ( помощь )
  5. ^ «Взгляд на архитектуру нейронной сети, используемой для нейронного машинного перевода Google» .
  6. ^ Цинь, Минхай; Чжан, Тяньюнь; Сунь, Фэй; Чен, Йен-Куанг; Фардад, Макан; Ван, Яньчжи; Се, Юань (2021). «Компактные многоуровневые разреженные нейронные сети с независимой от входных данных динамической перемаршрутизацией». arXiv : 2112.10930 [ cs.NE ].
  7. ^ «Сжатие модели нейронного машинного перевода Google — NLP Architect от Intel® AI Lab 0.5.5, документация» .
  8. ^ Лангруди, Хамед Ф.; Кария, Ведант; Пандит, Тедж; Кудитипуди, Дхириша (2021). «ПАЛАТКА: эффективное квантование нейронных сетей на крошечном краю с конической фиксированной точкой PoiNT». arXiv : 2104.02233 [ cs.LG ].
  9. ^ «Увеличение данных | Как использовать глубокое обучение, когда у вас ограниченные данные» . 19 мая 2021 г.
  10. ^ «Последние достижения в Google Translate» . исследование.google . Проверено 8 мая 2024 г.
  11. ^ Перейти обратно: а б Бойте, Кристиан; Бланшон, Эрве; Селигман, Марк; Беллинк, Валери (2010). «MT для Интернета» (PDF) . Архивировано из оригинала (PDF) 29 марта 2017 года . Проверено 1 декабря 2016 г.
  12. ^ Перейти обратно: а б Роберт Д. Хоф (14 августа 2014 г.). «Китайский интернет-гигант начинает мечтать: Baidu — неотъемлемая часть онлайн-жизни в Китае, но он хочет стать мировой державой. Может ли один из ведущих мировых исследователей искусственного интеллекта помочь ему бросить вызов крупнейшим компаниям Кремниевой долины?» . Обзор технологий . Проверено 11 января 2017 г.
  13. ^ Джефф Дин и Эндрю Нг (26 июня 2012 г.). «Использование крупномасштабного моделирования мозга для машинного обучения и искусственного интеллекта» Официальный блог Google . Проверено 26 января 2015 г.
  14. ^ «Крупномасштабный проект Google по глубоким нейронным сетям» . YouTube . Проверено 25 октября 2015 г.
  15. ^ Маркофф, Джон (25 июня 2012 г.). «Сколько компьютеров, чтобы идентифицировать кошку? 16 000» . Газета "Нью-Йорк Таймс . Проверено 11 февраля 2014 г.
  16. ^ Катянна Куах (17 ноября 2016 г.), «Нейронная сеть Google учится переводить языки, на которых она не обучалась: впервые в машинном переводе используется настоящее трансферное обучение» , The Register , получено 11 января 2017 г.
  17. ^ Льюис-Краус, Гидеон (14 декабря 2016 г.). «Великое пробуждение искусственного интеллекта» . Нью-Йорк Таймс . Проверено 11 января 2017 г.
  18. ^ Ле, Куок; Шустер, Майк (27 сентября 2016 г.). «Нейронная сеть для машинного перевода в промышленном масштабе» . Блог исследований Google . Проверено 1 декабря 2016 г.
  19. Google переходит на собственную систему перевода , 22 октября 2007 г.
  20. ^ Барри Шварц (23 октября 2007 г.). «Google Translate отказывается от SYSTRAN для домашнего перевода» . Земля поисковых систем .
  21. ^ «ИИ и вычисления» .
  22. ^ "Оглавление" . Гитхаб .
  23. ^ Крис Макдональд (7 января 2017 г.), Комментируя статью Гила Фьюстера в журнале Atlantic от 5 января , получено 11 января 2017 г.
  24. ^ Туровский, Барак (15 ноября 2016 г.). «Найдено в переводе: более точные и беглые предложения в Google Translate» . Ключевое слово Блог Google . Проверено 1 декабря 2016 г.
  25. ^ Перес, Сара (6 марта 2017 г.). «Умная система перевода Google на базе искусственного интеллекта распространяется на большее количество языков» . ТехКранч . Компания Oath Inc.
  26. ^ Туровский, Барак (6 марта 2017 г.). «Более качественные нейронные переводы для большего количества языков» . Ключевое слово Блог Google . Проверено 6 марта 2017 г.
  27. ^ Новет, Иордания (30 марта 2017 г.). «Теперь Google предоставляет переводы на арабский и иврит с помощью искусственного интеллекта» . ВенчурБит .
  28. ^ Финге, Рашид (19 апреля 2017 г.). «Большое улучшение голландского языка в Google Translate» . Блог Google в Нидерландах (на голландском языке).
  29. ^ Туровский, Барак (25 апреля 2017 г.). «Сделать Интернет более инклюзивным в Индии» . Ключевое слово .
  30. ^ «Последние достижения в Google Translate» . исследование.google . Проверено 8 мая 2024 г.
  31. ^ Джексон, Джеффри Л; Курияма, Акира; Антон, Андреа; Цой, апрель; Фурнье, Жан-Паскаль; Гейер, Анн-Катрин; Жакериоз, Фредерик; Коган, Дмитрий; Шолкофф, Сесилия; Сунь, Рао (30 июля 2019 г.). «Точность Google Translate для абстрагирования данных неанглоязычных исследований для систематических обзоров». Анналы внутренней медицины . 171 (9): 678. дои : 10.7326/M19-0891 . ISSN   0570-183X . ПМИД   31357212 . S2CID   198980789 .

Внешние ссылки [ править ]

Arc.Ask3.Ru: конец оригинального документа.
Arc.Ask3.Ru
Номер скриншота №: 1D2BBE3289432130BFC9DECC528A9F27__1718270040
URL1:https://en.wikipedia.org/wiki/Google_Neural_Machine_Translation
Заголовок, (Title) документа по адресу, URL1:
Google Neural Machine Translation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть, любые претензии не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, денежную единицу можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)