Jump to content

Ашиш Васвани

Ашиш Васвани
Рожденный 1986
Альма-матер
Известный Трансформатор (архитектура глубокого обучения)
Научная карьера
Поля
Учреждения
Диссертация Меньшие, более быстрые и точные модели статистического машинного перевода   (2014 г.)
Докторантура
  • Дэвид Чан
  • Лян Хуан
Веб-сайт https://www.isi.edu/~avaswani/

Ашиш Васвани учёный-компьютерщик , занимающийся глубоким обучением . [1] который известен своим значительным вкладом в область искусственного интеллекта (ИИ) и обработки естественного языка (НЛП). Он является одним из соавторов основополагающей статьи « Внимание — это все, что вам нужно ». [2] который представил модель Трансформера , новую архитектуру, использующую механизм самообслуживания и с тех пор ставшую основой многих современных моделей НЛП. Архитектура- трансформер — это ядро ​​языковых моделей , которые используются в таких приложениях, как ChatGPT . [3] [4] [5] Он был соучредителем Adept AI Labs. [6] [7] и бывший научный сотрудник Google Brain . [8] [9]

Васвани получил степень инженера в области компьютерных наук в BIT Mesra в 2002 году. В 2004 году он переехал в США, чтобы продолжить высшее образование в Университете Южной Калифорнии . [10] Он защитил докторскую диссертацию в Университете Южной Калифорнии под руководством профессора Дэвида Чанга. [11] Он работал исследователем в Google, [12] где он был частью команды Google Brain . Он был соучредителем Adept AI Labs, но с тех пор покинул компанию. [13] [14]

Известные работы

[ редактировать ]

Самая известная работа Васвани — статья « Внимание — это все, что вам нужно », опубликованная в 2017 году. [15] В документе представлена ​​модель Трансформера , которая избегает использования повторения в «последовательность за последовательностью» задачах самообслуживания и полностью полагается на механизмы . Модель сыграла важную роль в разработке нескольких последующих современных моделей НЛП , включая BERT , [16] ГПТ-2 и ГПТ-3 .

  1. ^ «Ашиш Васвани» . ученый.google.com . Проверено 11 июля 2023 г.
  2. ^ Васвани, Ашиш ; Шазир, Ноам; Пармар, Ники; Ушкорейт, Якоб; Джонс, Лион; Гомес, Эйдан Н ; Кайзер, Лукаш; Полосухин, Илья (2017). «Внимание — это все, что вам нужно» (PDF) . Достижения в области нейронных систем обработки информации . 30 . Карран Ассошиэйтс, Инк.
  3. ^ «Внутри мозга ChatGPT» . stackbuilders.com . Проверено 12 июля 2023 г.
  4. ^ «Понимание ChatGPT, объясненное ChatGPT» . Прогрессивная аналитика . 18 января 2023 г. Проверено 12 июля 2023 г.
  5. ^ Ситхараман, Дипа; Джин, Бербер (08 мая 2023 г.). «Лихорадка ChatGPT заставляет инвесторов вкладывать миллиарды в стартапы в области искусственного интеллекта, бизнес-план не требуется» . Уолл Стрит Джорнал . ISSN   0099-9660 . Проверено 12 июля 2023 г.
  6. ^ «Представляем Адепта» .
  7. ^ «Ведущие исследователи искусственного интеллекта из Google привлекли финансирование в размере 8 миллионов долларов от Thrive Capital» . Экономические времена . 4 мая 2023 г.
  8. ^ Васвани, Ашиш; Шазир, Ноам; Пармар, Ники; Ушкорейт, Якоб; Джонс, Лион; Гомес, Эйдан Н.; Кайзер, Лукаш; Полосухин Илья (21 мая 2017 г.). «Внимание – это все, что вам нужно». arXiv : 1706.03762 [ cs.CL ].
  9. ^ Шид, Сэм (10 июня 2022 г.). «Гуру ИИ покидают крупные технологические компании, чтобы работать над новыми модными стартапами» . CNBC . Проверено 12 июля 2023 г.
  10. ^ Команда OfficeChai (4 февраля 2023 г.). «Индийские исследователи, чья работа привела к созданию ChatGPT» . ОфисЧай .
  11. ^ «Веб-страница Ашиша Васвани в ISI» . www.isi.edu .
  12. ^ «Трансформер: новая архитектура нейронной сети для понимания языка» . ai.googleblog.com . 31 августа 2017 г.
  13. ^ Раджеш, Ананья Мариам; Ху, Кристал; Раджеш, Ананья Мариам; Ху, Кристал (16 марта 2023 г.). «ИИ-стартап Adept привлекает $350 млн нового финансирования» . Рейтер – через www.reuters.com.
  14. ^ Тонг, Анна; Ху, Кристал; Тонг, Анна; Ху, Кристал (04 мая 2023 г.). «Ведущие исследователи искусственного интеллекта из Google привлекают финансирование от Thrive Capital» . Рейтер . Проверено 11 июля 2023 г.
  15. ^ «Выпускники USC проложили путь к ChatGPT» . ОСК Витерби | Инженерная школа .
  16. ^ Девлин, Джейкоб; Чанг, Мин-Вэй; Ли, Кентон; Тутанова Кристина (24 мая 2019 г.). «БЕРТ: Предварительная подготовка глубоких двунаправленных преобразователей для понимания языка». arXiv : 1810.04805 [ cs.CL ].
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b24e92ec9b0b0b4d08c1995d6633104a__1719939420
URL1:https://arc.ask3.ru/arc/aa/b2/4a/b24e92ec9b0b0b4d08c1995d6633104a.html
Заголовок, (Title) документа по адресу, URL1:
Ashish Vaswani - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)