Эдвард Ю. Чанг
Эдвард Ю. Чанг (张智伟) | |
---|---|
![]() | |
Рожденный | Тайбэй, Тайвань |
Национальность | Американский |
Род занятий | Ученый-компьютерщик , академик и автор |
Награды | Член ACM и IEEE |
Академическое образование | |
Образование | доктор философии, Стэнфордский университет |
Альма-матер | Стэнфордский университет Калифорнийский университет, Беркли |
Академическая работа | |
Учреждения | Стэнфордский университет |
Веб-сайт | http://infolab.stanford.edu/~echang/ |
Эдвард Ю. Чанг — ученый-компьютерщик , академик и писатель. Он является адъюнкт-профессором компьютерных наук в Стэнфордском университете . [ 1 ] и приглашенный профессор кафедры биоинформатики и медицинской инженерии Азиатского университета с 2019 года. [ 2 ]
Чанг является автором шести книг, в том числе «Путь к общему искусственному интеллекту — идеи из состязательного диалога LLM» (2024 г.) , «Основы крупномасштабного управления и поиска мультимедийной информации» , «Аналитика больших данных для крупномасштабного мультимедийного поиска» , «Путешествие разума». (поэзия), Nomadic Eternity (поэзия) и мандаринский перевод книги Эрвина Шрёдингера « Что такое жизнь?» Разум и материя . Его исследовательские интересы охватывают моделирование сознания , генеративный искусственный интеллект и здравоохранение , за что он получил множество наград, таких как Google Innovation Award, [ 3 ] Премия XPRIZE и премия президента Тайваня за работу по сдерживанию вспышки COVID-19 . Он также является членом Ассоциации вычислительной техники ACM. [ 4 ] и член Института инженеров по электротехнике и электронике IEEE. [ 5 ] за вклад в масштабируемое машинное обучение и здравоохранение.
Образование
[ редактировать ]Чанг получил степень магистра наук в области промышленного проектирования и исследования операций в Калифорнийском университете в Беркли, а затем продолжил обучение в Стэнфордском университете. Он получил степень магистра наук в области компьютерных наук в Стэнфорде в 1994 году, а затем защитил докторскую диссертацию. по специальности «Электротехника» в том же институте. С 1995 по 1999 год он работал под руководством своего советника Эктора Гарсиа-Молина и получил докторскую степень. [ 2 ]
Карьера
[ редактировать ]Чанг начал свою академическую карьеру в Калифорнийском университете в Санта-Барбаре , где с 1999 по 2006 год он работал ассистентом, доцентом и, в конечном итоге, профессором кафедры электротехники и вычислительной техники. В период с 2012 по 2015 год он был назначен адъюнкт-профессором по компьютерным технологиям. и информатика в Гонконгском университете науки и технологий (HKUST), Гонконг . За этим последовало назначение в качестве приглашенного профессора в центр Future Reality на факультете EECS Калифорнийского университета в Беркли с 2017 по 2020 год. [ 6 ] С 2019 года занимает должность адъюнкт-профессора компьютерных наук в Стэнфордском университете. [ 1 ] и приглашенный профессор кафедры биоинформатики и медицинской инженерии Азиатского университета. [ 2 ]
Чанг был директором по исследованиям в Google с 2006 по 2012 год. За это время он руководил исследованиями и разработками в нескольких областях, включая масштабируемое машинное обучение, [ 7 ] рекомендательные системы, [ 8 ] внутренняя локализация, [ 9 ] и Google QA. [ 3 ] Ранее с 2004 по 2006 год он занимал должность главного технического консультанта по видеонаблюдению в компании Proximex, расположенной в Купертино, Калифорния. В 2012 году он стал президентом HTC Healthcare. [ 10 ] С 2019 по 2022 год он также работал главным консультантом по НЛП в токийской компании SmartNews, где участвовал в разработке интерактивных новостей . Он основал AIlly.ai, компанию в Пало-Альто , где с 2019 года является основателем и главным техническим директором (CTO). [ 11 ]
Исследовать
[ редактировать ]Чанг является автором множества рецензируемых публикаций. [ 12 ] и имеет несколько патентов. [ 13 ]
SocraSynth для обнаружения и проверки знаний
[ редактировать ]В 2019 году Чанг приступил к исследованию моделирования сознания с целью улучшить способности ИИ к рассуждению. Его новаторская работа в 2023 году стала пионером в применении метода Сократа к искусственному интеллекту, способствуя критическому чтению и мышлению. Затем он представил SocraSynth (сократический синтез), [ 14 ] структура, которая объединяет несколько моделей большого языка (LLM) в совместном и враждебном диалоге. Руководствуясь принципами статистики и теории информации, этот подход сочетает изучение новых перспектив с использованием известной информации. Цель состоит в том, чтобы раскрыть знания и идеи, ранее недоступные человеческому пониманию. После открытия метод Сократа и строгие логические рассуждения используются для критического рассмотрения и проверки, гарантируя разумность выводов, если не абсолютную истину. Первые результаты показали, что SocraSynth эффективен в выявлении и исправлении искажений контента и ошибочных диагнозов.
Распараллеливание алгоритмов машинного обучения
[ редактировать ]Еще в 2005 году Чанг разрабатывал ориентированный на данные подход к машинному обучению и с 2006 по 2011 год руководил своей командой в Google разработкой параллельных версий пяти широко используемых алгоритмов машинного обучения, которые могли бы обрабатывать большие наборы данных: PSVM для поддержки. Векторные машины, [ 15 ] PFP для частого интеллектуального анализа наборов элементов, [ 16 ] PLDA для скрытого распределения Дирихле, [ 17 ] PSC для спектральной кластеризации, [ 18 ] и SPeeDO для параллельных сверточных нейронных сетей. [ 19 ] В ходе своего исследования PSVM он продемонстрировал, что матричную факторизацию можно использовать для распределения решателя метода внутренней точки по нескольким машинам, одновременно используя неполную факторизацию Холецкого на основе строк для уменьшения требований как к памяти, так и к вычислениям. Этот подход позволяет PSVM эффективно снизить потребности в памяти с O(n^2) до O(n) и сложность вычислений с O(n^3) до O(n) для каждого из параллельных вычислительных блоков с квадратным корнем (n) ( CPU/GPU) при работе с n обучающими экземплярами. [ 20 ] Кроме того, в одной из его статей, ставшей кульминацией исследования, проведенного в Калифорнийском университете в Санта-Барбаре, была предложена процедура мягких аннотаций на основе контента (CBSA), которая повышает точность маркировки изображений за счет использования ансамбля бинарных классификаторов и сравнения производительности SVM и БПМ. [ 21 ] Решая проблемы несбалансированных обучающих данных в новых приложениях, таких как поиск изображений и видеонаблюдение с помощью G Wu, он предложил алгоритм выравнивания границ классов, [ 22 ] а также предложил алгоритм выравнивания границ ядра для задач контролируемого обучения на основе SVM, продемонстрировав его эффективность посредством теоретического анализа и эмпирических исследований. [ 23 ] Позже в соответствующих исследованиях он доказал, что DeepWalk эквивалентен матричной факторизации, и представил Text-Associated DeepWalk, метод, который включает текстовые функции в обучение сетевому представлению и превосходит другие базовые методы в задачах многоклассовой классификации, особенно в зашумленных сетях с небольшой коэффициент обучения. [ 24 ]
Повышение эффективности данных обучения посредством активного обучения
[ редактировать ]Исследования Чанга внесли вклад в область машинного обучения, уделив особое внимание активному обучению, повысив эффективность обучающих данных и предоставив информацию для разработки более эффективных технологий здравоохранения. Вместе с Саймоном Тонгом его работа по SVMActive была направлена на решение проблемы нехватки размеченных данных, доступных для обучения классификаторов в таких приложениях, как сектор здравоохранения, путем использования активного обучения для выявления неоднозначных неразмеченных экземпляров и опроса экспертов, таких как врачи, для предоставления меток, тем самым максимизируя получение информации. . Первоначально этот подход использовался для улучшения обратной связи по релевантности при уточнении запросов изображений. [ 25 ] В секторе здравоохранения он, в частности, интегрировал активное обучение с разреженным пространством с обучением с подкреплением, чтобы дать возможность врачу-агенту принять решение о следующем запросе симптомов у пациента, оптимизируя точность диагностики с минимальными итерациями по исследованию симптомов. Более того, вместе с группой исследователей он предложил алгоритм REFUEL, который решает проблему редких симптомов при диагностике заболеваний, используя стратегии формирования вознаграждения и восстановления функций для управления поиском в пространстве симптомов и итеративного устранения коррелирующих симптомов. [ 26 ] REFUEL также был внедрен для удаленной диагностики и сортировки двумя сетями больниц на Тайване и тайваньским CDC в борьбе с COVID-19. [ 27 ]
Чанг и его команда разработали мобильное устройство на базе системы REFUEL, которое может диагностировать двенадцать распространенных заболеваний, выполняя различные лабораторные тесты. В его совместной статье, опубликованной в 2017 году, подробно описывается конструкция ключевых компонентов системы проверки симптомов DeepQ на базе искусственного интеллекта, таких как модули оптического и жизненно важного датчиков. Эти модули были интегрированы в мобильное устройство, которое было разработано с учетом удобства использования. Эта работа по проверке симптомов также была отмечена в 2017 году, когда устройство заняло второе место в конкурсе Qualcomm Tricorder XPRIZE. [ 28 ] Кроме того, его система проверки симптомов на основе чат-бота, разработанная в сотрудничестве с Тайваньским центром по контролю и профилактике заболеваний (CDC), получила президентскую премию в 2020 году за эффективное сдерживание вспышки COVID-19. Его другой выдающийся вклад в область медицинских технологий включает разработку и аннотирование базы данных DeepQ по аритмии. Эта база данных содержит коллекцию записей ЭКГ пациентов, занимающихся различными видами деятельности, дополняя базу данных MIT BIH по аритмии. База данных DeepQ по аритмии облегчает исследования машинного обучения, одновременно решая проблему межпациентной вариабельности. [ 29 ]
Другие ключевые вклады
[ редактировать ]Чанг также считается изобретателем цифрового видеорегистратора, который заменил традиционный кассетный видеомагнитофон в 1999 году и представил интерактивные функции для потоковой передачи видео. В 1997 году он разработал цифровой видеорегистратор (DVR), который был разработан в 1998 году как глава его докторской диссертации под руководством Гектора Гарсиа-Молина и Пэта Ханрахана. [ 30 ] [ 31 ]
Награды и почести
[ редактировать ]- 2002 – Национальный научный фонд, карьерная премия
- 2003 – Лучшая студенческая работа, Мультимедийная конференция ACM
- 2009 – Премия за инновации (запуск Google Q&A для более чем 60 стран), Google
- 2010 – Лучшая статья, WWW конференция
- 2015 – Лучшая техническая демонстрация (панорама 360°), Мультимедийная конференция ACM
- 2016 – Премия за лучший фитнес-трекер, HTC/UnderAmor Healthbox
- 2017 – научный сотрудник IEEE. [ 5 ]
- 2017 – Tricorder XPrize (медицинский Интернет вещей на базе искусственного интеллекта), обладатель 1 миллиона долларов США, Фонд X PRIZE Foundation [ 32 ]
- 2020 – Президентская премия (запущен чат-бот CDC AI, управляющий болезнями), Тайвань
- 2020 – Тест времени ACM SIGMM, за статью «SVMActive: машинное активное обучение опорных векторов для поиска изображений», ACM Multimedia, 2001 г.
- 2021 – научный сотрудник ACM. [ 4 ]
Библиография
[ редактировать ]Книги
[ редактировать ]- Основы управления и поиска крупномасштабной мультимедийной информации (2011) ISBN 978-3642204289
- Кочевая вечность (Поэзия) (2012)
- Аналитика больших данных для крупномасштабного мультимедийного поиска (2019) ISBN 978-1119376972
- Что такое Жизнь? Материя и разум (Эрвин Шрёдингер, 1944), перевод с английского на китайский (2021)
- Путешествие разума (поэзия) (2023) ISBN 978-1-962463-00-3
- Путь к общему искусственному интеллекту — выводы из состязательного диалога LLM (2024 г.) ISBN 978-1-962463-30-0
Избранные статьи
[ редактировать ]- Тонг С. и Чанг EY (октябрь 2001 г.). Поддержка векторного машинного активного обучения для поиска изображений. В материалах девятой международной конференции ACM по мультимедиа (стр. 107–118).
- Чанг Э.Ю., Гох К., Сичай Г. и Ву Г. (2003). CBSA: программная аннотация на основе контента для мультимодального поиска изображений с использованием точечных машин Байеса. В IEEE Transactions on Circuits and Systems for Video Technology , 13(1), 26–38.
- Ву Г. и Чанг EY (август 2003 г.). Выравнивание границ классов для обучения несбалансированному набору данных. На семинаре ICML 2003 г. по обучению на основе несбалансированных наборов данных II, Вашингтон, округ Колумбия (стр. 49–56).
- Ли Х., Ван Ю., Чжан Д., Чжан М. и Чанг EY (октябрь 2008 г.). PFP: параллельный рост fp для рекомендаций по запросам. В материалах конференции ACM 2008 г. по рекомендательным системам (стр. 107–114).
- Чанг Э.Ю., Чжу Кайхуа, Ван Хао, Бай Хунцзе, Ли Цзянь, Цю Чжихуань и Цуй Ханг (2008). Машины параллельных опорных векторов на распределенных компьютерах. Достижения в области нейронных систем обработки информации (NeurIPS), 16–23.
- Чен, Вайоминг, Сун, Ю., Бай, Х., Линь, СиДжей, и Чанг, Э.Ю. (2010). Параллельная спектральная кластеризация в распределенных системах. В транзакциях IEEE по анализу шаблонов и машинному интеллекту , 33(3), 568–586.
- Чанг, Э.Ю., Ву, М.Х., Тан, К.Ф., Као, Х.К. Као, Чжоу, CN (октябрь 2017 г.). Искусственный интеллект в трикодере XPRIZE DeepQ. В материалах 2-го международного семинара по мультимедиа для личного здоровья и здравоохранения .
- Пэн, Ю.С., Тан, К.Т., Линь, Х.Т., Чанг, Э.Ю. (2018). Заправка: изучение редких функций в глубоком обучении с подкреплением для быстрой диагностики заболеваний. В разделе «Достижения в области нейронных систем обработки информации» (NeurIPS).
- Чанг, EY (март 2023 г.). Создание больших языковых моделей с помощью сократического метода. На 13-м ежегодном семинаре и конференции IEEE по вычислительной технике и связи (CCWC) , 351–360.
- Чанг, EY (март 2023 г.). CoCoMo: Вычислительное моделирование сознания для генеративного и этического искусственного интеллекта. arXiv:2304.02438 .
- Чанг, EY (июль 2023 г.). Изучение возможностей и усовершенствований GPT-4 компанией SocraSynth.
Ссылки
[ редактировать ]- ^ Jump up to: а б «Эдвард Ю. Чанг - Стэнфордский профиль» .
- ^ Jump up to: а б с «Эдвард Чанг — профессор кафедры Азиатского университета» .
- ^ Jump up to: а б «Эдвард Чанг - Конфуций и его интеллектуальные ученики: интеграция социальных сетей с поиском» (PDF) .
- ^ Jump up to: а б «Лауреаты премии ACM» .
- ^ Jump up to: а б «Члены компьютерного общества IEEE удостоены звания члена в 2017 году» . 9 апреля 2018 г.
- ^ «Модель генеративного искусственного интеллекта с сознанием» .
- ^ «Проекты управления данными в Google, SIGMOD Record, март 2008 г. (Том 37, № 1)» .
- ^ Комбинированная совместная фильтрация для персонализированных рекомендаций сообщества, ACM KDD, 2008 . 24 августа 2008 г. стр. 115–123. дои : 10.1145/1401890.1401909 . ISBN 978-1-60558-193-4 . S2CID 508926 .
- ^ «Определение направления движения, патент США, 2013 г.» .
- ^ «Чат-бот Центра по контролю и профилактике заболеваний Тайваня был обновлен в свой первый день рождения: ответы на вопросы, связанные с инфекционными заболеваниями, через LINE» .
- ^ «Эдвард Ю. Чанг — домашняя страница Стэнфорда» .
- ^ «Эдвард И Чанг — Профиль Академии Google» .
- ^ «Патенты Google – Эдвард Ю. Чанг» .
- ^ «SocraSynth: погрузитесь глубже, осветите неизведанное с помощью генеративного искусственного интеллекта» .
- ^ «Распараллеливание машин опорных векторов на распределенных компьютерах» . 2007.
- ^ Ли, Хаоюань; Ван, Йи; Чжан, Донг; Чжан, Мин; Чанг, Эдвард Ю. (23 октября 2008 г.). «PFP: параллельный рост fp для рекомендаций по запросам». Материалы конференции ACM 2008 года по рекомендательным системам . стр. 107–114. дои : 10.1145/1454008.1454027 . ISBN 9781605580937 . S2CID 16453090 .
- ^ Ван, Йи; Бай, Хунцзе; Стэнтон, Мэтт; Чен, Вэнь-Йен; Чанг, Эдвард Ю. (2009). «PLDA: параллельное скрытое распределение Дирихле для крупномасштабных приложений» . Алгоритмические аспекты информации и управления . Конспекты лекций по информатике. Том. 5564. стр. 301–314. дои : 10.1007/978-3-642-02158-9_26 . ISBN 978-3-642-02157-2 .
- ^ Чен, Вэнь-Йен; Сун, Янцю; Бай, Хунцзе; Лин, Чи-Джен; Чанг, Эдвард Ю. (2011). «Параллельная спектральная кластеризация в распределенных системах» . Транзакции IEEE по анализу шаблонов и машинному интеллекту . 33 (3): 568–586. дои : 10.1109/TPAMI.2010.88 . ПМИД 20421667 . S2CID 6703419 .
- ^ «SpeeDO: распараллеливание стохастического градиентного спуска для глубокой сверточной нейронной сети» (PDF) .
- ^ Чанг, Эдвард Ю. (2011). «PSVM: распараллеливание машин опорных векторов на распределенных компьютерах» . Основы управления и поиска крупномасштабной мультимедийной информации . стр. 213–230. дои : 10.1007/978-3-642-20429-6_10 . ISBN 978-3-642-20428-9 .
- ^ Изменять.; Кингши Го; Сычай, Г.; Банда Ву (2003). «CBSA: программная аннотация на основе контента для мультимодального поиска изображений с использованием точечных машин Байеса» . Транзакции IEEE по схемам и системам видеотехнологий . 13 : 26–38. дои : 10.1109/TCSVT.2002.808079 .
- ^ «Выравнивание границ классов для обучения несбалансированным наборам данных» (PDF) .
- ^ Ву, Г.; Чанг, EY (2005). «KBA: выравнивание границ ядра с учетом несбалансированного распределения данных» . Транзакции IEEE по знаниям и инженерии данных . 17 (6): 786–795. дои : 10.1109/TKDE.2005.95 . S2CID 7934922 .
- ^ Ян, Цян; Вулдридж, Майкл Дж. (25 июля 2015 г.). Обучение сетевому представлению с помощью расширенной текстовой информации . АААИ Пресс. стр. 2111–2117. ISBN 9781577357384 .
- ^ Тонг, Саймон; Чанг, Эдвард (2001). «Поддержка векторного машинного активного обучения для поиска изображений» . Материалы девятой международной конференции ACM по мультимедиа . стр. 107–118. дои : 10.1145/500141.500159 . ISBN 1581133944 . S2CID 10743717 .
- ^ «ЗАПРАВКА: изучение редких функций в глубоком обучении с подкреплением для быстрой диагностики заболеваний» . 3 декабря 2018. С. 7333–7342.
- ^ «Чжанцзи запустил первого в Тайване межбольничного робота с искусственным интеллектом и блокчейном для медицинского обслуживания доктора Лана» .
- ^ Чанг, Эдвард Ю.; Ву, Мэн-Си; Тан, Кай-Фу Тан; Као, Хао-Чэн; Чжоу, Чун-Нан (2017). «Искусственный интеллект в трикодере XPRIZE DeepQ» . Материалы 2-го международного семинара по мультимедиа для личного здоровья и здравоохранения . стр. 11–18. дои : 10.1145/3132635.3132637 . ISBN 9781450355049 . S2CID 8174727 .
- ^ Ву, Мэн-Си; Чанг, Эдвард Ю. (23 октября 2017 г.). «База данных аритмии DeepQ: крупномасштабный набор данных для оценки детекторов аритмии». Материалы 2-го международного семинара по мультимедиа для личного здоровья и здравоохранения . стр. 77–80. дои : 10.1145/3132635.3132647 . ISBN 9781450355049 . S2CID 23572593 .
- ^ Ярке, Матиас (25 августа 1997 г.). Эффективное использование памяти на медиасервере . Книги Elsevier по науке и технологиям. стр. 496–505. ISBN 9781558604704 .
- ^ Изменять.; Гарсиа-Молина, Х. (1999). «МЕДИК: память и дисковый кэш для мультимедийных клиентов» . Материалы Международной конференции IEEE по мультимедийным вычислениям и системам . Том. 1. С. 493–499. дои : 10.1109/MMCS.1999.779251 . ISBN 0-7695-0253-9 . S2CID 7597582 .
- ^ «ПОЗДРАВЛЯЕМ НАШИХ ПОБЕДИТЕЛЕЙ! — награда Qualcomm Tricorder XPRIZE» . Архивировано из оригинала 21 сентября 2017 г. Проверено 21 марта 2023 г.