Интерпретировать
Тип сайта | Краудсорсинг , Микроработа |
---|---|
Доступно в | Английский , русский , испанский , французский , арабский и т. д. [1] |
Основан | 2014 г |
Страна происхождения | Россия, Швейцария [2] [3] |
Владелец | ЯндексИнк |
Основатель(и) | Olga Megorskaya |
URL-адрес | интерпретировать |
Толока — краудсорсинговая платформа и проект микрозадач, запущенный Яндексом в 2014 году. [2] для быстрой разметки больших объемов данных, которые затем используются для машинного обучения и улучшения алгоритмов поиска . [4] Предлагаемые задания обычно просты и не требуют от исполнителя какой-либо специальной подготовки. [2] Большинство задач предназначены для улучшения алгоритмов, которые используются современными технологиями, охватывающими беспилотные автомобили, интеллектуальный поиск в Интернете, продвинутые голосовые помощники и электронную коммерцию. [ нужна ссылка ] По завершении каждого задания исполнитель получает вознаграждение в зависимости от объема изображений, видео и неструктурированного текста. [3] У сервиса есть две версии приложения — для Android и iOS .
О Интерпретировать
[ редактировать ]Происхождение названия платформы
[ редактировать ]Толока , была формой взаимопомощи среди сельских России , Украины , Белоруссии , Эстонии жителей Латвии и Литвы . Она организовывалась в деревнях для выполнения неотложных работ, требующих большого количества рабочих, таких как заготовка урожая, лесозаготовка, строительство домов и т. д. Иногда толока использовалась для общественных работ (строительство церквей, школ, дорог и т. д.). [3]
Виды задач и объем результатов
[ редактировать ]Маркировка данных помогает улучшить качество поиска и эффективно настроить алгоритмы ранжирования результатов поисковой системы. [3]
Машинное обучение
[ редактировать ]Для обучения алгоритма машинного обучения требуется разметка больших объемов с положительными и отрицательными примерами данных. Исполнители Толоки получают задания на определение наличия или отсутствия в элементе контента объектов, определяемых компьютером. [3] [5] В заданиях другого типа задается контекст диалога и предлагается шкала, по которой необходимо оценить, является ли ответ чат-бота в этом контексте уместным, интересным и так далее. [6] Еще одна группа задач в «Толоке» — проверка перевода, выполняемая путем сбора примеров переводов от разных исполнителей. [ нужна ссылка ]
Аудит и маркетинговые исследования
[ редактировать ]Проверка качества интернет-магазина, службы доставки, написание отзывов о товарах и услугах. Подобные аудиты позволяют контролировать качество услуги и выявлять слабые места, над которыми в дальнейшем будет проводиться работа по улучшению и устранению выявленных проблем. [ нужна ссылка ]
Пользователи
[ редактировать ]Пользователи Толоки, также известные как исполнители или толокеры, — это люди, которые зарабатывают деньги, выполняя задачи по тестированию и улучшению системы на краудсорсинговой платформе «Толока». [ нужна ссылка ] В 2018 году в проектах «Толока» приняли участие более миллиона человек. Большинство исполнителей – молодые люди до 35 лет (обычно студенты инженерных специальностей или мамы в декрете). Исполнители в основном рассматривают Толоку как дополнительный источник дохода, но многие из них отмечают, что им нравится заниматься осмысленной работой и наводить порядок в Интернете. По состоянию на март 2022 года у Толоки 245 000 активных исполнителей в месяц в 123 странах. Tolokers генерирует более 15 миллионов этикеток в день. [1] [7]
Запрашивающие
[ редактировать ]Все задачи в Толоке ставят запросчики. Основные области применения «Толоки» — сбор и обработка данных для машинного обучения, речевых технологий, компьютерного зрения, алгоритмов умного поиска и других проектов, а также модерация контента, решение полевых задач, оптимизация внутренних бизнес-процессов. [3]
Интерпретация исследований
[ редактировать ]В мае 2019 года команда сервиса начала публиковать наборы данных для некоммерческих и академических целей, чтобы поддержать научное сообщество и привлечь исследователей на Толоку. Такие наборы данных адресованы исследователям разных направлений, таких как лингвистика , компьютерное зрение , тестирование моделей агрегации результатов и обучение чат-ботов . [8] Исследования Толоки были продемонстрированы на ряде конференций, в том числе на конференции по нейронным системам обработки информации (NeurIPS), [9] Международная конференция по машинному обучению (ICML) [10] и Международная конференция по очень большим базам данных (VLDB). [11]
Ссылки
[ редактировать ]- ^ Jump up to: а б «Это помогает мне учиться и зарабатывать: Толока сообщает результаты глобального опроса толокеров в 2022 году» . toloka.ai. 23 марта 2022 г. Проверено 16 сентября 2022 г.
- ^ Jump up to: а б с «Толока открывает 20 000 новых рабочих мест для жителей Ганы» . Новости образования Ганы. 15 июня 2021 г. Проверено 17 сентября 2022 г.
- ^ Jump up to: а б с д и ж Алекс Вуди (27 апреля 2021 г.). «Толока расширяет сервис маркировки данных» . Датанами . Проверено 17 сентября 2022 г.
- ^ Дарья Байдакова (29 сентября 2021 г.). «Инструкции по маркировке данных: путь к успеху в краудсорсинге и устойчивому воздействию на ИИ» . Центр науки о данных . Проверено 17 сентября 2022 г.
- ^ Фредерик Бусслер (07 декабря 2021 г.). «Разметка данных будет способствовать революции искусственного интеллекта» . ВенчурБит . Проверено 17 сентября 2022 г.
- ^ Кумар Гандхарв (29 апреля 2021 г.). «Почему фирмы, занимающиеся маркировкой данных, присматриваются к индийскому рынку?» . Журнал Analytics India . Проверено 17 сентября 2022 г.
- ^ «Ольга Мегорская/Толока: Практические уроки по маркировке данных» . Последовательность. 27 октября 2021 г. Проверено 16 сентября 2022 г.
- ^ «Толока представит новый набор данных на престижном семинаре по Data-Centric AI, организованном Эндрю Нг» . Журнал ИИ . Проверено 17 сентября 2022 г.
- ^ «Толока представит новый набор данных на престижном семинаре по Data-Centric AI, организованном Эндрю Нг» . Новости ФЭ . 2021-11-18 . Проверено 10 февраля 2022 г.
- ^ «Толока» . icml.cc. Проверено 10 февраля 2022 г.
- ^ «Вызов ВЛДБ 2021» . Crowdscience.ai . Проверено 10 февраля 2022 г.