Агрегация ответов в краудсорсинге. Пример с открытой библиотекой Яндекса

17 декабря 2021, 11:09 Habr.com

Краудсорсинг позволяет размечать данные для разных задач, но популярнее всего, конечно, задачи классификации объектов — текстов и картинок. Обычно в краудсорсинге несколько человек размечают каждый объект, что требует агрегации — выбора верного ответа из представленных. Под катом я покажу, как агрегировать результат разметки с помощью двух алгоритмов: голоса большинства и алгоритма Дэвида-Скина.

Я буду использовать Crowd-Kit — нашу открытую библиотеку вычислительных методов контроля качества в краудсорсинге, которая предлагает реализации разных методов агрегации ответов, оценки неопределённости и согласованности ответов и т. д. Но вы можете воспользоваться альтернативами: spark-crowd (использует Scala вместо Python), CEKA (Java вместо Python) или Truth Inference (использует Python, но предоставляет только категориальные и числовые ответы).
Читать дальше →

Яндекс в новостях

Первый этап сделки по продаже бизнеса Яндекса завершён

Тревел-тату как искусство: Яндекс Плюс запустил проект «Из путешествия — с татуировкой»

«Яндекс» сменил головную компанию на российскую

Состоялась Байкальская театральная школа в Бурятии: Россия и Культура, Дети

Google looks intent on breaking the business of the internet, and AI won't fix it

Фестивальный праздник «Музыка моего города» в Улан-Удэ включил в программу спектакль Театра кукол «Ульгэр»: Россия и Культура, Праздник и Дети

MTA reveals new electric buses, charging stations in Queens

15 мая в системе Следственного комитета Российской Федерации отмечается 157-я годовщина со Дня образования военных следственных органов

Не чувствую руку: Доктор Кутушов рассказал к чему приводит частое онемение конечностей

В Якутске премию 2ГИС получили две «наливайки» и заведения, которые закрылись

Инсайты, стратегии и нетворкинг для профессионалов: 21 июня пройдет ежегодный форум «Спорт и Бизнес»

Якутские геймеры смогут удаленно запускать тяжелые игры с помощью платформы МТС Fog Play

В Москве почтили память певца Рената Ибрагимова

«Я много раз в жизни ходил по краю»: Влад Топалов откровенно высказался в шоу «Человек-невидимка» на ТВ-3

Стэн Вавринка назвал основного фаворита «Ролан Гаррос» — 2024 у мужчин

ЦСКА в Петербурге обыграл "Зенит" и повел 1/2 финала Единой Лиги ВТБ

Президент: Саммит религиозных лидеров мира в рамках СОР29 подтвердит важность солидарности в решении проблем изменения климата

Зеленский после приезда Блинкена в Киев сразу же стал выпрашивать у США дополнительные ЗРК Patriot

Роскосмос показал спутниковый снимок наводнения на юге Бразилии

Стали известны результаты лингвистической проверки слов Лазаревой об атаках ВСУ

Издательство "Эксмо" обещает "Самые страшные истории"

Кто создает «креативный код» страны?

Новости тенниса

Свищёв: МОК и ITF не будут реагировать на призывы наказать Хачанова

Азербайджанский мигрант возмутился из-за того, что в Калининграде суд назначил 4,5 года лишения свободы за убийство в ДТП школьницы. Видео

«СВЯТОЙ ЛЕНИН» помогает Государственной Думе РФ оптимизировать налоговую сферу. «СВЯТОЙ кибер ЛЕНИН» удаляет налоги: перезагрузка.

«Опасалась убийства»: что известно о чеченке, сбежавшей от родственников в Москву

В Эстонии передумали меняться территориями с Россией

Сдвоенные «Ласточки» Нижний Новгород – Москва запустят в мае

Россия и КНР бросают вызов гегемонии доллара

Воду из подвалов домов откачают в микрорайоне Балашиха-2

Трамп высказал опасения относительно встречи Путина и Си Цзиньпина

Туристов из каких российских городов больше всего любят в Турции и Египте: россиянка поняла, каких русских там больше всего ждут

Студенты городских образовательных учреждений проходят практику в Marins Park Hotel Новосибирск

Фестивальный праздник «Музыка моего города» в Улан-Удэ включил в программу спектакль Театра кукол «Ульгэр»: Россия и Культура, Праздник и Дети

Lamoda запустила бренд мужской одежды и обуви Mademan

Свёнтек прошла в полуфинал турнира WTA-1000 в Риме

Соболенко — Коллинз: белоруска выиграла первый сет в полуфинале Рима

Первая ракетка Казахстана вышла в финал турнира WTA в Италии

Азаренко вышла в четвертьфинал турнира WTA-1000 в Риме

Axenix выводит на рынок систему поддержки принятия решений SmartAx

Военные следователи провели рейд по бывшим мигрантам в Алуште

Под красным куполом

Игровые клавиатуры Bloody S515R, B825R: механические свитчи и подставка под запястья

Фестивальный праздник «Музыка моего города» в Улан-Удэ включил в программу спектакль Театра кукол «Ульгэр»: Россия и Культура, Праздник и Дети

Концерт-телепремьера «Шаляпин и Рахманинов в Кисловодске» состоится на выставке-форуме «Россия»

«Когда поняла, что вешу девяносто – я заплакала»: певица Бьянка поделилась историей похудения в шоу «УТРО.ТНТ»

В Псковской области проходит проект для талантливой молодежи «Город мастеров»

Дорожники отремонтировали ограждения в 6 округах Подмосковья

Арбитр Егоров: остаюсь противником всех технических новшеств в футболе

В Чебоксарах проходит Всероссийский пленэр художников им. Ревеля Федорова

Источник 360.ru: балкон многоэтажки вспыхнул в Марьине, пострадали двое

Яндекс.Недвижимость: за месяц однушки в новостройках Москвы подешевели на 4,5%