Что произошло
Wikimedia договорилась с компанией Meta об использовании ИИ для контроля за качеством статей на «Википедии».
История вопроса
«Википедия» была запущена в 2001 году, сейчас статьи для энциклопедии пишут более 300 тыс. добровольцев по всему миру.
Почему это важно
Из-за человеческого фактора в энциклопедии появляется немало ошибок и даже фейковых статей.
Контекст
Meta анонсировала сразу несколько проектов в области ИИ, в том числе универсальный переводчик устной речи для метавселенной.
Что произошло
Wikimedia договорилась с компанией
- Разрабатываемый Meta ИИ использует модель преобразования Natural Language Understanding (NLU), которая пытается понять взаимосвязи между словами и фразами в предложении. Он опирается на базу данных Sphere, которая содержит более 134 млн веб-страниц. Модель разработана таким образом, чтобы найти источник для проверки каждого утверждения.
- В рамках тестирования ИИ проверил статью «Знаменитые
черноногие ». В статье упоминался Джо Хип — первый коренной американец, который боролся за титул чемпиона мира по версии WBA в супертяжелом весе. Однако на сайте, указанном автором, Хип не был упомянут. ИИ провел поиск в базе данных Sphere и нашел более подходящую цитату в материале 2015 года в Great Falls Tribune.
История вопроса
- История «Википедии» начинается с появления в марте 2000 года другого сайта — «Нупедии», где статьи писались экспертами. Заметки проходили через семиэтапный процесс рецензирования и проверку редакторами-экспертами. Все это замедляло процесс наполнения сайта — к ноябрю 2000 года на «Нупедии» опубликовали всего две полноценные статьи. Тогда создателям и пришла в голову идея свободной энциклопедии. После этого сайт начал работать в нынешнем виде.
- Русскоязычная версия «Википедии» появилась 11 мая 2001 года. По словам исполнительного директора «Викимедиа РУ» Станислава Козловского, в 2018 году сайт ежемесячно посещали около 100 млн человек. При этом авторами были всего 10–12 тыс., причем большинство из них лишь вносили незначительные правки.
- Сейчас по всему миру «Википедию» редактируют около 300 тыс. добровольцев.
- Вся информация в энциклопедии должна подкрепляться ссылками на достоверные источники. Чтобы повысить точность материалов, «Википедия» ограничивает использование материалов некоторых СМИ. Например, в 2017 году авторам запретили ссылаться на британское издание Daily Mail.
За сайтом стоит НКО из Сан-Франциско Wikimedia Foundation, которая занимается серверами, сбором средств и юридическими проблемами.
Почему это важно
Возможность свободного редактирования материалов онлайн-энциклопедии приводит к ряду проблем.
- На 2021 год только 40 тыс. статей из 6 млн на «Википедии» считались «хорошими». Кроме того, в энциклопедии существует гендерный дисбаланс: в англоязычной «Википедии» более 80% редакторов — мужчины, и только 18% биографий посвящено женщинам.
- Статьи в «Википедии» часто бывают слишком субъективными. В исследовании 2018 года сравнили 4 тыс. статей из онлайн-энциклопедии от Wikimedia с такими же в «Британнике». Оказалось, что в «Википедии» 73% статей политически предвзяты, в то время как в «Британнике» таких материалов лишь 34%.
- В «Википедии» встречаются как банальные ошибки, так и статьи-мистификации. Например, сотрудник колл-центра из Глазго Алан Макилрайт создал биографическую страницу в «Википедии», где объявил себя героическим офицером Британской армии.
- В 2009 году в английской версии статьи о французском оскароносном композиторе Морисе Жарре сделал правку студент-ирландец, сообщив о смерти творца. Новость подхватили многие СМИ, включая популярное издание The Guardian. Когда обман раскрылся, им пришлось опровергать свои сообщения.
- Домохозяйка из Китая Джемао, представлявшаяся историком и дочерью российского дипломата, 10 лет сочиняла материалы для «Википедии» о средневековой Руси. Обман вскрылся случайно благодаря писателю-фантасту по имени Ифань, который читал тексты в энциклопедии в поисках вдохновения и наткнулся в одной из статей Джемао на интересную историю о серебряном руднике Кашин в Тверском княжестве, где трудились десятки тысяч рабов. Не найдя подтверждения ни в одном источнике, он заподозрил неладное и написал о своих догадках на китайском сайте вопросов-ответов Zhihu. История получила резонанс, «Википедия» начала расследование. Выяснилось, что Джемао успела сочинить более 200 статей, все они были удалены.
- В некоторых странах, в том числе в Китае, «Википедия» подвергалась блокировкам.
Контекст
Алгоритм, которым решила воспользоваться «Википедия», не единственная подобная программа компании Марка Цукерберга. Meta активно занимается разработками в области искусственного интеллекта.
- В январе 2022 года компания анонсировала создание нового суперкомпьютера AI Research SuperCluster (RSC). Он сможет обучать модели искусственного интеллекта (AI) с более чем триллионом параметров, а также будет использоваться в разработке AI для распознавания речи, голосового перевода в реальном времени и выявления вредоносного контента. Разработчики уверяют, что к концу 2022 года он станет самым мощным компьютером в мире.
- В феврале глава компании Марк Цукерберг представил систему искусственного интеллекта Builder Bot, обученную создавать трехмерные объекты в виртуальном мире по их словесному описанию.
- Meta намерена также создать универсальный ИИ-переводчик устной речи для всех языков мира. Продукт должен стать частью метавселенной и помочь людям снять языковые барьеры. Сроки реализации проекта не объявлялись.