Cовместимость по знаку зодиака
Cовместимость c селебрити

Узнайте совместимость по знаку зодиака

Четыре серьезных вопроса о глупой оценке авторитета Илона Маска

Проверка Фактов

СМИ Twitter пережил небольшой кризис в среду днем, когда предприниматель Илон Маск размышлял о создании краудсорсингового сервиса, который оценивает доверие журналистов.

Оставим в стороне мотивы Маска, возможно, проинформированные плохая пресса Тесла недавно получил, что он приписывает предвзятости СМИ — и сосредоточьтесь на самой идее.

Это может показаться несущественным, разоблаченным в небольшом количестве твитов и с основным намерением потроллить своих критиков. Но предложение Маска об «оценке достоверности» стоит обсудить, потому что ее построение на самом деле довольно популярная идея, особенно среди жителей Силиконовой долины.

Некоторые, как Коалиция доверия , пытаются вдумчиво сформулировать проблему, но большинство из них проникнуто тем же техно-утопизмом, который определил публичную личность Маска. Только за последние несколько месяцев я получил по крайней мере четыре различных предложения для системы, которая использует искусственный интеллект (разумеется), чтобы оценить доверие ко всему Интернету.

Представление о том, что один простой взлом может исправить предвзятость СМИ и массовую дезинформацию в Интернете, широко распространено в определенных кругах. Но он фатально ошибочен.

Другие состоятельные журналистские проекты пообещали перевернуть проверку фактов, либо задействовав в ней толпу (WikiTribune), либо разработав универсальную шкалу достоверности (NewsGuard). В случае с WikiTribune решение еще не вынесено, но фактчекинговая работа на сегодняшний день вряд ли изменит парадигму. NewsGuard привлек 6 миллионов долларов, но еще не запущен.

Тем не менее ясно, что статус-кво нуждается в реформе. Проверка фактов, возможно, должна быть взорвана и изобретена заново. Таким образом, вместо того, чтобы замочить Маска, мы должны обсудить основные проблемы, связанные с реальной оценкой доверия к Интернету.

1. Можем ли мы избежать превращения краудсорсинга в конкурс популярности?

Маск, похоже, стремился избежать впечатления, что злоумышленники могут обмануть его счет авторитета, когда он представляет свой (сильно искаженный) опрос.

Это впечатление быстро рассеялось, когда он использовал свою учетную запись в Твиттере с 21,8 миллионами пользователей, чтобы подтолкнуть «СМИ» к голосованию против предложенного им решения.

Это основная проблема любого краудсорсинга. Крупнейшие мегафоны и наиболее преданные группы могли бы мобилизовать и атаковать журналистов, чьи выводы были не точны, а неудобны — например, о травмах рабочих Теслы.

Мало того, что толпа может стать толпой, ее накопленная мудрость не обязательно является суммой ее частей. Если 100 благонамеренных людей проверяют факты о спутниках Юпитера, и один из них — астроном НАСА, должны ли все рейтинги считаться одинаковыми?

И, конечно же, вы можете взвешивать рейтинги пользователей по-разному. Но если вы позволите пользователям оценивать друг друга, мы подвергнемся тому же риску направленной толпы. Если мы позволим пользователям самостоятельно выбирать области знаний, мы получим кучу раздутых резюме. Даже фактические полномочия не гарантируют подлинного опыта (просто подумайте о Эндрю Уэйкфилд ). И если вы позволите алгоритму вычислить опыт, который вы получите, что ж, Клут .

Чем больше мер безопасности вы установите, тем больше пользователей вы потеряете. Я знаю это, управляя ныне несуществующим краудсорсинговым сайтом по проверке фактов. FactCheckEU . Пользователи с энтузиазмом начали, но ленились продолжать. После того, как попросили предоставить больше, чем ссылку или две, интерес иссяк.

Реальность такова, что вам нужно свести к минимуму трения пользователей, чтобы достичь масштаба при краудсорсинговой проверке фактов. А минимизация трений пользователей приведет к неаккуратным ошибкам. Контрпример — Википедия, но даже в ней есть развитая редакционная инфраструктура, как только вы покопаетесь в ней.

Все это не означает, что мы должны отказаться от поиска решений. Нынешняя онлайн-инфраструктура эффективно краудсорсингует то, что пользователи Интернета должны читать, а популярный контент занимает первые места в новостных лентах Facebook и поисковых запросах Google. Мы должны представить действия толпы, которые отличаются от эмоциональных «нравится» или «ха-ха», и достичь лучшей системы. Но все не так просто, как говорит Маск.

2. Должны ли мы оценивать только журналистов?

Предложенный Маском сайт, как он есть, будет ориентирован только на журналистов. Должен ли? А как насчет популярных технологических предпринимателей с 21,8 миллионами подписчиков в Твиттере? Как насчет пользователей, которые публикуют фальшивые фотографии, которые становятся вирусными? Присвоение рейтинга правдоподобия каждому кажется оруэлловским; Если этого не сделать, похоже, система станет еще более подверженной вирусному мошенничеству.

3. Как бы вы построили оценку достоверности сложной статьи?

Скажем, мы нашли решение использовать толпу таким образом, чтобы избежать моббинга и отдать предпочтение опыту.

Что именно оценила бы толпа? Добросовестные специалисты по проверке фактов проводят часы, обсуждая, действительно ли утверждение можно проверить. Большинство статей состоит из десятков утверждений о фактах и ​​еще большего количества непроверенных утверждений. Оценку достоверности Пола Хорнера, возможно, было легко получить, но, в отличие от работы Хорнера, большинство онлайн-историй — это не просто ложный заголовок и ничего больше.

Коалиция доверия ищет способы определяет этот счет, но он все еще очень нечеткий.

Я признаю, что может показаться немного богатым, что проверяющий факты — соучредитель сайта, который сводные рейтинги политиков, проверенных фактами , не меньше — предостерегает от оценок достоверности. Мы недвусмысленно предупредили читателей, что «сборник рейтингов каждого политика — это не статистически значимый показатель их авторитета, а полусерьезный показатель правдивости небольшой выборки проверенных заявлений». И, в отличие от краудсорсингового решения, рейтинги фактчекеров, по крайней мере, основаны на тщательно проверенных фактах с кучей исследований и пониманием того, что на самом деле можно проверить.

Но, возможно, пришло время отказаться от этих визуализаций, чтобы избежать иллюзорного ощущения, что у человека может быть рейтинг доверия, как у него может быть кредитный рейтинг. Что приводит меня к вопросу 4.

Четыре. Должны ли мы оценивать контент или источники?

В сети аудитория потребляет информацию по темам чаще, чем по источникам. Когда вы что-то гуглите или чем-то делитесь, вы сначала видите, о чем идет речь, а потом — о ком.

Так и должно быть: я чрезвычайно надежный источник информации о состоянии проверки фактов по всему миру, но я чрезвычайно а надежный источник об американском футболе. Достоверность зависит от времени и предмета. Как статическая оценка инкапсулирует это?

Для ясности: провал краудсорсинговых проектов по проверке фактов на сегодняшний день (включая мой) не означает провала будущих усилий. Но мы должны чаще задавать эти трудные вопросы, прежде чем кто-то с большими деньгами на самом деле использует их для запуска ужасного продукта.

Исправление: в более ранней версии этой статьи вместо «астроном» использовалось слово «астролог». Мой рейтинг доверия как наполовину грека серьезно пострадал.