Найдется всё. Но не на Яндексе. Цензура на автомате и ее возможные схемы в интернете | Осьминог

На прошлой неделе опять пошли разговоры о введении цензуры в интернете. Защитники свободы слова, конечно, сказали на это: «Но пасаран». Но «пасаран» приключился с другой стороны. Причем – давно. Просто не все это заметили. Потому, что под цензурой до сих пор понимают государственный надзор над печатью.

Текст Эразма Роттердамского с пометками сотрудников Индекса запрещённых книг (лат. Index Librorum Prohibitorum), который был важнейшим цензурным органом Римско-Католической Церкови в 16-17 в.в.

В Советском Союзе цензуру осуществлял Главлит. Теперь уже нет ни СССР, ни Главлита, а цензора все еще представляют человеком с гусиным пером. Но в эпоху Интернета стоило бы взглянуть на «цензуру» уже как-то иначе. А заодно понять, как она осуществляется в интернете, в первую очередь – в российском его сегменте.

Думаю, в предварительном порядке все согласятся со следующим рабочим определением: цензура – это фильтры на путях распространения информации. Таких фильтров в наше время много, есть они, конечно, и в интернете. Давайте посмотрим, как они могут действовать.

Платон Щукин

Для примера возьмем реально существующий сайт – Peremeny.ru, к которому я имею некоторое отношение и поэтому знаю кое-что о его проблемах. Но проблемы, которые мы будем рассматривать на его примере, достаточно общие. Чтобы убедиться в этом, достаточно почитать любой из форумов, где общаются веб-мастера.

Итак, сайт Peremeny.ru существует в сети уже более шести лет, он представляет собой интернет-журнал о культуре, религии, литературе, политике и так далее. Обычный набор тем для интернет-журнала. Но подаются эти темы в несколько необычном ключе. Ресурс позиционирует себя как «Толстый веб-журнал XXI века» и старается найти к любой теме новые подходы. Ясно, что такие издания не могут быть массовыми, в них не будут вкладывать деньги богатые люди, но все же ресурс на подъеме – за счет необычного взгляда на явления текущей жизни и интереса читателей к этому.

А дальше коллизия. В конце января посещаемость сайта вдруг резко падает. Не критично, но весьма заметно. Происходит это по той причине, что приход посетителей с Яндекса внезапно сократился примерно в 5-6 раз. Небольшое сравнительное исследование дает следующую картину:

1. Попытка найти через Яндекс какую-либо из статей сайта (по ключевым словам, по которым эта статья легко искалась раньше), приводит к странному результату: ни одна из страниц сайта не находится.

2. Ищем через Яндекс страницу кого-то из постоянных авторов сайта. Задаем в условиях поиска имя автора. Итог: страница автора не находится ни на каком месте и ни на одной из страниц результатов поиска. В то время как раньше авторы сайта при таком поиске появлялись в результатах поиска на первых местах.

3. Пытаемся проделать эти две операции в Google и других поисковиках. Все в порядке, поисковики выдают искомые результаты на первых местах (как и Яндекс до этого).

4. Более того, выясняется, что если набрать целиком имя автора и полное название конкретной статьи, Яндекс ее тоже не покажет. Но покажет десяток-другой перепечаток этой статьи на других сайтах и даже покажет сайты, где просто эта статья упомянута.

Яндекс не находит оригинальный текст по запросу, а Google находит

Разумеется, поначалу никому и в голову не приходит слово «цензура». Наверное, это какой-то сбой. Веб-мастер пишет письмо в службу техподдержки Яндекса, излагает проблему, приводит примеры вышесказанного со ссылками, просит разобраться. Ответа нет две недели, посещаемость все это время стремительно падает. Но вот, наконец, и ответ Платона Щукина (это коллективный псевдоним сотрудников техподдержки Яндекса, вся переписка, разумеется, сохранена и может быть предоставлена любым заинтересованным лицам и учреждениям). Будем разбираться, пишет Платон.

Еще через 7 дней приходит письмо от Платона: «Не переживайте, с Вашим сайтом все в порядке. Он нормально индексируется и доступен в поиске. Проверьте, пожалуйста». И ссылка на результат поисковой выдачи по запросу «site:peremeny.ru», то есть – поиск всех страниц данного сайта, которые были замечены поисковым роботом Яндекса и учтены им. По ссылке действительно, выпадает множество статей. Но если набрать конкретное имя и название статьи, Яндекс ее все же не показывает. Платон из поддержки заканчивает свое письмо обнадеживающими словами: «Если у Вас есть примеры запросов, по которым Вы заметили значительное понижение или исчезновение сайта в результатах поиска, пожалуйста, пришлите их нам. Ваши примеры помогут нам разобраться в сложившейся ситуации».

Вообще-то эти примеры содержатся в теле письма, на которое отвечает сотрудник Яндекса. Из этого можно заключить, что он просто не читал текст, на который отвечает. Но админ сайта снова высылает Платону соответствующие примеры. И ждет. Не проходит и трех недель, как получен ответ: «Приношу извинения за столь длительную задержку с ответом. Нашими алгоритмами на страницах Вашего сайта была распознана реклама или ссылки, которые направляют пользователей на страницы, содержащие контент «для взрослых». Мы не считаем, что, к примеру, [Дима Мишенин] – запрос, по которому следует показывать контент, направляющий на подобные страницы, поэтому Ваш сайт сейчас отсутствует в выдаче по интересующим Вас запросам. Подробнее о поиске Яндекса и контенте «для взрослых» можно прочитать здесь».

Мы еще пройдем по этой ссылке, почитаем, что там написано, а сейчас поясним, что Дима Мишенин – это один из постоянных авторов Перемен, и действительно, в некоторых его статьях трехлетней давности попадались ссылки на сайты, которые при большом желании можно классифицировать как порнографические. Статьи эти (например, вот этот материал) посвящены анализу феномена арт-порно, и ссылки приведены в них в качестве примера того, о чем говорит автор.

Естественно, ссылки были немедленно убраны. Веб-мастер сообщил об этом в Яндекс и попросил как можно быстрее вернуть сайт в поисковую выдачу. Ответ: «К сожалению, мы не можем назвать сроков возвращения сайта в выдачу, так как процесс переобхода сайта нашим роботом полностью автоматизирован. Но если на Вашем сайте отсутствует подобная реклама, то со временем он сможет вернуться в поиск по интересующим запросам».

Проходит порядка двух месяцев, переписка продолжается, Платон Щукин отговаривается тем, что «наш робот не может переиндексировать все страницы сайта за один заход, особенно если у сайта их много. У Вашего сайта более 10 тыс. страниц». Веб-мастер отвечает на это, что не видит никаких улучшений. И задает, наконец, сакраментальный вопрос: «Может ли это быть связано с недавними блоггерскими выступлениями насчет того, что Яндекс в той или иной форме осуществляет цензуру?»

Не цензурные соображения

Напомню, в конце марта 2011 года случился скандал по поводу того, что Яндекс, якобы, намеренно замалчивает некоторые политические сюжеты. Радио «Эхо Москвы», например, сообщало в те дни: «Интернет-пользователи в своих блогах пишут о том, что поисковик не выдает результатов по некоторым запросам, касающимся Ходорковского, фонда «Федерация» и так называемой «Партии жуликов и воров». Главный редактор Яндекса Елена Колмановская в интервью радиостанции «Эхо Москвы» подобные обвинения в цензуре отвергла. По ее словам, причиной того, что пользователи не могут найти некоторые фотографии, стали технические проблемы».

Так вот, в ответ на прямой вопрос веб-мастера сайта Peremeny.ru (а нет ли тут цензуры?) тоже был получен ответ: «Поисковая система Яндекс не является цензором, мы лишь отражаем общедоступную информацию». А дальше забавно: «Что касается и индексирования Вашего сайта, он нормально индексируется и доступен в поиске». И та самая ссылка, с которой началась переписка с Платоном Щукиным. А ниже: «Если у Вас есть примеры страниц, которые пропали из поиска, пожалуйста, пришлите их нам. Мы постараемся разобраться в сложившейся ситуации». История пошла по второму кругу. В службу поддержки было направлено письмо следующего содержания:

«Здравствуйте! Вы знаете, а нам представляются действия Яндекса как сугубо цензурные. И если ситуация не выправиться, мы намерены обнародовать эту переписку, а также факты по поводу того, как поисковая система Яндекс постепенно ограничивает свободу распространения информации и выкидывает страницы из поиска непонятно по каким причинам. Сейчас количество страниц нашего сайта в поиске Яндекса с каждой неделей уменьшается, сайт уже три месяца находится под anti-adult-фильтром, причем непонятно по каким причинам (никаких ссылок на порно-сайты у нас на сайте нет, а если Вы считаете, что они есть, покажите нам их, пожалуйста). Словом, нам ничего другого не остается, как думать, что Яндекс получил какие-то указания от кого-то относительно фильтрации нашего сайта, например, по политическим или религиозным соображениям. Будем рады, если это недоразумение, наконец, разрешится. Что касается конкретных страниц, которые не ранжируются по запросам, см. старую нашу переписку (ниже в этом письме). Мне кажется, что это просто невежливо с Вашей стороны заставлять меня писать в очередной раз одно и то же и снова и снова указывать конкретные примеры…»

Ответ был обнадеживающий: «В настоящий момент я не наблюдаю подобных ссылок или рекламы на Вашем сайте. В течение 2 недель сайт должен вернуться в поиск по интересующим Вас запросам. Пожалуйста, подождите немного». Это было написано 12 апреля. Разумеется, через две недели все осталось по-старому. Но 26 мая сайт действительно вернулся в поиск. А 29 мая был опять отключен. И на вопрос, что случилось, был опять получен все тот же ответ: на Вашем сайте есть ссылки на порнографию. На просьбу указать, где именно, было отвечено: мы такой информации не даем. В результате веб-мастер проделал чудовищную работу: проверил все ссылки на всех страницах сайта (напомним, их более 10 000), не обнаружил ни одной ссылки, которая бы вела на сайт с порнографическим или около порнографическим содержимым, и доложил об этом Платону Щукину. Его ответ: «Если Вы убрали подобные ссылки, то это хорошо. Наш робот автоматически отследит и сайт сможет вернуться в поиск. Насколько я могу видеть сейчас, ссылок нет. Поэтому, пожалуйста, наберитесь терпения». Ну дальше понятно…

Но что же такое случилось, что сайт все-таки был на несколько дней выведен из-под фильтра? Ведь в контексте всей этой, в сущности, скучной истории, рассказанной мной так подробно просто для того, чтобы дать почувствовать атмосферу в офисе Яндекса, никакого возвращения в поиск не должно было случиться. Возвращение в поиск – скорее ошибка, которая через несколько дней была исправлена. Так что же произошло?

Похоже, все-таки никакой ошибки нет. За временным возвращением сайта в поиск скорей всего стоит вот что: 24 мая Яндекс разместил акции на американской бирже NASDAQ. По всей видимости, чтобы процесс размещения не омрачился скандалом и обвинениями в цензуре (ведь не на один же сайт наложены подобные ограничения, таких сайтов сотни, если не тысячи), все фильтры были временно сняты (что сотрудники Peremeny.ru заметили только 26 числа). А потом, когда дело было сделано и акции удачно размещены, фильтры опять вернули.

Это, впрочем, только предположение, но уж больно точно совпадают даты. Еще упомянутый выше весенний скандал показал, что Яндекс очень боится обвинений в цензуре. Он готов признать даже несовершенство своего поисковика, лишь бы не оказаться запятнанным тем, что осуществляет цензуру. Уже после повторного выключения сайта Peremeny.ru Платон Щукин по собственному почину вернулся к этому вопросу: «Что касается Вашего письма о цензуре, Яндекс индексирует сайты, созданные независимыми людьми и организациями. Мы не отвечаем за качество и содержание страниц, которые вы можете найти при помощи нашей поисковой машины. Нам тоже многое не нравится, однако Яндекс — зеркало Рунета, а не цензор».

Конечно, насчет зеркала – это слишком категоричное утверждение. Если вы ставите какие-либо фильтры на путях получения информации, так что огромное количество информации оказывается недоступно, вы не можете называть себя зеркалом, разве что – кривым. (Повторим, речь идет не об одном только сайте, примеров можно найти множество.) Что же касается цензуры, давайте посмотрим, насколько Яндекс не цензор.

Что такое цензура

По всей видимости, работники Яндекса не совсем ясно понимают, что такое цензура. Или делают вид, что не понимают. Поясню: слово происходит от латинского censeo, что означает «определять цену, оценивать» (близко к этому наши слова «ценность», «цена»). Отсюда в древнем Риме должность censor. Цензоры следили за проведением переписей (цензов) и распределением граждан по имущественным сословиям, а также – за их нравственностью и благонадежностью. Это уже близко к современному смыслу слов «цензор», «цензура»: надзор за нравственностью и благонадежностью в печати. Именно эти функции выполняет Яндекс в Интернете, ставя свои фильтры (кроме открыто афишируемого Яндексом anti-adult-фильтра, есть и другие, известные среди веб-мастеров под меткими названиями «Ты последний», «Ты спамный», «АнтиГовноСайт», или просто «АГС», при этом под эти фильтры могут угодить сайты, абсолютно «невинные» и ничего не имеющие общего ни со спамом, ни с порно, ни с вирусами – примеров в интернете множество, так как не все веб-мастера молча сносят происходящее). Собственно, фильтр в любом случае – инструмент интернет-цензуры. Не пропускать то, что по каким-то причинам определено как неподходящее – таков смысл всякого фильтра. Это факт, который невозможно оспорить, и сам Яндекс, как мы увидим ниже, это признает.

А вот когда Яндекс утверждает, что он не осуществляет цензуру, он имеет в виду, что не осуществляет цензуру политическую. И очень боится, что его обвинят в такой цензуре. Это понятно, ведь если он будет в ней уличен, это может вызвать большой скандал, более того, будут даже подорваны основы его существования. Кому нужен поисковик, отрезающий граждан от информации. К тому же, тут могут возникнуть проблемы с законом. Конституция РФ прямо запрещает цензуру (статья 29. пункт 5: «Гарантируется свобода массовой информации. Цензура запрещается»), а если какие-то цензурные ограничения и накладываются, то – только по решению суда. Скорей всего, Яндекс и действительно не намеревается осуществлять цензуру, но фокус в том, что ее можно осуществлять и ненамеренно. Как именно? Посмотрим.

Пройдем еще раз по ссылке, которую прислал Платон Щукин . Ссылка ведет на страницу «Поиск Яндекса и контент для взрослых», и там, в частности, можно прочесть: «Под «материалами для взрослых» мы подразумеваем страницы, которые родители не хотели бы показывать своим детям раньше времени. Мы считаем, что если в поисковом запросе явно не выражено намерение найти именно порнографию и ничего другого, то поисковая машина не должна предлагать в результатах поиска ссылки на ресурсы с эротическим содержанием». Это благая мысль, но немного смущает, что Яндекс озабочен только двумя категориями граждан: родителями, которые не хотят показывать детям порнографию, и страдальцами, которые хотят «найти именно порнографию и ничего другого». А как быть с остальными? Вот, например, родители обычно не дают читать детям Рабле, Мопассана, «Яму» Куприна, «Лолиту» Набокова и так далее. С другой стороны, есть люди, которые читают эти тексты исключительно ради эротических пассажей. По аналогии, Яндекс принимает в расчет только эти две категории читателей. Ну, а человека, который хочет прочесть текст не ради того, чтобы возбудиться, но так, как читают нормальные люди, Яндекс из своих раскладов в принципе исключает.

Чтобы в этом убедиться, достаточно посмотреть, что поисковик считает «эротическим содержанием». В разъяснениях сказано: «Для определения «порнографичности» страницы используются, в первую очередь, тексты и слова, размещенные на этой странице (в том числе — в ссылках). Используются и многие другие факторы. Например, если на сайте много страниц «для взрослых», содержащих соответствующую лексику, то, с большой вероятностью, из результатов поиска будут отфильтрованы и другие страницы с этого сайта, даже те, которые такую лексику не содержат». Как видим, Яндекс не дает никаких точных указаний на то, что именно и в каком количестве должно (или не должно) содержаться на сайте, чтобы на него была наложена цензура. Но если я в какой-нибудь статье процитирую Набокова, то очень может быть, что не только эта статья не будет допущена в поиск Яндекса, а и весь сайт, опубликовавший эту статью, будет подвергнут цензуре.

В сущности, это примерно то же самое, что запретить всего Набокова за то, что он написал «Лолиту» (и даже – только какой-нибудь ее абзац). И это не какое-нибудь преувеличение, вот перед нами факт: на 10 тысяч страниц сайта пришлась страница, на которой (в качестве примера) были две ссылки, которые сразу же были уничтожены, но сайт месяц за месяцем не возвращается в поиск.

Цензура на автомате

Почему Платон Щукин говорит, что у них нет цензуры? По недоразумению. В памятке Яндекса сказано: «Страницы, сайты и картинки фильтруются Яндексом автоматически». Видимо, Яндекс исходит из предпосылки, что фильтр – это просто инструмент, при помощи которого осуществляется отбор контента, а цензура – это сознательная оценка контента по какому-то критерию. Но критерий-то в любом случае есть (просто в пояснениях Яндекса он размыт). Для того, чтобы фильтр работал, в его программу должен быть вставлен критерий, в согласии с которым машина механически выбирает, что можно показывать людям, а что нет. Сотрудники Яндекса на основании того, что отбор осуществляется автоматически, говорят, что их поисковик не осуществляет цензуру. Но ведь программу написали все-таки люди, исходя из неких ценностных критериев, а значит – внесли в процесс фильтрации информации элемент сознательного ценностного отбора, то есть – цензуру. Очень странно, что сотрудники Яндекса не понимают таких простых вещей, относятся к рукотворной программе как к какому-то фетишу: раз машина решила, то быть посему.

Но самое смешное, что запрет на качественный контент связан с нежеланием Яндекса хоть как-то ущемить тех, кто хочет смотреть (и показывать) настоящую порнографию. Смотрите, что сказано в памятке: «Введение фильтра в результатах поиска никак не скажется на процессе индексации сайтов со взрослой тематикой. Фильтрация никак не отразится и на ранжировании сайтов для взрослых по запросам, где такие результаты уместны». Трогательная забота о тех, кто ищет порнографию. Она приводит к тому, что, если набрать в Яндексе какое-нибудь слово, связанное с порно, на вас вывалятся бездны похабщины. Можно сказать, что Яндекс крупнейший распространитель порнографии в Рунете. Зато, если какой-нибудь сайт опубликует статью, посвященную изучению культурологических аспектов порно, то он весь целиком попадет под цензурный запрет. Порносайт не попадает («фильтрация никак не отразится и на ранжировании сайтов для взрослых»), а качественный ресурс, на одной из 10 тысяч страниц которого анализируется арт-порно – попадает весь целиком.

В принципе, такая логика вполне понятна: мыслящих людей в интернете сравнительно не много, а тех, кто ищет порно, толпы. Первыми можно и пренебречь, если ты хочешь прослыть защитником нравственности и одновременно не потерять сексуально озабоченный контингент.

Допустим, Яндекс и действительно не осуществляет цензуру. Но нельзя усомниться в том, что в его алгоритим заложены принципы, на основании которых цензура может осуществляться. И поисковик не хочет с такой возможностью расстаться. Именно не хочет, а иначе непонятно, по какой причине Яндекс не сделает так, чтобы под его нравственную цензуру попадали только те страницы, на которых, действительно есть эротический контент? Не такая уж это и сложная техническая задача – поставить фильтр только на ту страницу, где, действительно, присутствует (или только заподозрено) такое содержание. Такие фильтры стоят, например, в ЖЖ: прежде, чем показать вам страницу, где есть эротический контент, вас предупреждают и предлагают выбрать – пройти дальше или нет. Но Яндекс ничего подобного почему-то не делает, просто изымает целый сайт из поиска. И это заставляет заподозрить, что декларируемая поисковиком забота о детях, которые могут нечаянно набрести на нежелательный контент, – всего лишь отговорка, которая прикрывает что-то другое. Что именно?

Высоконравственная фильтрация

Понятно, что Яндекс никогда не будет широко афишировать свою «поисковую политику», ибо это может привести к потере пользователей, которых интересует не порнография, а качественный контент. А тем, кто спросит, почему тексты не ищутся, сотрудники поисковика объяснят, что просто Яндекс оберегает людей от контента, который они не желают найти. Яндекс лучше своих пользователей знает, что им надо читать, а что не надо. Он им расскажет, что совершенствует свою поисковую систему день и ночь. А если пока не получается найти то, что им надо, то это не цензура, это просто забота о детях. Не цензура, а высоконравственная фильтрация.

Может быть, это особенность российского человека – бессознательно встроить в свое дело принципиальную возможность цензуры (делаем стиральную машину, а все равно получается пулемет). А может быть, это специально предусмотрено – на всякий случай: вдруг появится необходимость в цензуре, а у нас уже все готово и отработано. Ведь критерии оценки в программах фильтров несложно перестроить в соответствии с тем, какая будет политическая линия. Кажется, Яндекс либеральная контора, но ведь либеральная фильтрация – легко согласуется с многовековой традицией цензуры в России.

Собственно, проблема даже не в том, что поисковике заложены механизмы фильтрации, проблема в том, что нет никаких способов контроля над тем, как Яндекс эти механизмы применяет. Непрозрачность принципов поисковика выражается, в частности, в откровенном заявлении (такое не грех процитировать еще раз): «Если на сайте много страниц «для взрослых», содержащих соответствующую лексику, то, с большой вероятностью, из результатов поиска будут отфильтрованы и другие страницы с этого сайта, даже те, которые такую лексику не содержат». Ключевые слова здесь: «будут отфильтрованы и другие страницы». А основание для такой фильтрации неопределенное: «много» и «соответствующая лексика». Но что значит «много» и что такое «соответствующая лексика»?

Ответа нет. Никто из владельцев сайтов точно не знает, что может не понравиться роботу. А Платоны Щукины прямо говорят, что они эту информацию не раскрывают. На просьбу веб-мастера Peremeny.ru дать какую-то утилиту, которая позволила бы найти то, что не нравится роботу, или хотя бы увидеть нежелательные ссылки, которые могли быть оставлены, например, в читательских комментариях за шесть лет работы сайта, был получен ответ: к сожалению, такого инструмента не существует.

Не существует? Но работники Яндекса видят нежелательные ссылки, значит, инструмент для их обнаружения все-таки есть. Почему же не сделать его общедоступным? Это ведь всем пойдет на пользу. Отношения между сайтами и Яндексом, сайтами и пользователями станут прозрачными и понятными… Нет, Яндекс идет по другому пути, считает, что лучше исключить из поиска весь провинившийся (или нет?) сайт целиком. Но таким способом, можно исключить (ничего не объясняя или указывая на несуществующую ссылку) все, что угодно.

Виртуальные схемы

Итак, перед нами парадокс: Яндекс не хочет осуществлять цензуру на порнографию, но при этом хочет, чтобы ее не увидели дети, а в результате ставит фильтры на сайты, которые никаким боком не являются порнографическими. Это очень удобно: свалить в порнопоиск сайт, который ни по каким критериям порнографическим не является. Отправить нежелательные тексты туда, где никому не придет в голову их искать.

мою статью о местах силы на Переменах можно найти, если добавить к поиску слово - порно. Но ведь я употребляю это слово не в каждой статье

Отлично придумано: под таким соусом можно осуществлять скрытую цензуру.

Я вовсе не говорю, что Яндекс этим занимается. Я только говорю, что это возможно технически, если у тебя есть набор инструментов (фильтров) для осуществления цензуры. Причем, если цензура все-таки есть, об этом вовсе не обязательно должно знать руководство поисковика. Руководство-то как раз должно хорошо понимать: если среди широких масс пользователей установится мнение, что Яндекс занимается цензурированием, то есть – исключает из поиска значительный массив информации, то поисковик просто умрет (ну, может, останется как поисковик только для порно). Ведь у всех под рукой прекрасно ищущий Google. Переход на него – одно нажатие кнопки. И если это сделают многие (а к тому все идет), то – инвесторы на бирже просто сбросят ненужные бумажки, и все, поминай, как звали этого Яндекса. Конечно, его владельцы этого не хотят. Так почему же продолжается фильтрация?

Должен предупредить, что написанное ниже не имеет прямого отношения к Яндексу. Это только предположения, которые могут относиться к любому поисковику, в недрах которого происходит бардак. Дело, собственно, не в том, является ли цензура политикой поисковика, дело скорей в том, что такая возможность у него есть. А если есть такая возможность, обязательно найдутся люди, которые рано или поздно ею злоупотребят. Итак, сейчас мы рассмотрим несколько вариантов того, как можно злоупотребить инструментами фильтрации.

Коррупция

Люди, имеющие отношение к медиа, знают, что в каждой редакции есть субъекты, которые потихоньку протаскивают заказуху. В каждой редакции с ними, естественно, борются, но партизанские заказные материалы все равно появляются. Формы такой коррупции могут быть разные. Одна из таких форм в интернете сводится к тому, чтобы поставить на сайт компромат, направленный против кого-то, а потом, получив с жертвы деньги, этот материал заблокировать. Нетрудно придумать аналог подобного рода коррупционных схем и в поисковике. Например, как известно, в сети процветает торговля, которая напрямую зависит от посещаемости интернет-магазина. Если на сайт магазина поставить фильтр (сказать, что у вас, мол, там есть ссылка на порноресурс, но не указать, где она, сославшись на тайну алгоритма), то посещаемость резко упадет, а вместе с ней – и продажи. Это, конечно, грубая схема, но это не надуманная проблема.

Все наверняка видели спам, обещающий вывести на первые места в поисковых системах. Бизнес настолько процветает, что даже на МКАД можно встретить огромные стакеры (а это куда дороже спама), приглашающие обращаться к таким оптимизаторам. Разумеется, официально они вам объяснят, что рейтинг поднимается за счет введения на страницы вашего сайта ключевых поисковых фраз и прочего, что применяют все владельцы сайтов и без всяких оптимизаторов. А вот имея связи с кем-нибудь из менеджеров поисковика, следящих за «поведением» поискового робота, очень даже можно оказаться на первых строках в выдаче по желаемому запросу.

Еще один вариант: при помощи фильтра коррупционер в поисковике может «уронить» старый раскрученный сайт, стоящий на первых местах в рейтинге. Хозяин сайта гарантированно засуетится, начнет искать выход на тех, кто может решить их проблему. И обязательно выйдет на того, кто может вернуть сайт в поиск. Впрочем, такое вымогание денег не единственная возможность. Можно рассмотреть ситуацию, когда сайт выводят из поиска по хорошо проплаченной просьбе того, кто хочет избавиться от конкурента, например, торгующего в интернете аналогичным товаром. Ничего невозможного в такой ситуации нет. А разговоры о том, что поисковик это просто машина, – лукавство. Машину можно настроить как угодно, было бы желание. Уж если служители государственной машины постоянно делают коррупционные фокусы в реале, то почему служащие поисковика не могут заниматься этим в сети? Технически невозможно? Ну так пусть нам покажут, какие способы защиты от жуликов, готовых применять эти схемы, имеются у поисковиков. А пока не показали, будем исходить из того, что такие схемы возможны.

Идеология

Там, где есть возможность фильтровать информацию, кроме коррупции возможна и цензура в самом прямом идеологическом смысле этого слова.

Представим себе того же менеджера, который, работая в офисе поисковика, выбрасывает из поиска сайты, прикрываясь тем, что машина, якобы, обнаружила что-то нехорошее. Но на сей раз он не жулик, а человек кристально чистой души. Только слишком верит в идеалы, скажем, политического переустройства обществ или является неофитом какой-нибудь прекрасной религии. Можно допустить, что такой человек, имея доступ к постановке фильтров, просто внесет сайт с непонравившейся ему статьей в черный список, и поисковик вдруг перестанет искать этот сайт. Этот человек, конечно, будет считать, что делает благое дело.

А другой человек, не такой фанатик, может поставить запрещающий флажок только потому, что его попросили об этом какие-то очень серьезные люди, и он не смог отказаться.

Вот это уже будет цензура в совершенно традиционном смысле, хотя и проведена она в частном порядке, а не официально. И вы, владелец сайта, вкладывающий и деньги, и душу в свой сайт, никогда даже не узнаете, что произошло, и почему на самом деле на вас наложен запрет. Вы давно очистились от всех прегрешений, а вас месяц за месяцем не возвращают в поиск. Говорят, какая-то порнография, но вы уже не верите этим отговоркам. Вы думаете про себя: какие статьи снимать? Про Путина? Про Медведева? Про литературу? Про религию? Непрозрачность работы поисковиков – вот проблема, которая вполне может со временем обернуться тотальной цензурой. Коротко говоря: там, где есть фильтры, возможна цензура, а там где возможна цензура, она обязательно будет.

Пилите Шура, пилите…

Вообще-то фильтры Яндекса можно и отключить. Надо найти на главной странице малозаметную кнопку «Личные настройки», выбрать пункт «Настроить Яндекс», там дальше найти кнопку «Остальное», нажать на нее, найти графу «Настройка результатов поиска», нажать, пройти дальше, в самом низу открывшейся страницы будет раздел «Фильтрация страниц». Если вы доберетесь до этого места (а нормальные люди этим обычно не занимаются), то увидите, что там поставлен флажок «Умеренный фильтр». Есть еще «семейный поиск» и «без ограничений». Так вот, если включить последнее, то действительно «найдется все». Но по умолчанию на Яндексе стоит «умеренный фильтр», который исключает из поиска целые сайты, ровно так, как описано в этой статье. Но кто знает об этом умолчании? Да практически никто, поскольку до этого места еще надо как-то добраться. А должны бы знать все пользователи, ибо они, бедняги, ищут, не находят, а коллективный Платон Щукин сидит на возвышенном месте и приговаривает: «Пилите, Шура, пилите».

Кстати, на Google тоже по умолчанию стоит «умеренный фильтр», но, во-первых, он не исключает целые сайты из поиска под надуманным предлогом, что когда-то у них была нехорошая ссылка, а во-вторых, до места настроек фильтров на Google можно добраться в один клик, в отличие от сложной процедуры Яндекса. И опять возникает вопрос: почему Яндекс делает информацию о фильтрации, установленной по умолчанию, практически недоступной для пользователей? Я бы на месте адвокатов Союза защиты прав потребителей заинтересовался этим вопросом. Тут есть хорошие возможности для расследования. Конечно, с юридической точки зрения Яндекс максимально подстраховался, но можно хотя бы заставить его поставить под своим слоганом «Найдется все» пояснение: «Кроме того, что попало под фильтры». И сделать это пояснение покрупнее (как, например, требуют от производителей табачных изделий крупно писать на своей продукции — «Курение вредит вашему здоровью»). Дизайн главной страницы Яндекса от этого даже улучшится. И пользы от такой информации будет много.

Ну, действительно, ведь вначале я вообще должен понять, что ко мне, пользователю, применяется фильтр, а уж потом только буду искать, где он отключается. А Яндекс эту информацию прячет. Ладно, пусть это не цензура, но это все равно какая-то разводка, ограничивающая свободу выбора контента. Пользуясь моим неведением, Яндекс (его машина) решает за меня, что мне можно смотреть и читать, а что нет. Фактически лишает лоха (а в такой ситуации лохи практически все) свободы выбора. И ведь не подкопаешься: информация о фильтрации есть, но ее как будто и нет. Как говорил Ильич: «По форме правильно, а по существу издевательство».

О цензуре как таковой

Чем плоха цензура и почему с ней необходимо бороться? Цензура плоха вовсе не тем, что она государственная, цензура плоха тем, что она лишает человека свободы. Если мне связали руки, лишив возможности действовать самостоятельно, то какая разница, кто это сделал – государство или какой-нибудь частный рабовладелец. Никакой разницы. Государство даже лучше, поскольку у него есть хоть какие-то законы, которые можно понять и опираться на них. А частник отделывается расплывчатыми понятиями «много» и «соответствующий». И тут уже не попротестуешь, тут царит полный произвол машины или жучков, которые в ней завелись. Тут ты бесправен и можешь только бежать, благо есть куда.

Конечно, поисковик должен иметь возможность цензурировать материалы, которые он выкладывает в поиск. Терроризм, экстремизм, детская порнография, наркота, разжигание и прочее – вещи, которые должны пресекаться. Разумеется, по суду. Но если вы такие высоконравственные, что считаете возможным брать на себя прерогативы суда, то озаботьтесь хотя бы следующими вещами. Во-первых, сделайте эффективные фильтры, которые будут распознавать и блокировать только те страницы, на которых появляется именно криминальный контент. Во-вторых, опубликуйте четкие перечни того, что должно быть блокировано (а не как при высоконравственной фильтрации Яндекса: «много» и «соответствующая лексика»). В-третьих, если мы хотим действительно свободного распространения информации, то блокировать надо не целые сайты, а лишь страницы, на которых размещена безусловно злокачественная информация. И автоматически уведомлять владельцев сайтов о том, что, мол, у вас на такой-то странице есть недопустимый контент, при этом указывать, какой именно, и возвращать страницу в поиск, если такой контент устранен. А иначе о свободе распространения информации придется просто забыть. Ибо, если какой-нибудь Яндекс будет по своему усмотрению (или «по усмотрению» своего робота) блокировать информацию, которую ищут люди, то это – цензура похуже любого Главлита.

***

Во второй половине лета сайт Peremeny.ru ненадолго вернулся в поисковую выдачу Яндекса, но в начале сентября снова попал под цензуру. Ну что же, веб-мастер написал письмо Платону Щукину и получил от него такой же точно ответ, как тот, что приведен в начале этой статьи: сайт ищется, сами посмотрите (ссылка), если вы знаете, какие страницы не ищутся, пришлите примеры… В общем один в один: у вас порнография… На просьбу указать нежелательный контент, был вновь получен ответ: мы не даем такой информации… А на просьбу все-таки что-нибудь сделать Платон ответил: «Насколько я вижу, сейчас все в порядке. Если в течение 2 недель подобных ссылок не появится, то Ваш сайт сможет вернуться в поиск и находиться по запросам. Пожалуйста, ждите».

Прошло уже значительно больше двух недель, сайт все еще не ищется.

Текст подготовлен для «Частного корреспондента».
Этот текст разрешено перепечатывать и цитировать без ограничений.


комментарий 21 на “Найдется всё. Но не на Яндексе. Цензура на автомате и ее возможные схемы в интернете”

  1. on 04 Окт 2011 at 5:45 пп Роман

    Размещение акций на американской бирже приводит к зависимости от недружественных акционеров. Давно уже следует признать, что покупка наших предприятий иностранцами приводит к деградации. Это касается не только заводов, но и интернет-проектов, медиа-ресурсов, и даже игровых проектов. Я иногда пользуюсь поисковиком Нигма.рф

  2. on 04 Окт 2011 at 5:49 пп Iryale

    Весьма ценная и подробная информация. Спасибо.

    Летом столкнулась с аналогичной проблемой в совершенно другой, «игрушечной» сфере. Если не возражаете, поделилась бы некоторыми соображениями.

    Я имею блог, посвященный уже несколько старой полудетской компьютерной игрушке. — В свободное время пишу туториалы, посвященные некоторым трюкам, которые удается придумать самой, перевожу наиболее популярные и интересные известных англоязычных авторов. Многие тексты раскопированы по сайтам и сайтикам без указания исходной ссылки, — да Бога ради: денег не приносит, да и не для того делается. Просто хобби.

    Этим летом столкнулась с аналогичной описанной проблемой, — после нескольких явно «тестовых» запросов, зафиксированных статистикой blogger’а и прогулки по блогу представителя одного из «крупных и наглых» форумов, содравших практически все мои туторы, меня выкинули из Яндекса. Картина с исчезновением «меня» из всех поисков яндекса полностью аналогична вашей, до смешного. Писем не писала: в гугле и на профильных сайтах есть, и ладно. Насколько я знаю, в отличие от меня, похоронившие меня в яндексе «добрые ребятки» зарабатывают размещением рекламы.

    Полагаю, вашим исчезновением вы можете быть обязаны не только явному несовершенству яндекса, но и «доброте» ваших конкурентов. Или героев ваших статей. Далее все стандартно: запрос — > ответ — > автоматические действия. :(

  3. on 05 Окт 2011 at 10:01 дп Otto

    Олег, спасибо за статью. Интересная… С одним из моих сайтов в конце мая был катаклизм. Без видимых причин вылетел из Яше. После переписки с платоном сайт востановили… Осадочек остался… В общем, если интересно сайт http://www.topa.ru/ за поднятие этой темы…

  4. on 05 Окт 2011 at 11:03 дп admin

    Otto
    Конечно, всем интересно, чтобы эта мразь перестала гадить людям. А Ваш сайт просто создан для того, чтобы такие темы поднимать. Со своей стороны Перемены готовы оказать полное содействие. Тут нужны солидарные действия.

  5. on 05 Окт 2011 at 11:03 дп admin

    Iryale
    Спасибо за ценную информацию.

  6. on 05 Окт 2011 at 11:41 дп biv

    «Свобода» — это возможность бесконтрольно и безнаказанно выливать на головы других что угодно, начиная от собственных банальных измышлений и заканчивая откровенно лживой и/или заказной писаниной.
    Именно так (или примерно так) понимают слово «свобода» большинство графоманов, «либералов-демократов» и прочих борцов с цензурой.
    Лично я — потребитель информации. И, честно говоря, был бы уже рад хоть какому-то ограничению в распространении этой самой «информации» во всех её видах: радио, кино, реклама и т.д., и т.п.
    60% всей этой нашей современной «информации» во всех её видах — это просто никому не нужный мусор, информационный шум, забивающий голову «простому люду». Ещё 20% — это продукт целенаправленного воздействия на публику с определёнными целями. Оставшиеся 20% — представляют хоть какую-то реальную ценность для человека, будь то духовную или практическую.

  7. on 05 Окт 2011 at 11:44 дп Юрий Носков

    Олегу Давыдову

    Если Вы взялись анализировать тему, так ее нужно анализировать, а не
    плакаться.

    Нужно представить себе что есть Интернет и где находятся 10
    корневых DNS-серверов (сервера отвечают за адресацию).

    Что есть американская система Эшелон — тотального прослушивания
    и контроля электронного пространства, и европейская Энфарон тоже.
    И какое место в них занимают Гугл и Яндекс.
    Есть вроде как российская надзирательная система, но учитывая,
    что операционные системы иностранные, стандарты сети тоже,
    поисковики (движки) используют тоже чужие. О «договоренностях»
    между спецслужбами и особенно теми, кто этими спецслужбами управляет
    на горизонтальном уровне и которых как бы и нет, особый разговор. Информационное пространство России было сдано на саммите 8
    в Окинаве в 2000 году. Предлагайте варианты как будем
    восстанавливать. У меня вот уже 10 лет лежат разработки
    по Интернету следующего поколения… и не только.

    Сам сталкиваюсь постоянно с фактами совсем откровенными.
    Мой сайт называется Аналития, слово это сам придумал, так что
    поначалу все поисковики на запрос по этому слову делали
    ссылки на целый список статей сайта. А потом как отрезало,
    на всех одномоментно. Особый вопрос — текстова строка
    в поисковике. Явно видно, что там зачастую не обходится
    без человеческого участия.

    Яндех в целом хороший ресурс и люди там разные,

  8. on 05 Окт 2011 at 1:41 пп Андрей

    biv, то есть Вы согласны, чтобы кто-то делал выбор за Вас — что читать, а что нет?
    Тут ведь речь идет о том, что никто или почти никто не знает про умеренную фильтрацию Яндекса и про то, что она включена по умолчанию. Как и про то, что под нее часто подпадают сайты, на которых есть действительно интересная и заслуживающая внимания и доверия информация. а не только графомания или информационный шум.
    Собственно, все, кто не смог дочитать эту статью до конца (а таких, судя по dirty.ru, откуда я сюда пришел, много) — так и остаются в полном неведении относительно того как их наебывают в этом мире. и даже рады оставаться в этом полном неведении. обманываться и быть обманутыми. Вы, biv, по всей видимости, тоже из их числа.

  9. on 05 Окт 2011 at 4:41 пп emanno

    В настоящий момент в поиске Яндекс 11000 страниц вашего сайта. По запросу «Места силы. Шестое – Урочище Жаровка» вы на первом месте. Это обычные расколбасы Яндекс, который вновь тестирует свои новые алгоритмы.

    Так что не все так плохо. Не поленитесь сходить на форум Серч — там с такими проблемами сталкивался каждый 1-й вебмастер. И переписка с Платонами цитируется еще более захватывающая. При всем уважении (я ваш подписчик) — не думаю, что уважаемый сайт peremeny.ru так уж интересует наше Всевидящее Око.

    Все намного проще — Яндекс славится своей кривизной и постоянной сменой алгоритмов. К сожалению, основной трафик идет именно оттуда и вебмастера вынуждены, матерясь и проклиная, работать c Яндекс.

  10. on 05 Окт 2011 at 8:55 пп admin

    emanno, спасибо за комментарий и за то, что читаете нас.
    «Места силы. Шестое – Урочище Жаровка» — да, по этому запросу (как и по всем другим ключевым запросам) Перемены действительно на первом месте, но только если ОТКЛЮЧИТЬ опцию в Яндексе «умеренный фильтр». А у большинства пользователей она по умолчанию включена. У Вас она, видимо, давно уже выключена — как у человека, который в вебе не первый день.

  11. on 06 Окт 2011 at 9:50 дп emanno

    Да, вы правы! Что ж, выход только один: постоянно писать абузы. И чистить сайт, что поделать… Убрать по возможности все подозрительные ссылки или сделать их в виде неактивного текста. Вода камень точит. Желаю вам удачи и быстрейшего возвращения!

  12. on 06 Окт 2011 at 11:38 дп Юрий Носков

    Внимательное прочтение статьи Олега говорит о том, что это
    всего лишь ход по привлечению внимания к своей статье.
    Подход прикольный… как говорит современная молодежь.

  13. on 06 Окт 2011 at 11:58 дп Юрий Носков

    Прочитав еще раз рекламируемую статью Олега,
    можно с уверенность сказать, что русские боги
    его обязательно отблагодарят за труды. Тут даже
    сомневаться не приходится.

  14. on 06 Окт 2011 at 12:59 пп admin

    Юрий Носков.
    Я вообще не понимаю, о какой статье Вы говорите. Об «Урочище Жароввка», что ли? Ну так картинку сделал наш бильд, а вовсе не Давыдов. Может, сделал и по наущению русских богов, тут я ничего не знаю. Но тогда русские боги должны благодарить бильда, а с Давыдовым у них и так постоянный контакт.

  15. on 06 Окт 2011 at 3:03 пп Н.

    Не, не вылазит ваше Урочище по поиску яндекса. На блоги майла выводит.
    А вот в гугле всё нормально. И, если честно, поиск гугла в последнее время нравится всё больше. А яндекс всё тупеет и тупеет.

  16. on 06 Окт 2011 at 7:33 пп Дмитрий

    Не вылазит, точно-)
    Утештесь,Олег, те кто пользуется одной системой поиска, ваш задорный сайт читать не будут.

  17. on 08 Окт 2011 at 12:12 дп biv

    Андрей,
    «согласен» не то слово. Я был бы крайне признателен (возможно, даже доплачивал бы), если бы кто-то меня ограждал от этого современного информационного поноса. Увы, самооценка сейчас у многих неоправданного завышена, моральные нормы занижены. Вот и приходится самому тонны чьего-то г..а перелапачивать, что бы найти что-то по настоящему полезное/ценное.

  18. on 08 Окт 2011 at 10:05 дп Iryale

    biv
    > cамооценка сейчас у многих неоправданного завышена, моральные нормы занижены…
    ———
    Вы полагаете, если все, что не нужно лично Вам, можно назвать «информационным поносом», Ваша самооценка адекватна? — :lol:

    Вас устраивает «система исправления опечаток в запросах» яндексу, в результате которой он по определению ищет не то, что нужно вам, а то, что проще найти, т.е. то, что уже давно найдено и сохранено в логах? Вы не знаете, что рамблер давно куплен яндексом со всеми вытекающими из этого обстоятельства «сервисными аналогиями»? И в рунете уже нет нормального поисковика и снова приходится юзать «вражий гугель»? Или Вы не в курсе истинных правил «свободной» конкуренции на рынке продвижения «информации»?

    Так ознакомьтесь. А то зачем же такому «солидному самостоятельно мыслящему» человеку собственными невежеством и ленью разума блистать?..

  19. on 19 Окт 2011 at 6:36 пп Просто Доктор

    biv
    Интересненько, кто определяет, что духовно а что без? Что понос, а что нектар? РПЦ, например,ведические тексты может посчитать «поносом», а саентологи за понос примут статьи по психиатрии.
    Я хочу сам решать, что мне нужно, а что нет.

  20. on 24 Окт 2011 at 11:23 пп Сергей

    Вот где настоящая порнография, и не в ссылках: http://www.peremeny.ru/books/osminog/3536
    И ссылка на эту порнографию на первой странице.
    За подрывные материалы сайты нужно фильтровать.

  21. on 25 Окт 2011 at 5:18 пп karasseff

    «Яндекс»

    Тоже замечал такое.

НА ГЛАВНУЮ СТРАНИЦУ ОСЬМИНОГА>>
Версия для печати