Комбо на 8 млн. страниц

Опубликовал 14 Февраль 2012 в рубрике Лаборатория. Комментарии: 4

Всем привет, в студии Джо Саратино, здравствуйте ! Не устаешь удивляться гениям современного сапостроительства – совершенно невообразимые конструкции воздвигают порой они, чтобы зарабатывать в Интернете.

Сегодня, выполняя поиск для скачивания нескольких книг, я обнаружил в Яндексе части мощнейшей сетки ГС. Не знаю, насколько велика сама сетка, и сколько ГС она включает, а также, так ли они масштабны, как обнаруженные мной, но факт, как говориться, налицо.

Сначала я нашел (по прямой цитате из книги) большой энциклопедийный ГС на несколько тысяч страниц. Контент на нем был получен путем смешивания огромного количество текстовки с помощью специального софта (и я даже знаю, какого именно). Этот ГС был создан на WP, и в футере стояла сакраментальная фраза о том, что, типа, «все права защищены».

Далее я, путем пары нехитрых приемов, обнаружил еще два мегаресурса. Один из них представлял такой же склад смешанной текстовки, а второй – якобы библиотеку, написанную на неизвестном движке, страницы которой содержади несуществующие ссылки на скачивание неких книг. ГС были перелинкованы сквозняками.

Все три сайта были под АГС, однако, когда я «пробил» их в Google, то поразился – один из ГС в индексе имел более 8 млн. страниц !

8 млн. страниц на ГС ! Это невероятно ! Смешанная текстовка была практически единственным контентом этого «сайта», но, что самое удивительное и невероятное, на всех трех ресурсах стоит Adsense. Трафик есть, на одном до 500 хостов, на других счетчики скрыты. Конечно, в Adsense писать я не стал, но факт наличия таких сайтов там – не слишком приятное открытие. Тут думаешь, как бы точно соотвествовать Правилам, как говориться, дунуть не смеешь, а рядом такие ГС по 8 млн. спарсенной и перемешанной текстовки спокойно стоят с Adsense на борту ! Кстати, Сапу на одном я обнаружил, на самом маленьком.

Мораль… Да нет никакой морали, я просто привел в пример, что можно порой найти в Интернете. Кроме того, на мой взгляд, это слишком рискованная схема для заработка на Adsense, ну а что АГС – так это ничего, все ГС попадают туда рано или поздно. Самое главное, чтобы они успели заработать денег до этого – остальное не важно :)


К записи оставлено 4 коммент.

Так а чем они правила адсенса нарушили?

Вы что, смеетесь ? :)

1. «Издателям AdSense запрещено показывать объявления Google рядом с материалами, защищенными авторским правом, в отсутствие законных прав на публикацию такого контента»

2. «…издатели, использующие интернет-рекламу, должны также обеспечить соответствие своих ресурсов Рекомендациям Google по обеспечению качества целевых страниц» (по-крайней мере, 50% рекомендаций они точно не соответствуют).

3. Издатели, участвующие в программе AdSense, обязаны соблюдать инструкции, приведенные в руководстве для веб-мастеров (Старайтесь не использовать страницы… с небольшим объемом оригинального контента или вообще без него.)

ГС с генереным контентом и сканом, с тысячами мусорных страниц, часть которых вообще без содержания – конечно, Adsense предназначена для сайтов несколько другого плана.

Правда, я видел генереный ГС даже в РСЯ, причем это был очень интересный ресурс. Я не хотел бы рассказывать сейчас подробности, однако можно обратить внимание на, скажем, marketgid.com – это такая небольшая наводка на размышления :)

Здравствуйте! А каким интересно образом движок В.П выдерживает такое количество страниц? Везде пишут о том, что В.П «непризнаный лидер» по созданию нагрузки на сервер? Про беседу о мануале не забыли ещё? Терпеливо ждём…

Добрый вечер ! Так я разве где-то упомянул, что это движок WP ? :) Честно говоря, я даже не смотрел, на каком движке это написано, может, вообще статичный пакет HTML-страниц с инклудами. Насчет нагрузки – действительно, WP довольно тяжелый двиг, но в принципе, я бы сказал, что Joomla или MediaWIKI не намного легче. Дело в том, что сервер нагружается не только от движка, а и от посещалова тоже – больше народу, меньше кислороду :) А вообще, я удивляюсь, когда вижу посты на форуме про 1 млн. страниц в индексе и так далее. Жуть какая-то.

Насчет мануала – да не забыл, конечно, просто очень много задач, сижу по 12 часов и больше за компьютером, но все равно все не успеваю. Релиз, вероятно, будет на следующей неделе – набор и редакция практически сделаны, я добавил еще большой раздел, и на него ушла почти неделя. Надо еще дополнительно все проверить перед изданием – 63 страницы все же :) Кроме того, на днях будут выборы Президента, и все будут обсуждать это событие – согласитесь, что это неподходящее время для выпуска продукта.



Ваш комментарий !