Генерация контента. Возможно ли сегодня создать сайт с таким содержимым?
Всем привет! Ушел по уши в запуск новых проектов и совсем не успеваю освещать все интересные моменты моей вебмастерской жизни. А интересных наблюдений уже скопилось немало. Пожалуй, расскажу немного о последнем запущенном проекте, который, как вы уже поняли, основан на генерации контента.
Не, ребята, если вы открыли этот пост в надежде, что здесь будет готовый кейс и ссылка на мой проект, то я вас разочарую – сегодня обойдемся без подобного стриптиза. Я просто постараюсь заставить вас взглянуть на генерацию контента новым взглядом. Может кому-то это поможет, и он родит свой проект по окончанию прочтения.
Генерация контента ранее активно использовалась при создании дорвеев – это было даже порой увлекательно под пивко читать то, что выдавал скрипт генерации. Для генерации был необходим собственно сам этот скрипт генерации или программка, а также несколько мегабайт тематического текста. Я не знаю, как сейчас обстоят дела с дорвеями и подобной генерацией, так как ушел из этой темы 2 года назад. Но уже тогда поисковики умели наказывать за подобный контент. Сейчас, я уверен, они глупее не стали.
Вообще мечта любого вебмастера – это создать сайт с минимальными усилиями, который самостоятельно бы развивался и приносил прибыль. Слишком уж идеалистично скажете вы? Но я могу с гордостью сказать, что один такой сайт у меня в загашнике точно есть, и он даже полностью «белый». Сейчас вот был запущен второй, о котором я и хочу рассказать. Охарактеризовать я его могу, как «сервис ответов».
Реализация генерации
Вы никогда не задумывались, сколько трафика собирают банальные вопросы в поисковых системах, наподобие «2+2», «корень из 81», «курс доллара на 28.02.2014» (исключительно в качестве примера)? А ведь дать ответы на подобные вопросы очень и очень даже просто: обычная арифметическая операция на стороне сервера, несложная интеграция с каким-нибудь сервисом и т.д. Таким образом, задача вашего проекта сводится к тому, чтобы научиться создавать страницы с ответами на вопросы пользователей без вашего прямого участия. К этой же группе сайтов можно отнести и сервисы по поиску расстояний между городами, поиску кратчайшего пути – все это делается грамотно написанным скриптом и интеграцией с уже существующими сервисами (в данном случае Google карты).
Идея моего проекта родилась чисто случайно, когда я собирал семантическое ядро для совершенно другого сайта и случайно подметил группу запросов в Яндекс Wordstat. По большому счету, проект представляет собой форму поиска, которая благодаря реализованным алгоритмам способна давать ответы на поисковые запросы пользователей.
Реализация наполнения сайта
Для поисковых систем немаловажным сигналом об активном развитии ресурса является рост проиндексированных страниц. И это логично. Ведь, как правило, все контентные проекты начинают с нескольких страниц и только с течением времени прибавляют в своем поисковом индексе.
Именно поэтому вы должны, пусть и незаметно для пользователя, но в процессе его активных действий на сайте, создавать новые страницы. Например, на сайте можно реализовать форму поиска и вынудить пользователей заполнять ее. Форма поиска на моем сайте имеет определенный набор параметров, которые позволяют генерировать различные вопросы. Если сервис в состоянии дать ответ на новый для системы вопрос, то генерируется новая страницы с ответом, на которую и перенаправляется пользователь. В дальнейшем эта страница будет проиндексирована уже пауками и позволит привлекать поисковый трафик из серпа.
Надеюсь, схема ясна. Казалось бы, ничего сложного, а новые страницы на сайте появляются и трафик увеличивается. Вообще данный процесс очень похож на, так называемое, «кеширование» – программисты меня поймут.
Основные моменты внутренней оптимизации
О, сколько же постов в блогах написано на эту тему! Я лишь отмечу основные моменты, на которые я делаю упор в этом проекте:
- Title и метатеги страницы;
- Структура заголовков H1-H3;
- Наличие медиа-контента (картинки, ролики YouTube).
Да, ребята, и оптимизацию каждой отдельной страницы по указанным критериям также можно автоматизировать – сейчас расскажу как.
Генерация Title и Metatgs
Сгенерировать заголовок и метатэги на самом деле несложно – это вам не контент страницы генерировать в несколько предложений. Тут вам нужно-то всего одно предложение из нескольких слов. Поэтому за полчаса-час можно составить шаблон генерации и в дальнейшем использовать его, получая на выходе достаточно уникальные предложения. Если дружите с PHP, то можете воспользоваться моим скриптом для генерации текста из шаблона. Разумеется, при генерации текстов и новой страницы необходимо использовать данные формы поиска, которую пользователь заполняет.
Заполнение тегов H1-H3
Зачастую страницы сайтов содержат в области контента только заголовок H1 с ключевой фразой. Я же обычно стараюсь, чтобы контент содержал еще несколько тематических H2 – да хотя бы этот блог возьмите. В общем, с тегами заголовков проблем возникать не должно – любая толковая CMS вам с этим поможет.
Парсинг картинок и видеороликов
Наличие тематического медиа-контента на странице я считаю не менее важным, чем тот же грамотно составленный Title страницы. Однако мы же говорим о полностью автоматизированном сайте: как же реализовать поиск этого самого «тематического» медиа.
Вообще слово «парсинг», наверное, не совсем уместно, когда используется легальное API от самого же Google. Это раньше приходилось придумывать какие-то хитрые скрипты и схемы, чтобы спарсить какое-то содержимое из выдачи Google. Сегодня же я с абсолютной уверенностью могу сказать, что вы можете осуществлять санкционированный поиск изображений и видеороликов через предоставленные инструменты Google API.
Про поиск изображений я написать еще не успел, а вот как осуществить поиск видеороликов на YouTube через YouTube Data API v3 можете почитать.
На изображения еще неплохо повесить прямо посередине полупрозрачный ватермарк сайта – это из простого. При желании можно поменять цветовую гамму, подрезать, трансформировать. Все зависит от вашей фантазии и технической подкованности.
Возможно, немного разочарую, но не на все запросы к API вы будете получать тематический медиа-контент надлежащего качества. Случались у меня казусы: ищешь, например, пейзажи Африки, а тебе по непонятному алгоритму отдается видеоролик из World Of Tanks. Но! Если Google считает это видео или изображение тематическим, значит и наша страница сайта его должна устраивать. Логично?
Результат
Итак, самый интересный момент поста: как же поживает мой проект, созданный с использованием указанных схем и технологий? Он находится в индексе обоих поисковых систем и уже собирает порядка 50 пользователей в сутки. Прилагаю скриншот из Google Analytics по посещалке.
Посещалка на данный момент пока, действительно, у сайта смешная. Но если учесть, что для его продвижения было проставлено всего 3 ссылки с блогов на LiveJournal, и что количество созданных страниц составляет лишь тысячную долю от числа возможных, то потенциал у сайта есть и неплохой.
И вся изюминка сайта в том, что мне не надо тратиться на контент, собирать семантическое ядро – все, что необходимо, рано или поздно создадут сами пользователи. Прям сайт для людей какой-то получился :LOL:
Ну как? Удалось мне немного расшатать ваш стереотип о сайтах на cгенерированном контенте?
Комментарии
Вечер добрый! Семен, подскажи что можно почитать по данной теме? Уже весь мозг себе вынес, но так и не нашел ничего...
HTML/CSS, JavaScript, PHP, MySQL это та база которую начинал изучать еще в конце 2009, в дальнейшем было немного python-a и возвращение в php. Главная проблема похоже кроется в том, что произвести мозговой штурм как-то не очень хорошо получается. Видимо за поиском идей лучше двигаться в буржнет и синет.
Добавить комментарий