Кредит: рерайт по технике Яндекса

Объявление: снимаю, порчу. Метод автоматического рерайта для больших объёмов.

Проблема в следующем: сайт ВозьмиКредит был обновлён группой фрилансеров методом copy-paste, как результат — неуникальный контент и глубокая пессимизация. Для снятия пессимизации можно заказать рерайт примерно 300 текстов, а можно написать небольшую утилитку.

Заменять одно слово на другое неспортивно, поэтому мы пойдём по более сложному пути. Этот путь похож на алгоритм, который использует Я для сравнения текстов в базе.

Разбиваем текст на блоки по 3 слова, делаем три массива: без смещения, смещение на 1 слово и смещение на 2 слова. Далее по каждому смещению считаем CRC32 строк из 3х слов, сохраняя их в таблицу в формате «3 слова — CRC — количество». Берём самые популярные CRC, придумываем к ним 2-3 строки замены (рерайт), прогоняем по всей базе preg_replace c вероятностью в 20%. Вуаля! Уникальный текст.

This entry was posted in Программирование, Раскрутка and tagged , , . Bookmark the permalink.

2 Responses to Кредит: рерайт по технике Яндекса

  1. АВиа says:

    на практике работать не будет, такое гонево получится что яндекс занесет в гс из за самих текстов, со всемы вытекающими последствиями

  2. Alexey says:

    Интересные задумки. Я вот подумываю сделать такую системку надосуге, только немного по другому.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

*

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>