Объявление: снимаю, порчу. Метод автоматического рерайта для больших объёмов.
Проблема в следующем: сайт ВозьмиКредит был обновлён группой фрилансеров методом copy-paste, как результат — неуникальный контент и глубокая пессимизация. Для снятия пессимизации можно заказать рерайт примерно 300 текстов, а можно написать небольшую утилитку.
Заменять одно слово на другое неспортивно, поэтому мы пойдём по более сложному пути. Этот путь похож на алгоритм, который использует Я для сравнения текстов в базе.
Разбиваем текст на блоки по 3 слова, делаем три массива: без смещения, смещение на 1 слово и смещение на 2 слова. Далее по каждому смещению считаем CRC32 строк из 3х слов, сохраняя их в таблицу в формате «3 слова — CRC — количество». Берём самые популярные CRC, придумываем к ним 2-3 строки замены (рерайт), прогоняем по всей базе preg_replace c вероятностью в 20%. Вуаля! Уникальный текст.














на практике работать не будет, такое гонево получится что яндекс занесет в гс из за самих текстов, со всемы вытекающими последствиями
Интересные задумки. Я вот подумываю сделать такую системку надосуге, только немного по другому.