нужно понять какие страницы в индексе уже и исключить мусорные, усложняется тем что сайт большой + старый сайт имел неизвестную мне структуру (т.е. например имел разделы, которых нет на новом) ...при переезде на новый редиректы не настроили.
Логи проглядеть, собрать оттуда фуллист урлов, куда робот ходит
Этот лист загрузить в нетпик, подгрузить нужную инфу из серчконсоли и вычленить мусор
Ну в теории)) или не подойдёт?