Size: a a a

Техническое SEO

2020 March 11

T

Tom in Техническое SEO
Ivan kutasok Kutas
Можете дать ссылку на сообщение Demi? Чтобы я был в контексте.
Гугл может показывать по site:10k в индексе но дальше 20 или 30 страницы больше ничего не покажет
источник

MG

Max Gordienko in Техническое SEO
Aleksandr Nikitin
коллеги, как выгрузить все страницы из индекса Google? Подскажите решение...в GSC лимит на 1000 страниц
создать карты сайта с 1000 URL в каждой карте. Загрузить в серч-консоль. Получить данные по покрытию / индексу. Скачать. Все :)
источник

Alexandro Духовный in Техническое SEO
Tom
Гугл может показывать по site:10k в индексе но дальше 20 или 30 страницы больше ничего не покажет
Google дальше 1 страницы пагинации ничего не показывает
источник

Alexandro Духовный in Техническое SEO
Но индексирует норм даже если 10 или 49999 страниц в сайтмапе
источник

AN

Aleksandr Nikitin in Техническое SEO
Max Gordienko
создать карты сайта с 1000 URL в каждой карте. Загрузить в серч-консоль. Получить данные по покрытию / индексу. Скачать. Все :)
тут проблема в том что сейчас сайт новый с полностью новой структурой, нужно понимание какие старые адреса остались в индексе. отчет "Страница проиндексирована, но ее нет в файле Sitemap" выдает больше чем 1000 страниц...вот и вопрос как их оттуда забрать :)
источник

AN

Aleksandr Nikitin in Техническое SEO
понял что только перебором, так как в API нет методов для выгрузки этих данных
источник

СЯ

Серж Ян in Техническое SEO
Aleksandr Nikitin
тут проблема в том что сейчас сайт новый с полностью новой структурой, нужно понимание какие старые адреса остались в индексе. отчет "Страница проиндексирована, но ее нет в файле Sitemap" выдает больше чем 1000 страниц...вот и вопрос как их оттуда забрать :)
это не факт, что ее нет в сайтмапе
источник

MG

Max Gordienko in Техническое SEO
Aleksandr Nikitin
тут проблема в том что сейчас сайт новый с полностью новой структурой, нужно понимание какие старые адреса остались в индексе. отчет "Страница проиндексирована, но ее нет в файле Sitemap" выдает больше чем 1000 страниц...вот и вопрос как их оттуда забрать :)
если есть какая-то закономерность в старых URL то можно попробовать фильтровать вот так (но не факт что поможет) http://joxi.ru/GrqKxqlIkby8q2
источник

AN

Aleksandr Nikitin in Техническое SEO
так вот и проблема что все закономерности я не знаю :)  так пока и пробую :)
источник

T

Tom in Техническое SEO
Alexandro Духовный
Google дальше 1 страницы пагинации ничего не показывает
Почему это? У меня показывает
источник

Alexandro Духовный in Техническое SEO
Tom
Почему это? У меня показывает
Сколько не тестировали и кто толькотее тестировал, Гугл не индексирует нормально страницы с второй пагинации и поэтому нужно делить на микро категории
источник

СЯ

Серж Ян in Техническое SEO
Alexandro Духовный
Сколько не тестировали и кто толькотее тестировал, Гугл не индексирует нормально страницы с второй пагинации и поэтому нужно делить на микро категории
тоже не замечал, вся пагинация в индексе
источник

T

Tom in Техническое SEO
Alexandro Духовный
Сколько не тестировали и кто толькотее тестировал, Гугл не индексирует нормально страницы с второй пагинации и поэтому нужно делить на микро категории
Мы наверное не так поняли друг друга
источник

T

Tom in Техническое SEO
Alexandro Духовный
Сколько не тестировали и кто толькотее тестировал, Гугл не индексирует нормально страницы с второй пагинации и поэтому нужно делить на микро категории
я говорил о том что если парсить, скажем, ту же розетку через site:, то гугл отдаст не больше 300-400 страниц из своего индекса
источник

JA

JustAndrew Andrew in Техническое SEO
Tom
я говорил о том что если парсить, скажем, ту же розетку через site:, то гугл отдаст не больше 300-400 страниц из своего индекса
Да site не работает же..
источник

Alexandro Духовный in Техническое SEO
Серж Ян
тоже не замечал, вся пагинация в индексе
Ну так сама страница пагинации в индексе и будет а старцы с станицы пагинации в индексе будут слабо
источник

MG

Maxim Gambini in Техническое SEO
Aleksandr Nikitin
нужно понять какие страницы в индексе уже и исключить мусорные, усложняется тем что сайт большой + старый сайт имел неизвестную мне структуру (т.е. например имел разделы, которых нет на новом) ...при переезде на новый редиректы не настроили.
Логи проглядеть, собрать оттуда фуллист урлов, куда робот ходит

Этот лист загрузить в нетпик, подгрузить нужную инфу из серчконсоли и вычленить мусор

Ну в теории)) или не подойдёт?
источник

AN

Aleksandr Nikitin in Техническое SEO
думал в эту сторону
источник

SS

Slava Soft in Техническое SEO
Логи нужно собирать раз в день
источник

SS

Slava Soft in Техническое SEO
ротация логов - макс 10 дней
источник