Телеграмм чат группы tech

Ivan kutasok Kutas

Можете дать ссылку на сообщение Demi? Чтобы я был в контексте.

Гугл может показывать по site:10k в индексе но дальше 20 или 30 страницы больше ничего не покажет

Max Gordienko in Техническое SEO

18:37пожаловаться #1

MG

коллеги, как выгрузить все страницы из индекса Google? Подскажите решение...в GSC лимит на 1000 страниц

создать карты сайта с 1000 URL в каждой карте. Загрузить в серч-консоль. Получить данные по покрытию / индексу. Скачать. Все :)

18:46пожаловаться #2

AД

Tom

Гугл может показывать по site:10k в индексе но дальше 20 или 30 страницы больше ничего не покажет

Google дальше 1 страницы пагинации ничего не показывает

18:49пожаловаться #3

AД

Но индексирует норм даже если 10 или 49999 страниц в сайтмапе

18:49пожаловаться #4

AN

Max Gordienko

создать карты сайта с 1000 URL в каждой карте. Загрузить в серч-консоль. Получить данные по покрытию / индексу. Скачать. Все :)

тут проблема в том что сейчас сайт новый с полностью новой структурой, нужно понимание какие старые адреса остались в индексе. отчет "Страница проиндексирована, но ее нет в файле Sitemap" выдает больше чем 1000 страниц...вот и вопрос как их оттуда забрать :)

18:50пожаловаться #5

AN

понял что только перебором, так как в API нет методов для выгрузки этих данных

Серж Ян in Техническое SEO

18:52пожаловаться #6

СЯ

тут проблема в том что сейчас сайт новый с полностью новой структурой, нужно понимание какие старые адреса остались в индексе. отчет "Страница проиндексирована, но ее нет в файле Sitemap" выдает больше чем 1000 страниц...вот и вопрос как их оттуда забрать :)

это не факт, что ее нет в сайтмапе

Max Gordienko in Техническое SEO

18:53пожаловаться #7

MG

Joxi – an easy-to-use and convenient screenshoter enabling you to exchange screenshots and files on a network

тут проблема в том что сейчас сайт новый с полностью новой структурой, нужно понимание какие старые адреса остались в индексе. отчет "Страница проиндексирована, но ее нет в файле Sitemap" выдает больше чем 1000 страниц...вот и вопрос как их оттуда забрать :)

если есть какая-то закономерность в старых URL то можно попробовать фильтровать вот так (но не факт что поможет) http://joxi.ru/GrqKxqlIkby8q2

1583941988158.png (14 kb) uploaded March 11, 2020 Joxi

made using Joxi.net

18:53пожаловаться #8

AN

так вот и проблема что все закономерности я не знаю :) так пока и пробую :)

18:53пожаловаться #9

T

Google дальше 1 страницы пагинации ничего не показывает

Почему это? У меня показывает

18:54пожаловаться #10

AД

Tom

Почему это? У меня показывает

Сколько не тестировали и кто толькотее тестировал, Гугл не индексирует нормально страницы с второй пагинации и поэтому нужно делить на микро категории

Серж Ян in Техническое SEO

19:10пожаловаться #11

СЯ

Сколько не тестировали и кто толькотее тестировал, Гугл не индексирует нормально страницы с второй пагинации и поэтому нужно делить на микро категории

тоже не замечал, вся пагинация в индексе

19:13пожаловаться #12

T

Сколько не тестировали и кто толькотее тестировал, Гугл не индексирует нормально страницы с второй пагинации и поэтому нужно делить на микро категории

Мы наверное не так поняли друг друга

19:15пожаловаться #13

T

Сколько не тестировали и кто толькотее тестировал, Гугл не индексирует нормально страницы с второй пагинации и поэтому нужно делить на микро категории

я говорил о том что если парсить, скажем, ту же розетку через site:, то гугл отдаст не больше 300-400 страниц из своего индекса

19:17пожаловаться #14

JA

JustAndrew Andrew in Техническое SEO

Tom

я говорил о том что если парсить, скажем, ту же розетку через site:, то гугл отдаст не больше 300-400 страниц из своего индекса

Да site не работает же..

19:17пожаловаться #15

AД

Серж Ян

тоже не замечал, вся пагинация в индексе

Ну так сама страница пагинации в индексе и будет а старцы с станицы пагинации в индексе будут слабо

Maxim Gambini in Техническое SEO

19:22пожаловаться #16

MG

нужно понять какие страницы в индексе уже и исключить мусорные, усложняется тем что сайт большой + старый сайт имел неизвестную мне структуру (т.е. например имел разделы, которых нет на новом) ...при переезде на новый редиректы не настроили.

Логи проглядеть, собрать оттуда фуллист урлов, куда робот ходит

Этот лист загрузить в нетпик, подгрузить нужную инфу из серчконсоли и вычленить мусор

Ну в теории)) или не подойдёт?

19:46пожаловаться #17

AN

думал в эту сторону

Slava Soft in Техническое SEO

19:47пожаловаться #18

SS

Логи нужно собирать раз в день

Slava Soft in Техническое SEO

19:47пожаловаться #19

SS

ротация логов - макс 10 дней