Size: a a a

2019 September 14

i

ildar in Scrapy
не, ну внутренний 3-циферный артикул там какой-то есть
источник

I

Ivan in Scrapy
чувствую я прийдется руками массивы с ссылка делать
источник
2019 September 16

A

Ad in Scrapy
всем привет, подскажите плиз, я новичок, так что сильно не ругайте если не правильно объясню свою проблему, в общем мне надо выдернуть этот id(что на скрине), выдергиваю таким способом:
def game_id(html):
   soup = BeautifulSoup(html, 'lxml')
   name_id = soup.find('ul', class_='betsResizeEvs greenBack')
   divs = name_id.find('div').get('id')
ответ присылает
None
я так понимаю мне надо провалится в этот <div>. но так как он без класса. он присылает такой ответ
использую библиотеку bs4
буду благодарен за любую помощь
источник

s

serhii in Scrapy
Ad
всем привет, подскажите плиз, я новичок, так что сильно не ругайте если не правильно объясню свою проблему, в общем мне надо выдернуть этот id(что на скрине), выдергиваю таким способом:
def game_id(html):
   soup = BeautifulSoup(html, 'lxml')
   name_id = soup.find('ul', class_='betsResizeEvs greenBack')
   divs = name_id.find('div').get('id')
ответ присылает
None
я так понимаю мне надо провалится в этот <div>. но так как он без класса. он присылает такой ответ
использую библиотеку bs4
буду благодарен за любую помощь
а если сразу по классу c_events искать?
источник

s

serhii in Scrapy
Ad
всем привет, подскажите плиз, я новичок, так что сильно не ругайте если не правильно объясню свою проблему, в общем мне надо выдернуть этот id(что на скрине), выдергиваю таким способом:
def game_id(html):
   soup = BeautifulSoup(html, 'lxml')
   name_id = soup.find('ul', class_='betsResizeEvs greenBack')
   divs = name_id.find('div').get('id')
ответ присылает
None
я так понимаю мне надо провалится в этот <div>. но так как он без класса. он присылает такой ответ
использую библиотеку bs4
буду благодарен за любую помощь
и что в name_id лежит?
источник

A

Ad in Scrapy
тоже самое
источник

A

Ad in Scrapy
None
источник

АН

Алексей Нагорский in Scrapy
Ad
всем привет, подскажите плиз, я новичок, так что сильно не ругайте если не правильно объясню свою проблему, в общем мне надо выдернуть этот id(что на скрине), выдергиваю таким способом:
def game_id(html):
   soup = BeautifulSoup(html, 'lxml')
   name_id = soup.find('ul', class_='betsResizeEvs greenBack')
   divs = name_id.find('div').get('id')
ответ присылает
None
я так понимаю мне надо провалится в этот <div>. но так как он без класса. он присылает такой ответ
использую библиотеку bs4
буду благодарен за любую помощь
А разве не надо какой-то .find('div')[1] делать?
источник

I

Ivan in Scrapy
Ad
всем привет, подскажите плиз, я новичок, так что сильно не ругайте если не правильно объясню свою проблему, в общем мне надо выдернуть этот id(что на скрине), выдергиваю таким способом:
def game_id(html):
   soup = BeautifulSoup(html, 'lxml')
   name_id = soup.find('ul', class_='betsResizeEvs greenBack')
   divs = name_id.find('div').get('id')
ответ присылает
None
я так понимаю мне надо провалится в этот <div>. но так как он без класса. он присылает такой ответ
использую библиотеку bs4
буду благодарен за любую помощь
открой код всей страницы. и посмотри существует ли твой ul. возможно генерируется jsом
источник

i

ildar in Scrapy
Ad
всем привет, подскажите плиз, я новичок, так что сильно не ругайте если не правильно объясню свою проблему, в общем мне надо выдернуть этот id(что на скрине), выдергиваю таким способом:
def game_id(html):
   soup = BeautifulSoup(html, 'lxml')
   name_id = soup.find('ul', class_='betsResizeEvs greenBack')
   divs = name_id.find('div').get('id')
ответ присылает
None
я так понимаю мне надо провалится в этот <div>. но так как он без класса. он присылает такой ответ
использую библиотеку bs4
буду благодарен за любую помощь
создай html-страничку с этим куском и на нем протестируй. и сюда ее выставь заодно. Еще в браузере действительно js отключи и посмотри - будет ли этот id там. Чет я посмотрел на все это и понял что подзабыл весь bs уже, лол. Хочется чего-то такого:
from parsel import Selector
sel = Selector(html)
id = sel.css('betsResizeEvs.greenBack .c-events.main_game::attr(id)').get()
источник

A

Ad in Scrapy
окей, уже пробую)
источник

МС

Михаил Синегубов in Scrapy
человеки, https://luminati.io использовал кто? я чет туплю и не могу заюзать.
теоретически, халявные $5 положли на счет, а дальше - чет совсем никак 😂
источник

МС

Михаил Синегубов in Scrapy
ахренеть, надо было давно написать сюда, тока сейчас в проксименеджер пустило 😂
источник

EB

Elisei Badanin in Scrapy
эффект присутствия)
источник

К

Кирилл in Scrapy
Михаил Синегубов
ахренеть, надо было давно написать сюда, тока сейчас в проксименеджер пустило 😂
поделишься потом впечатлениями
источник

МС

Михаил Синегубов in Scrapy
ага, тока меня пока на рокавто не пущаееет 😢😭
источник

МС

Михаил Синегубов in Scrapy
точнее пока - никуда не пускает :)
источник

B

Bulatbulat48 in Scrapy
ildar
для всякой сегментации и токенизации эта штука самая мощная, выше питоновую обвязку линканул
https://yandex.ru/dev/mystem/
посмотри там на примеры лемматизации - по-крайней мере всякие суффиксы-шмуффиксы ободрать легче станет. и потом уже сравнивать в духе сравнения set's или еще какой текстовой хешизации на-коленке
О. Я на ней чет даже писал.
источник

iz

izzz zzi in Scrapy
Михаил Синегубов
человеки, https://luminati.io использовал кто? я чет туплю и не могу заюзать.
теоретически, халявные $5 положли на счет, а дальше - чет совсем никак 😂
смотря что парсить , там тебе этих 5$ на немного трафа хватит)
источник

МС

Михаил Синегубов in Scrapy
блин, мне надо найти ахрнеительно большой пул прокси, за небольшие деньги 😂
источник