Телеграмм чат группы scrapy

2019 September 14

i

ildar in Scrapy

не, ну внутренний 3-циферный артикул там какой-то есть

источник

22:04пожаловаться #1

I

Ivan in Scrapy

чувствую я прийдется руками массивы с ссылка делать

источник

22:05пожаловаться #2

2019 September 16

A

Ad in Scrapy

всем привет, подскажите плиз, я новичок, так что сильно не ругайте если не правильно объясню свою проблему, в общем мне надо выдернуть этот id(что на скрине), выдергиваю таким способом:
def game_id(html):
soup = BeautifulSoup(html, 'lxml')
name_id = soup.find('ul', class_='betsResizeEvs greenBack')
divs = name_id.find('div').get('id')
ответ присылает
None
я так понимаю мне надо провалится в этот <div>. но так как он без класса. он присылает такой ответ
использую библиотеку bs4
буду благодарен за любую помощь

источник

08:46пожаловаться #3

s

serhii in Scrapy

Ad

всем привет, подскажите плиз, я новичок, так что сильно не ругайте если не правильно объясню свою проблему, в общем мне надо выдернуть этот id(что на скрине), выдергиваю таким способом:
def game_id(html):
soup = BeautifulSoup(html, 'lxml')
name_id = soup.find('ul', class_='betsResizeEvs greenBack')
divs = name_id.find('div').get('id')
ответ присылает
None
я так понимаю мне надо провалится в этот <div>. но так как он без класса. он присылает такой ответ
использую библиотеку bs4
буду благодарен за любую помощь

а если сразу по классу c_events искать?

источник

09:14пожаловаться #4

s

serhii in Scrapy

Ad

всем привет, подскажите плиз, я новичок, так что сильно не ругайте если не правильно объясню свою проблему, в общем мне надо выдернуть этот id(что на скрине), выдергиваю таким способом:
def game_id(html):
soup = BeautifulSoup(html, 'lxml')
name_id = soup.find('ul', class_='betsResizeEvs greenBack')
divs = name_id.find('div').get('id')
ответ присылает
None
я так понимаю мне надо провалится в этот <div>. но так как он без класса. он присылает такой ответ
использую библиотеку bs4
буду благодарен за любую помощь

и что в name_id лежит?

источник

09:15пожаловаться #5

A

Ad in Scrapy

тоже самое

источник

09:15пожаловаться #6

A

Ad in Scrapy

None

источник

09:15пожаловаться #7

АН

Алексей Нагорский in Scrapy

Ad

всем привет, подскажите плиз, я новичок, так что сильно не ругайте если не правильно объясню свою проблему, в общем мне надо выдернуть этот id(что на скрине), выдергиваю таким способом:
def game_id(html):
soup = BeautifulSoup(html, 'lxml')
name_id = soup.find('ul', class_='betsResizeEvs greenBack')
divs = name_id.find('div').get('id')
ответ присылает
None
я так понимаю мне надо провалится в этот <div>. но так как он без класса. он присылает такой ответ
использую библиотеку bs4
буду благодарен за любую помощь

А разве не надо какой-то .find('div')[1] делать?

источник

09:25пожаловаться #8

I

Ivan in Scrapy

Ad

всем привет, подскажите плиз, я новичок, так что сильно не ругайте если не правильно объясню свою проблему, в общем мне надо выдернуть этот id(что на скрине), выдергиваю таким способом:
def game_id(html):
soup = BeautifulSoup(html, 'lxml')
name_id = soup.find('ul', class_='betsResizeEvs greenBack')
divs = name_id.find('div').get('id')
ответ присылает
None
я так понимаю мне надо провалится в этот <div>. но так как он без класса. он присылает такой ответ
использую библиотеку bs4
буду благодарен за любую помощь

открой код всей страницы. и посмотри существует ли твой ul. возможно генерируется jsом

источник

10:42пожаловаться #9

i

ildar in Scrapy

Ad

всем привет, подскажите плиз, я новичок, так что сильно не ругайте если не правильно объясню свою проблему, в общем мне надо выдернуть этот id(что на скрине), выдергиваю таким способом:
def game_id(html):
soup = BeautifulSoup(html, 'lxml')
name_id = soup.find('ul', class_='betsResizeEvs greenBack')
divs = name_id.find('div').get('id')
ответ присылает
None
я так понимаю мне надо провалится в этот <div>. но так как он без класса. он присылает такой ответ
использую библиотеку bs4
буду благодарен за любую помощь

создай html-страничку с этим куском и на нем протестируй. и сюда ее выставь заодно. Еще в браузере действительно js отключи и посмотри - будет ли этот id там. Чет я посмотрел на все это и понял что подзабыл весь bs уже, лол. Хочется чего-то такого:
from parsel import Selector
sel = Selector(html)
id = sel.css('betsResizeEvs.greenBack .c-events.main_game::attr(id)').get()

источник

14:49пожаловаться #10

A

Ad in Scrapy

окей, уже пробую)

источник

14:51пожаловаться #11

МС

Михаил Синегубов in Scrapy

человеки, https://luminati.io использовал кто? я чет туплю и не могу заюзать.
теоретически, халявные $5 положли на счет, а дальше - чет совсем никак 😂

источник

22:19пожаловаться #12

МС

Михаил Синегубов in Scrapy

ахренеть, надо было давно написать сюда, тока сейчас в проксименеджер пустило 😂

источник

22:23пожаловаться #13

EB

Elisei Badanin in Scrapy

эффект присутствия)

источник

22:24пожаловаться #14

К

Кирилл in Scrapy

Михаил Синегубов

ахренеть, надо было давно написать сюда, тока сейчас в проксименеджер пустило 😂

поделишься потом впечатлениями

источник

22:24пожаловаться #15

МС

Михаил Синегубов in Scrapy

ага, тока меня пока на рокавто не пущаееет 😢😭

источник

22:25пожаловаться #16

МС

Михаил Синегубов in Scrapy

точнее пока - никуда не пускает :)

источник

22:25пожаловаться #17

B

Bulatbulat48 in Scrapy

ildar

для всякой сегментации и токенизации эта штука самая мощная, выше питоновую обвязку линканул
https://yandex.ru/dev/mystem/
посмотри там на примеры лемматизации - по-крайней мере всякие суффиксы-шмуффиксы ободрать легче станет. и потом уже сравнивать в духе сравнения set's или еще какой текстовой хешизации на-коленке

yandex.ru

MyStem - Технологии Яндекса

Программа MyStem производит морфологический анализ текста на русском языке.

О. Я на ней чет даже писал.

источник

22:27пожаловаться #18

iz

izzz zzi in Scrapy

Михаил Синегубов

человеки, https://luminati.io использовал кто? я чет туплю и не могу заюзать.
теоретически, халявные $5 положли на счет, а дальше - чет совсем никак 😂

смотря что парсить , там тебе этих 5$ на немного трафа хватит)

источник

22:34пожаловаться #19

МС

Михаил Синегубов in Scrapy

блин, мне надо найти ахрнеительно большой пул прокси, за небольшие деньги 😂

источник

22:35пожаловаться #20