Size: a a a

Natural Language Processing

2021 April 21

AE

Anton Eryomin in Natural Language Processing
именно ))))
источник

AE

Anton Eryomin in Natural Language Processing
поэтому я и говорю что парсинги это всё от лукавого
источник

НК

Николай Карпенко... in Natural Language Processing
ну там больше про персональные данные ФИО и контакты вроде, не? Так то публичные вакансии и страницы можно спарсить
источник

НК

Николай Карпенко... in Natural Language Processing
Да, не. Щас все парсят в крупном размере
источник

MK

Max Kuznetsov in Natural Language Processing
Еще раз. HH запрещал своим клиентам парсить сайт. Клиенты подали в суд и HH проиграл.
источник

НК

Николай Карпенко... in Natural Language Processing
А я не так понял предложение.
источник

MK

Max Kuznetsov in Natural Language Processing
В общем, пилите любой поиск, берете его выдачу за эталон, показываете начальству 100% качества (как в соке добрый) - profit!
источник

o

oldysty in Natural Language Processing
Моя сокомандница за пару вечеров написала парсер HH без особых проблем. Дело было в первом семестре курсов.
источник

AE

Anton Eryomin in Natural Language Processing
Я очень рад за неё
источник

GF

Grigory Frantsuzov in Natural Language Processing
вот бы она еще исходные коды выложила на гитхаб
источник

o

oldysty in Natural Language Processing
Вообще надо бы ей сказать. Слишком много людей парсят hh.
источник

o

oldysty in Natural Language Processing
Я к тому, что тогда это было не очень сложно. Я не пытался обидеть
источник

AE

Anton Eryomin in Natural Language Processing
проблема всех парсеров одна и та же, они очень быстро банятся и вам нужно будет либо изобретать структуру с кучей динамических VPN, либо как-то хитро маскировать себя. Если бы это был бы вопрос пары вечеров, то этого отдельного бизнеса бы вообще не было.
источник

AE

Anton Eryomin in Natural Language Processing
не гвооря про то, что как только чуточку меняется верстка сайта, то нужно всё править
источник

o

oldysty in Natural Language Processing
А может дешевле вообще будет их API воспользоваться? Или вам они принципиально не дают?
источник

GF

Grigory Frantsuzov in Natural Language Processing
очень дорого
источник

GF

Grigory Frantsuzov in Natural Language Processing
ну то есть не для научных целей
источник

MK

Max Kuznetsov in Natural Language Processing
Для научных целей обычно не важна актуальность, то можно поискать протухшие данные.
источник

МС

Миркамал Самиев... in Natural Language Processing
30 декабря 2020 года принят закон¹, устанавливающий новые правила распространения (раскрытия неопределенному кругу лиц) персональных данных и обработки персональных данных из открытых источников. Изменения вступают в силу 1 марта 2021 года.
источник

VV

VVS VVS in Natural Language Processing
это было не про hh, наверное, а про Judge Berzon, “hiQ Labs, Inc. vs. LinkedIn Corporation Opinion,” United States Court of Appeals for the Ninth Circuit, September 9, 2019, http://cdn.ca9.uscourts.gov/datastore/ opinions/2019/09/09/17-16783.pdf.
источник