Size: a a a

Node.js — русскоговорящее сообщество

2020 February 24

A

Arrt in Node.js — русскоговорящее сообщество
Exi(s)t
С одного устройства такие объемы не скрапят обычно тем более рабочего/домашнего. По-хорошему арендовать мощности бы.
если нереально такое, то как мне задали такой задание)?
источник

E

Exi(s)t in Node.js — русскоговорящее сообщество
Единоразовая затея или регулярно это нужно делать?
источник

GS

Grigorii K. Shartsev in Node.js — русскоговорящее сообщество
Arrt
да вот такая задача, веб-скраппинг
Если хотя бы один из этих сайтов - SPA без SSR, то ещё и не решить её просто получив html.
источник

倫岡

倫太郎 岡部 in Node.js — русскоговорящее сообщество
Grigorii K. Shartsev
Если хотя бы один из этих сайтов - SPA без SSR, то ещё и не решить её просто получив html.
js творит страшные вещи
источник

GS

Grigorii K. Shartsev in Node.js — русскоговорящее сообщество
倫太郎 岡部
js творит страшные вещи
Откроем миллион сайто в пуппетире!
источник

倫岡

倫太郎 岡部 in Node.js — русскоговорящее сообщество
Grigorii K. Shartsev
Откроем миллион сайто в пуппетире!
ПИТЕР, ОНИ ЖЕ ЕЩЁ ДЕТИ ©
источник

АП

Алексей Попов in Node.js — русскоговорящее сообщество
Arrt
если нереально такое, то как мне задали такой задание)?
Так может тебя таким образом вежливо послали?
источник

A

Arrt in Node.js — русскоговорящее сообщество
короче ребят, есть подсказка , как получить такое количество данных?
источник

СВ

Сергей Видинеев in Node.js — русскоговорящее сообщество
Pavel Shakhov (pongo)
Посмотрите mikro orm
смотрел, но не видно там готовой реализации деревьев (. Но не может такого быть, чтобы для каждого проекта с нуля писалась реализация.
источник

GS

Grigorii K. Shartsev in Node.js — русскоговорящее сообщество
Arrt
короче ребят, есть подсказка , как получить такое количество данных?
Точно также, как и маленькое количество, просто запуская процесс параллельно.

А тут подходов куча.
Надо по простому глупому и один раз?
Просто раздели данные на N частей и запусти на N машин.

Можно на какой-нибудь comedy глянуть, чтобы просто запускать узлы для вычислений и собирать результат.
Можно.. Да кучу всего можно...
источник

М

Ману in Node.js — русскоговорящее сообщество
Arrt
Всем привет , у меня есть файл в нем где-то находится список сайтов , где-то миллион , я должен проверить каждый сайт на наличие даты. Как получить такое большое количество данных да еще и чтоб проверить каждый сайт, может есть подсказки?
Интересная задача. Может просто чекать на наличие паттернов весь хтмл? Ну там на паттерн даты
источник

L

LoganFrench in Node.js — русскоговорящее сообщество
какую либу лучше всего юзать для парса html xpath'ем?
источник

A

Arrt in Node.js — русскоговорящее сообщество
Ману
Интересная задача. Может просто чекать на наличие паттернов весь хтмл? Ну там на паттерн даты
вообще-то насчет проверки , делаю так, получаю innerhtml и по регуляркам проверяю
источник

М

Ману in Node.js — русскоговорящее сообщество
Ага
источник

A

Arrt in Node.js — русскоговорящее сообщество
Ману
Ага
проблема насчет получения такого большого объема, пока не совсем понимаю как реализовать
источник

М

Ману in Node.js — русскоговорящее сообщество
По массиву что ли не можешь пройтись
источник

М

Ману in Node.js — русскоговорящее сообщество
Бери файл, список сайтов запарси в массив и пройдись пл массиву
источник

М

Ману in Node.js — русскоговорящее сообщество
Для парсинга большинства форматов есть готовые библиотеки
источник

JG

John Gotti in Node.js — русскоговорящее сообщество
День добрый всем, подскажите пожалуйста, есть rate limiter основанный на fingerprint'е, а не на ip?
источник

SS

S S in Node.js — русскоговорящее сообщество
Что используют как стор при работе с сокетами? Redis? У меня сейчас effector, это что то из ряда redux , mobx.
источник