Size: a a a

Node.js — русскоговорящее сообщество

2020 April 08

RB

Random Balance in Node.js — русскоговорящее сообщество
Pavel Shakhov (pongo)
добавить бы еще сюда парсеры на компилируемых языках
Да я в итоге на го и переписал. Там 40 мс на страницу в среднем. Т.е. ещё +30%.
источник

PS

Pavel Shakhov (pongo) in Node.js — русскоговорящее сообщество
Random Balance
Да я в итоге на го и переписал. Там 40 мс на страницу в среднем. Т.е. ещё +30%.
а на го какой парсер используется?
источник

RB

Random Balance in Node.js — русскоговорящее сообщество
Pavel Shakhov (pongo)
а на го какой парсер используется?
Там их море. Я на github.com/antchfx/htmlquery написал, там XPath норм.
источник

E

Envy in Node.js — русскоговорящее сообщество
Random Balance
Да я в итоге на го и переписал. Там 40 мс на страницу в среднем. Т.е. ещё +30%.
Тяжело на go писать? Тяжело воспринимается его синтаксис
источник

RB

Random Balance in Node.js — русскоговорящее сообщество
Envy
Тяжело на go писать? Тяжело воспринимается его синтаксис
Я не сильно много на нём пишу. Пока только парсинг страниц, краулеры (с многопоточностью там получше в плане производительности), ну и работа с файловой системой. Сложностей особо не увидел.
источник

RB

Random Balance in Node.js — русскоговорящее сообщество
Ну по началу да, синтаксис не привычен.
источник

ꟿⅨ in Node.js — русскоговорящее сообщество
как называются переменные с именем в программировании? слово забыл, что- то на м по моему
источник

E

Envy in Node.js — русскоговорящее сообщество
Благодарю за обратную связь, синтаксис и правда после node очень диким кажется
источник

RB

Random Balance in Node.js — русскоговорящее сообщество
ꟿⅨ
как называются переменные с именем в программировании? слово забыл, что- то на м по моему
Так все переменные с именем. 👻
источник

ꟿⅨ in Node.js — русскоговорящее сообщество
Random Balance
Так все переменные с именем. 👻
Не ну те что знаешь любят в Java и С# на индефикации через . оператор
источник

K

Konstantin in Node.js — русскоговорящее сообщество
Дороу
Кто-нибудь посоветует что юзать для текстового поиска/модификации в текстовых файлах?
источник

ꟿⅨ in Node.js — русскоговорящее сообщество
тип PoseType.DOGGY_STYLE
источник

RB

Random Balance in Node.js — русскоговорящее сообщество
ꟿⅨ
Не ну те что знаешь любят в Java и С# на индефикации через . оператор
Ты про объекты и методы что ли?
источник

RB

Random Balance in Node.js — русскоговорящее сообщество
ꟿⅨ
тип PoseType.DOGGY_STYLE
Объект и свойство.
источник

ꟿⅨ in Node.js — русскоговорящее сообщество
Enum-ы, вспомнил, спасибо
источник

RB

Random Balance in Node.js — русскоговорящее сообщество
ꟿⅨ
Enum-ы, вспомнил, спасибо
Ну да, на "м". 😂
источник

I

Igor in Node.js — русскоговорящее сообщество
в жизни не догадался бы, о чём речь 😂
источник

AS

Artem Soroka in Node.js — русскоговорящее сообщество
Random Balance
Кстати, насчёт "пары мс".
example.html:

cheerio:
> 325.10 ms

node-html-parser:
> 77.96 ms

273112 страниц * 313.73 мс = 85683427 мс = 1428 минут ~ 24 часа
273112 страниц * 62.32 мс = 17020339 мс = 283 минуты ~ 5 часов
Здесь только какие то цифры с потолка, где код теста? ))
Ну и если понадобится обрабатывать такое количество страниц, явно будет больше одного процесса
источник

RB

Random Balance in Node.js — русскоговорящее сообщество
Artem Soroka
Здесь только какие то цифры с потолка, где код теста? ))
Ну и если понадобится обрабатывать такое количество страниц, явно будет больше одного процесса
Это просто извлечение ссылок на изображения с одной страницы. Там один селектор и один map. Если будем парраллелить то оба парсера, конечно же.
источник

RB

Random Balance in Node.js — русскоговорящее сообщество
Artem Soroka
Здесь только какие то цифры с потолка, где код теста? ))
Ну и если понадобится обрабатывать такое количество страниц, явно будет больше одного процесса
  const $ = cheerio.load(html);

 const imgs = $(".player_avatar img").map((i, el) => {
   return $(el).attr("src");
 }).get();

 console.log(`Found imgs: ${imgs.length}`);


Не думаю что тут можно что-то оптимизировать.
источник