Телеграмм чат группы usePerlOrDie страница 1694

То есть для счастья не хватало промежуточного списка в map всего лишь.

12:05пожаловаться #1

Если тебе хочется написать это "perlish", то тоже можно, но это не производительно, лучше так не делать

А как производительнее? Хочется однострочник для парсинга логов и вывода только интересующих полей.

12:08пожаловаться #2

Ivan Bessarabov in use Perl or die;

А как производительнее? Хочется однострочник для парсинга логов и вывода только интересующих полей.

О какие объемах идет речь? Сколько терабайт логов?

12:10пожаловаться #3

Бывает 5–10 гигов.

12:11пожаловаться #4

Ivan Bessarabov in use Perl or die;

Бывает 5–10 гигов.

можно подумать парсить это не перлом, а консольным кликхаусом. можно в одну команду и залить данные во временный clickhouse и сделат из него выборку

12:11пожаловаться #5

Ivan Bessarabov

Думаешь, это будет быстрее?

12:13пожаловаться #6

Это нужно для дальнейшего пайпа куда-нибудь. И хочется переносимости. То есть вбил однострочник на любом хосте и готово.

12:13пожаловаться #7

По-моему, перл быстрее будет

12:13пожаловаться #8

Ivan Bessarabov in use Perl or die;

Думаешь, это будет быстрее?

у меня было значинтельно быстре кликхаусом

12:14пожаловаться #9

echo -e "a=b\tc=d\te\tg=\ti=j" | perl -lne '%F = map { ($k, $v) = split(/=/, $_, 2); } split(/\t/); print join("\t", @F{qw(a c e g i)});'

Думаю, в таком контексте будет быстрее -0 и /(\S+)((?:=\S+)?)/gsm

12:15пожаловаться #10

По-моему, перл быстрее будет

Сравнивал варианты, в том числе с Python, и он оказался быстрее…

#!/usr/bin/env python3

import fileinput

f = ['a', 'c', 'e', 'g', 'i']
for s in fileinput.input():
    F = dict(tuple([x.split('=', 1) for x in s.strip().split('\t')]))
    print('\t'.join([F[x] for x in f]))

12:16пожаловаться #11

Ivan Bessarabov

у меня было значинтельно быстре кликхаусом

Всё зависит от задачи. Тебе, вероятно, нужны были выборки

12:16пожаловаться #12

Сравнивал варианты, в том числе с Python, и он оказался быстрее…

#!/usr/bin/env python3

import fileinput

f = ['a', 'c', 'e', 'g', 'i']
for s in fileinput.input():
    F = dict(tuple([x.split('=', 1) for x in s.strip().split('\t')]))
    print('\t'.join([F[x] for x in f]))

Но такое не потаскаешь.

12:16пожаловаться #13

Сравнивал варианты, в том числе с Python, и он оказался быстрее…

#!/usr/bin/env python3

import fileinput

f = ['a', 'c', 'e', 'g', 'i']
for s in fileinput.input():
    F = dict(tuple([x.split('=', 1) for x in s.strip().split('\t')]))
    print('\t'.join([F[x] for x in f]))

На каком объеме данных ты их сравнивал?

12:17пожаловаться #14

На каком объеме данных ты их сравнивал?

На примерно 5 гигах Perl 47 c, Python 38 с.

12:18пожаловаться #15

Вот и не могу понять, откуда такая разница, где тормозит.