Size: a a a

2019 October 04

AZ

Anton Zadorozhniy in Data Engineers
если одноразово - перл, он умеет многосимвольные сепараторы для всего :)
источник

AZ

Anton Zadorozhniy in Data Engineers
echo 'some#@#@#strange#@#@#separators' | perl -lne 'BEGIN{$/="#@#@#"} print "$. $_"'
источник

АЖ

Андрей Жуков in Data Engineers
Anton Zadorozhniy
echo 'some#@#@#strange#@#@#separators' | perl -lne 'BEGIN{$/="#@#@#"} print "$. $_"'
источник

‌‎ in Data Engineers
Anton Zadorozhniy
echo 'some#@#@#strange#@#@#separators' | perl -lne 'BEGIN{$/="#@#@#"} print "$. $_"'
источник

AZ

Anton Zadorozhniy in Data Engineers
да не благодарите
источник

VP

Vitaly Petrov in Data Engineers
Можете объяснить заклинание?
источник

AZ

Anton Zadorozhniy in Data Engineers
Vitaly Petrov
Можете объяснить заклинание?
блок BEGIN исполняется вначала ванлайнера, и я там переопределяю переменную которая отвечает за разделитель строк, а дальше печатаю $. - это номер строки, и $_ - это вся строка
источник

AZ

Anton Zadorozhniy in Data Engineers
-F отвечает за разделитель колонок, ну в общем гуглите и все найдете
источник

VP

Vitaly Petrov in Data Engineers
Спасибо!
источник

AZ

Anton Zadorozhniy in Data Engineers
(видимо знание перла уже приравнивается к знанию кобола)
источник

UD

Uncel Duk in Data Engineers
Anton Zadorozhniy
(видимо знание перла уже приравнивается к знанию кобола)
Да и к прочему колдовству
источник

AZ

Anton Zadorozhniy in Data Engineers
Vitaly Petrov
Спасибо!
вот вам полный пример, я сегодня добрый:
источник

AZ

Anton Zadorozhniy in Data Engineers
echo '1~some#@#@#2~strange#@#@#3~separators' | perl -F'~' -lane 'BEGIN{$/="#@#@#"} print join ",", @F'
источник

AZ

Anton Zadorozhniy in Data Engineers
как видно - ничего сложного
источник

R

Roman in Data Engineers
Anton Zadorozhniy
(видимо знание перла уже приравнивается к знанию кобола)
К этому стремится. Но знаю о проекте, где была легаси аналитика на perl, написанная ещё в мохнатые годы. И чуваки это переносили на map reduce в hadoop. Вы наверное подумаете и что в этом такого.
Но вот только переносилось это теми же perl скриптами через hadoop streaming.
источник

AZ

Anton Zadorozhniy in Data Engineers
Roman
К этому стремится. Но знаю о проекте, где была легаси аналитика на perl, написанная ещё в мохнатые годы. И чуваки это переносили на map reduce в hadoop. Вы наверное подумаете и что в этом такого.
Но вот только переносилось это теми же perl скриптами через hadoop streaming.
я что-то про такое слышал 🙄
источник

VP

Vitaly Petrov in Data Engineers
Anton Zadorozhniy
как видно - ничего сложного
Спасибо большое, все заработало!
источник

AZ

Anton Zadorozhniy in Data Engineers
Vitaly Petrov
Спасибо большое, все заработало!
ну вот, а вы pyspark хотели 🙂
источник

A

Alex in Data Engineers
Roman
К этому стремится. Но знаю о проекте, где была легаси аналитика на perl, написанная ещё в мохнатые годы. И чуваки это переносили на map reduce в hadoop. Вы наверное подумаете и что в этом такого.
Но вот только переносилось это теми же perl скриптами через hadoop streaming.
ну и? =)

логи с вебсервера + ragel + hive (select TRANSFORM ... using 'ragel_binari -params')

и всё работало отлично =) быстрее чем парсить логи в java коде

http://www.colm.net/open-source/ragel/
источник

A

Alex in Data Engineers
внутри он тот же хадуп стриминг и использовал
источник