Телеграмм чат группы proelixir страница 5303

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

pro.elixir

1014 membersпожаловаться на группу

2019 February 22

МБ

Максим Барулин in pro.elixir

Коллеги, а сталкивался кто-нибудь с задачей поиска смайликов в тексте? Придумал такую регулярку Regex.scan(~r/\pC+|\pM+/, "👽❗️✅👽") Но результат несколько неожиданный... Смайлик ❗️ занимает три байта, но почему-то вылезает в отдельный элемент массива, т.е находится как бы 5 элементов вместо 4

Regex.scan(~r/\pC+|\pM+/, "👽❗️✅👽")
[[<<159, 145>>], [<<157, 151>>], [<<143>>], [<<156, 133>>], [<<159, 145>>]]

источник

14:23пожаловаться

IB

Ilya Borovitinov in pro.elixir

Максим Барулин

Коллеги, а сталкивался кто-нибудь с задачей поиска смайликов в тексте? Придумал такую регулярку Regex.scan(~r/\pC+|\pM+/, "👽❗️✅👽") Но результат несколько неожиданный... Смайлик ❗️ занимает три байта, но почему-то вылезает в отдельный элемент массива, т.е находится как бы 5 элементов вместо 4

Regex.scan(~r/\pC+|\pM+/, "👽❗️✅👽")
[[<<159, 145>>], [<<157, 151>>], [<<143>>], [<<156, 133>>], [<<159, 145>>]]

Судя по гуглу, регексы в любых языках не очень хорошо справляются с такой проблемой
https://github.com/mathiasbynens/emoji-regex
Вот какое-то предложение на тему, использующее классы символов в юникоде, но там тоже есть проьлемы

mathiasbynens/emoji-regex

A regular expression to match all Emoji-only symbols as per the Unicode Standard. - mathiasbynens/emoji-regex

источник

14:30пожаловаться

IB

Ilya Borovitinov in pro.elixir

Максим Барулин

Коллеги, а сталкивался кто-нибудь с задачей поиска смайликов в тексте? Придумал такую регулярку Regex.scan(~r/\pC+|\pM+/, "👽❗️✅👽") Но результат несколько неожиданный... Смайлик ❗️ занимает три байта, но почему-то вылезает в отдельный элемент массива, т.е находится как бы 5 элементов вместо 4

Regex.scan(~r/\pC+|\pM+/, "👽❗️✅👽")
[[<<159, 145>>], [<<157, 151>>], [<<143>>], [<<156, 133>>], [<<159, 145>>]]

Я бы сказал, что возможно можно использовать https://hexdocs.pm/elixir/String.html#graphemes/1 и проверять каждый на вхождение в MapSet, заполненный всеми эмодзи

источник

14:31пожаловаться

МБ

Максим Барулин in pro.elixir

это слишком накладно

источник

14:32пожаловаться

IB

Ilya Borovitinov in pro.elixir

Максим Барулин

это слишком накладно

Ну, либо точность, либо регексы

источник

14:33пожаловаться

IB

Ilya Borovitinov in pro.elixir

Слишком много edge cases в случае регексов получается

источник

14:34пожаловаться

МБ

Максим Барулин in pro.elixir

блин, простая задача, посчитать количество вхождений, а решения простого опять нет...

источник

14:35пожаловаться

IB

Ilya Borovitinov in pro.elixir

Максим Барулин

блин, простая задача, посчитать количество вхождений, а решения простого опять нет...

А есть информация о языке?

источник

14:39пожаловаться

МБ

Максим Барулин in pro.elixir

о каком?

источник

14:39пожаловаться

IB

Ilya Borovitinov in pro.elixir

Максим Барулин

о каком?

Где искать эмодзи. Мб можно от обратного, посчитать регексом все, кроме них?

источник

14:41пожаловаться

МБ

Максим Барулин in pro.elixir

язык любой может быть

источник

14:41пожаловаться

МБ

Максим Барулин in pro.elixir

Regex.scan(~r/\pC+|\pM+/, "🇷🇺")
[[<<159, 135>>], [<<159, 135>>]]
Regex.scan(~r/\w/, "🇷🇺")
[[<<240>>], [<<240>>], [<<186>>]]
Regex.scan(~r/\W/, "🇷🇺")
[[<<159>>], [<<135>>], [<<183>>], [<<159>>], [<<135>>]]
Regex.scan(~r/\W/u, "🇷🇺")
[["🇷"], ["🇺"]]

источник

14:42пожаловаться

МБ

Максим Барулин in pro.elixir

Х_Х

источник

14:42пожаловаться

IB

Ilya Borovitinov in pro.elixir

Вово

источник

14:43пожаловаться

IB

Ilya Borovitinov in pro.elixir

https://stackoverflow.com/questions/43146528/how-to-extract-all-the-emojis-from-text/43147265
Даже на питоне предлагают вхождение каждого символа проверять

How to extract all the emojis from text?

Consider the following list:

a_list = ['🤔 🙈 me así, bla es se 😌 ds 💕👭👙']
How can I extract in a new list all the emojis inside a_list?:

new_lis = ['🤔 🙈 😌 💕 👭 👙']
I tried to use rege...

источник

14:43пожаловаться

AF

Alexander Fyodorov in pro.elixir

Максим Барулин

Х_Х

iex(11)> Regex.scan(~r/\X/u, "🇷🇺") 
[["🇷🇺"]]

источник

15:32пожаловаться

AF

Alexander Fyodorov in pro.elixir

в руби также можно

источник

15:32пожаловаться

МБ

Максим Барулин in pro.elixir

Regex.scan(~r/\X/u, "dsfdf🇷🇺") 
[["d"], ["s"], ["f"], ["d"], ["f"], ["🇷🇺"]]

источник

15:33пожаловаться

AF

Alexander Fyodorov in pro.elixir

ура? =)

источник

15:34пожаловаться

МБ

Максим Барулин in pro.elixir

нет, надо найти только смайлик

источник

15:36пожаловаться