Size: a a a

Natural Language Processing

2019 December 27

ck

cnstntn kndrtv in Natural Language Processing
Aragaer
то есть я к нему относился именно как к генератору, который в определенных местах с разными вероятностями возьмет разные ветки строк
да вот не хочется самому что-то писать согласование. лень(
источник

SS

Sergey Sikorskiy in Natural Language Processing
cnstntn kndrtv
да вот не хочется самому что-то писать согласование. лень(
В своем примере Вы описали не только согласование, но и разные временные формы, плюс более сложные трансформации (рама мамой моется)
источник

ck

cnstntn kndrtv in Natural Language Processing
Sergey Sikorskiy
В своем примере Вы описали не только согласование, но и разные временные формы, плюс более сложные трансформации (рама мамой моется)
Да. Чем сложнее, тем лучше. Конечно не всё можно получить простым способом. Как обычно хочется всего и быстро.
источник

R

Ross in Natural Language Processing
Пражский привет коллеги, всех с наступающим! Росс из CryptoMood с вами)
Есть небольшая проблема с конвертацией данных из BSON в csv, можете выручить?
источник

ck

cnstntn kndrtv in Natural Language Processing
Ross
Пражский привет коллеги, всех с наступающим! Росс из CryptoMood с вами)
Есть небольшая проблема с конвертацией данных из BSON в csv, можете выручить?
если нет напрямую, может быть bson->json->csv? каждая пара по отдельности есть.
источник

R

Ross in Natural Language Processing
cnstntn kndrtv
если нет напрямую, может быть bson->json->csv? каждая пара по отдельности есть.
pm sent!
источник

SS

Sergey Sikorskiy in Natural Language Processing
cnstntn kndrtv
Да. Чем сложнее, тем лучше. Конечно не всё можно получить простым способом. Как обычно хочется всего и быстро.
Если сложнее, то не забывайте про вариант "Рама помыта мамой". Рама - это имя, еще поменялся вид глагола.
источник

ck

cnstntn kndrtv in Natural Language Processing
Sergey Sikorskiy
Если сложнее, то не забывайте про вариант "Рама помыта мамой". Рама - это имя, еще поменялся вид глагола.
пора бы уже забыть мне это "хочу сделать по-быстрому")
источник

SS

Sergey Sikorskiy in Natural Language Processing
Именно. Там еще можно развить тему про мыло душистое ...
источник
2019 December 28

SP

Sebastian Pereira in Natural Language Processing
Коллеги, а как вы вы текст, не используя regex  разбивали на параграфы?
источник

AS

Alex Surname in Natural Language Processing
ну если встречаешь перевод строки и за ним пробелы, табы значит параграф
источник

YB

Yuri Baburov in Natural Language Processing
Sebastian Pereira
Коллеги, а как вы вы текст, не используя regex  разбивали на параграфы?
А почему нельзя взять регэксп простой? paras = re.split('\n\s+', text) скажем
источник

SP

Sebastian Pereira in Natural Language Processing
Yuri Baburov
А почему нельзя взять регэксп простой? paras = re.split('\n\s+', text) скажем
Сейчас re.split('\s{4,}',text) - хочу посмотреть, что будет работать быстрее. Ну и вообще - regex это боль.
источник

AS

Alex Surname in Natural Language Processing
так это неправильный регексп. должен быть перевод строки
источник

A

Aragaer in Natural Language Processing
а у меня встречный вопрос. Сколько параграфов тут:
Слова слова. Слова слова слова.

Еще слова, опять слова. Много слов.
источник

SP

Sebastian Pereira in Natural Language Processing
Alex Surname
так это неправильный регексп. должен быть перевод строки
Не очень понимаю вопрос. У меня настроено под текст с моего pdf файла кривого.
источник

SP

Sebastian Pereira in Natural Language Processing
источник

V

Vlad in Natural Language Processing
Aragaer
а у меня встречный вопрос. Сколько параграфов тут:
Слова слова. Слова слова слова.

Еще слова, опять слова. Много слов.
Один, тут же нет после \r\n пробелов)
источник

AS

Alex Surname in Natural Language Processing
Sebastian Pereira
Не очень понимаю вопрос. У меня настроено под текст с моего pdf файла кривого.
\s не гарантирует наличие \n
источник

A

Aragaer in Natural Language Processing
по-моему там даже \r нету
источник