Size: a a a

Natural Language Processing

2021 May 22

AM

Alex Mak in Natural Language Processing
Есть спец расширение для файрфокса для опхода paywall’ов, в том числе и на медиуме
источник

AM

Alex Mak in Natural Language Processing
Bypass paywalls называется
источник

A

Alaa in Natural Language Processing
Я считаю эту группу очень полезной, и мне очень нужна помощь, поэтому я пытаюсь использовать программы перевода, чтобы помочь мне.  Надеюсь что я не ошибся 🙏🏻
источник

AM

Alex Mak in Natural Language Processing
Ok, Alaa, I still don't know what's your native language, but hope that english is easier for you than russian.

You've already had a couple of good advices from group members on where to start. To sum them up: find a good introductory course or a book (or both). I personally started from datacamp courses a couple of years ago. Coursera I suppose can be a good place to start as well.

But then if NLP is not your job, you need some practical challenges to keep you going. So either found them in your job (like me in insurance) or look for some competitions on kaggle or maybe even simple freelance jobs.
Practical challenges will force you to dig information from web, stackoverflow, medium, github and thus advance you in this field.

Also I suggest to join or subscrive to some NLP related groups or chats or reddits to read other's questions and answers to them. It also will keep you updated on recent developments in the field.

And then. Well, I don't know your situation, but probably after all above you'll figure out whete to go by yourself (if you decide to stay in NLP ;) ).

Good luck!
источник

K

Ksenia in Natural Language Processing
Удачи вам в ваших начинаниях!
источник

И

Илья in Natural Language Processing
Привет. У меня генетический алгоритм настраивает веса многослойного перцептрона (4 слоя: 96-X-Y-2). X и Y - скрытые слои. Цель: получить бинарный классификатор текста. Начальную популяцию генерирую случайными весами [-0.1;0.1]. ф. активации - tanh/sigmoid. На вход перцептрону идёт вектор[96], полученный из spacy (векторизирую токены, а затем беру среднее арифметическое). X и Y я беру в интервале [64-512]. Оценка f1 выше 0.79 не поднимается. На какие параметры мне стоит обратить внимание в первую очередь, или может у меня проблема с размером перцептрона?
источник

A

Alaa in Natural Language Processing
I really appreciate your time and effort, Thank you Alex for your help..
So I'm not English native speaker but I can understand English as well, and I'm working now with team in NLP field to do some projects with small companies and I like work in NLP too.

I just didn't want to speak in another language because I think you all like to speak in Russian, but I think I did some mistakes, sorry to you all 😂.
источник

A

Alaa in Natural Language Processing
Спасибо Ksenia, выучу русский язык за хороший разговор :)
источник

AM

Alex Mak in Natural Language Processing
No mistakes in fact, just odd choice of words or their placement in sentence - that’s what gave you out. 😉
источник

OP

Olena Pastushok in Natural Language Processing
Всем привет! Возможно у кто-то стикался с ошибкой при запуске deeppavlov, может кто может подсказать как ето исправить: Interpreting 'ner_ontonotes_bert_mult' as '/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/deeppavlov/configs/ner/ner_ontonotes_bert_mult.json'
[nltk_data] Downloading package punkt to
[nltk_data]     /Users/olenapastushok/nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package stopwords to
[nltk_data]     /Users/olenapastushok/nltk_data...
[nltk_data]   Package stopwords is already up-to-date!
[nltk_data] Downloading package perluniprops to
[nltk_data]     /Users/olenapastushok/nltk_data...
[nltk_data]   Package perluniprops is already up-to-date!
[nltk_data] Downloading package nonbreaking_prefixes to
[nltk_data]     /Users/olenapastushok/nltk_data...
[nltk_data]   Package nonbreaking_prefixes is already up-to-date!
[1]    7219 illegal hardware instruction  python3 -m deeppavlov riseapi ner_ontonotes_bert_mult -p 5005
источник

A

Andrey in Natural Language Processing
скорее всего не тянет машина tensorflow. проверьте что он работает
источник

FF

Futorio Franklin in Natural Language Processing
Можно ещё проверить поддерживает ли процессор avx инструкции. Если нет, то скорее всего это tf
источник

М

Михаил in Natural Language Processing
Всем привет!
Есть ли NER для выделения адресов на русском языке? Например: "Вася живёт на улице Строителей, дом 25".
Deeppavlov Multi-Lang выделяет только "улице Строителей", как "FAC". Natasha только "Строителей", как LOC.
Есть ли что-нибудь лучше? Может что-нибудь на правилах?
Я проверил, что pullenti это может, но хотел бы рассмотреть альтернативы, т.к он не бесплатный.
источник

OD

Oleg Durandin in Natural Language Processing
В Natasha очень неплохая база правил для выявления адресов + можно добавить свои правила - если не хватает какого-то кейса, то можно написать несколько правил
источник

KS

Konstantin Smith in Natural Language Processing
Pullenti
источник

OP

Olena Pastushok in Natural Language Processing
tensortflow роботает
источник

YB

Yuri Baburov in Natural Language Processing
Ребят, а когда будут интересные доклады про NLP на DataFest? Кто что порекомендует?
Сейчас в Data Fest Spatial Chat просто классная тусовка в секции #NLP in industry, представляют спикеров
источник

А

Александра in Natural Language Processing
Российский вроде май-июнь
источник

o

oldysty in Natural Language Processing
А как вообще ориентироваться в Datafest теперь? Все расписание читать?
источник

YB

Yuri Baburov in Natural Language Processing
Так, я побывал, всё выяснил.
https://datafest.ru/2021/schedule/#schedule2305
Там горизонтальный скроллинг по расписанию.

Итак, доклады, связанные с NLP, которые будут завтра:
Секция Interpretable & Causal ML https://ods.ai/tracks/interpretable-ml-df2021
13:00 — 14:00
Все способы измерить слона: заглянуть внутрь трансформерных моделей
Татьяна Шавринаэнтузиаст NLP, Главный эксперт по технологиям,
14:00 — 15:00
Explaining Hidden Representations
Кирилл БыковML PhD student @ TU Berlin ML Department, UMI Lab

Секция NLP in industry, https://ods.ai/tracks/nlp-df2021
16:00 — 17:00
Сергей Марков
Посмотри в глаза чудовищ: генеративные нейросетевые текстовые модели

17:00 — 18:00
Дмитрий Усталов
Применение толоки для задач NLP
источник