Size: a a a

Natural Language Processing

2019 November 30

RV

Rinat Valiullov in Natural Language Processing
Brenoritvrezorkre
Просто контекст не ясен, нужно уточнить. Речь про сходство между словами, но при этом говорят про строки.
сейчас
источник

RV

Rinat Valiullov in Natural Language Processing
Brenoritvrezorkre
Просто контекст не ясен, нужно уточнить. Речь про сходство между словами, но при этом говорят про строки.
Natural provides an implementation of four algorithms for calculating string distance, Hamming distance, Jaro-Winkler, Levenshtein distance, and Dice coefficient. Using these algorithms, we can tell if two strings match or not. For the sake of this project we will be using Hamming distance.
источник

DK

Denis Kirjanov in Natural Language Processing
Ну, никто не запрещает мерять Левенштейном расстояния между словами, в принципе
источник

B

Brenoritvrezorkre in Natural Language Processing
Ну вот и названия
источник

RV

Rinat Valiullov in Natural Language Processing
Brenoritvrezorkre
Ну вот и названия
Так я и спросил, корректно ли перевести string distance как расстояние между строками

На слух как-то не очень
источник

A

Aragaer in Natural Language Processing
это с непривычки
источник

RV

Rinat Valiullov in Natural Language Processing
Ок, спасибо.

Я ещё только вхожу в эту область, и многое пока непривычно и сложно для меня
источник

A

Aragaer in Natural Language Processing
ну для меня просто это все привычно еще с института, когда изучали корректирующие коды хэмминга, там же так или иначе дается понятие расстояния между последовательностями
источник

RV

Rinat Valiullov in Natural Language Processing
Вот ещё такой вопрос.
А на русском хороших материалов именно по NLP нет?
источник

RV

Rinat Valiullov in Natural Language Processing
Тяжело на английском воспринимать некоторые абстрактные моменты
источник

Miss Очепятка in Natural Language Processing
Какие моменты?
источник

m

mel kaye in Natural Language Processing
<несмешная шутка/>
ассиметрия и эксцесс
</несмешная шутка>
источник

Miss Очепятка in Natural Language Processing
Просто в NLP судя по всему мало теории.
источник

m

mel kaye in Natural Language Processing
где угодно мало теории если не копаться
источник

m

mel kaye in Natural Language Processing
даже у таких простых штук как lsa/lsm под капотом нетривиальные алгоритмы, даже у самых простейших текстов за кулисами сложная машинерия
источник

Miss Очепятка in Natural Language Processing
lsa - отбор часто встречающихся сочетаний. Для анализа текстов.
источник

m

mel kaye in Natural Language Processing
афаик немного другое но не суть
источник

Miss Очепятка in Natural Language Processing
А что ещё кроме lsa/lsm есть?
источник

m

mel kaye in Natural Language Processing
смотря для чего
у лса есть полно модификаций, есть w2v
источник

T

Timur in Natural Language Processing
Rinat Valiullov
Вот ещё такой вопрос.
А на русском хороших материалов именно по NLP нет?
курс на степике от самсунга (https://stepik.org/course/54098/promo)
курс от вышки (https://github.com/yandexdataschool/nlp_course)
первое, что пришло в голову
источник