Size: a a a

Natural Language Processing

2019 November 30

A

Aragaer in Natural Language Processing
расстояние хэмминга и левенштейна как-то на слуху, два других первый раз вижу
источник

RV

Rinat Valiullov in Natural Language Processing
Aragaer
ну значит именно расстояние между строками, просто есть разные способы его измерять
Спасибо.
Мне просто необходим корректный перевод. Я не очень хорошо разбираюсь в NLP ML и во всём этом.

Почему справшиваю. Просто не нашёл перевода на специализированных ресурсах.
источник

RV

Rinat Valiullov in Natural Language Processing
Aragaer
расстояние хэмминга и левенштейна как-то на слуху, два других первый раз вижу
А можете объяснить простыми словами, что именно делают эти алгоритмы, которые измеряют расстояния между строками?
источник

DK

Denis Kirjanov in Natural Language Processing
Rinat Valiullov
А можете объяснить простыми словами, что именно делают эти алгоритмы, которые измеряют расстояния между строками?
Сравнивают, насколько далеко одна от другой по составляющим их буквам
Пётр и метр близко, ветер и Саша — далеко )
источник

RV

Rinat Valiullov in Natural Language Processing
Denis Kirjanov
Сравнивают, насколько далеко одна от другой по составляющим их буквам
Пётр и метр близко, ветер и Саша — далеко )
То есть я правильно понимаю, что это расстояние - некая относительная и узкоспециализированная единица. Здесь даже можно сказать, что это разница?
источник

RV

Rinat Valiullov in Natural Language Processing
То есть, например,

0,1 - маленькое "расстояние" - и слова слишком разные,
а 0,8 - высокая величина - и слова очень похожи?
источник

DK

Denis Kirjanov in Natural Language Processing
Rinat Valiullov
То есть, например,

0,1 - маленькое "расстояние" - и слова слишком разные,
а 0,8 - высокая величина - и слова очень похожи?
В каждой метрике порог свой, но типа того
источник

RV

Rinat Valiullov in Natural Language Processing
Denis Kirjanov
В каждой метрике порог свой, но типа того
Спасибо. String distance можно отнести к метрике?
источник

A

Aragaer in Natural Language Processing
расстояние левенштейна - количество букв, которые надо поменять, чтобы из одного слова сделать ругое
источник

A

Aragaer in Natural Language Processing
то есть между "петр" и "метр" расстояние 1
источник

A

Aragaer in Natural Language Processing
расстояние хэмминга еще включает в себя (кажется) вставку/удаление и перестановку букв
источник

A

Aragaer in Natural Language Processing
соответственно два других я не знаю
источник

B

Brenoritvrezorkre in Natural Language Processing
А я думал, это может быть про дистрибутивную семантику, там тоже расстояние между словами ищут по их similarity, только другой
источник

B

Brenoritvrezorkre in Natural Language Processing
Но тогда бы вряд ли написали, конечно, что string
источник

RV

Rinat Valiullov in Natural Language Processing
Brenoritvrezorkre
А я думал, это может быть про дистрибутивную семантику, там тоже расстояние между словами ищут по их similarity, только другой
Вот да. Там и написано: измерение сходства между словами
источник

RV

Rinat Valiullov in Natural Language Processing
Значит статья не очень корректна?
источник

A

Aragaer in Natural Language Processing
ну это измерение сходства именно посимвольного, не семантического
источник

RV

Rinat Valiullov in Natural Language Processing
Или даже просто сформулирован заголовок немного неправильно
источник

B

Brenoritvrezorkre in Natural Language Processing
Просто контекст не ясен, нужно уточнить. Речь про сходство между словами, но при этом говорят про строки.
источник

RV

Rinat Valiullov in Natural Language Processing
что-то я совсем уже запутался...
источник