Size: a a a

Natural Language Processing

2019 November 04

a

abc in Natural Language Processing
Dmitry
Вообще ещё есть порт на C# и Java
Там в С# версии в репе PullentiNetCore лежат готовые dll исходников от этих dll нет. Это такой особый способ распространения или защита?
источник

a

abc in Natural Language Processing
Как то боязно использовать dll неизвестно что там
источник

D

Dmitry in Natural Language Processing
abc
Там в С# версии в репе PullentiNetCore лежат готовые dll исходников от этих dll нет. Это такой особый способ распространения или защита?
В Java версии весь код открыт.
источник

D

Dmitry in Natural Language Processing
И что удивительно не содержит зависимостей.
источник

a

abc in Natural Language Processing
Но ведь Java версия генерируется из исходников .NET ?
источник

D

Dmitry in Natural Language Processing
abc
Но ведь Java версия генерируется из исходников .NET ?
Да)
источник

a

abc in Natural Language Processing
Тогда одно другому противоречит) Но я посмотрю Java версию конечно
источник

D

Dmitry in Natural Language Processing
abc
Тогда одно другому противоречит) Но я посмотрю Java версию конечно
Не противоречит. Там прямая трансляция из C# в Java
источник

D

Dmitry in Natural Language Processing
Зависимостей действительно нет. У нас в дереве проекта просто лежат исходники.
источник

a

abc in Natural Language Processing
А как C# код транислируется если в репе лежат одни DLL? Я конечно на шарпе уже как 8 лет не пишу но такой магии не видел
источник

D

Dmitry in Natural Language Processing
abc
А как C# код транислируется если в репе лежат одни DLL? Я конечно на шарпе уже как 8 лет не пишу но такой магии не видел
В репе лежат) А вот как они транслировали нам неизвесно, ведь у них то есть исходники всего на C#
источник
2019 November 05

Y

Yurii in Natural Language Processing
Как извлечь все pos для токена в spacy для английского?
источник

AY

Anastasia Yashch in Natural Language Processing
token.pos_
источник

Y

Yurii in Natural Language Processing
Речь про все равианты, а не один. Похоже такого в spacy eng нету. В pymorphy2 есть считай по умолчанию, но видимо дело в различии русского и английского и авторы spacy этим не заморачивались.
источник

AY

Anastasia Yashch in Natural Language Processing
Yurii
Речь про все равианты, а не один. Похоже такого в spacy eng нету. В pymorphy2 есть считай по умолчанию, но видимо дело в различии русского и английского и авторы spacy этим не заморачивались.
да, видимо так =)
источник

V

Vlad in Natural Language Processing
Подскажите пожалуйста, как правильно называется такая задача: замена текста, написанного с неправильной раскладкой клавиатуры. Т.е. из 'ghbdtn' надо получить 'привет', а из 'руддщ' получить 'hello'. И ещё бы такое для украинской раскладки)

Это можно сделать простой заменой по буквам, но... а если у меня будет текст на англе с правильной раскладкой, а я его на русский сменю? Как это отлавливать? Тут уже не просто замена букв получается. Или когда смешанный текст, например 'hello vjq lheu' - 'hello мой друг'
источник

D(

David (ddale) Dale in Natural Language Processing
Vlad
Подскажите пожалуйста, как правильно называется такая задача: замена текста, написанного с неправильной раскладкой клавиатуры. Т.е. из 'ghbdtn' надо получить 'привет', а из 'руддщ' получить 'hello'. И ещё бы такое для украинской раскладки)

Это можно сделать простой заменой по буквам, но... а если у меня будет текст на англе с правильной раскладкой, а я его на русский сменю? Как это отлавливать? Тут уже не просто замена букв получается. Или когда смешанный текст, например 'hello vjq lheu' - 'hello мой друг'
Можно обучить какую-нибудь простую посимвольную языковую модельку (например, тупо посчитать буквенные триграммы по каким-то корпусам типа кусочка википедии).
И дальше менять раскладку, только если вероятность измененного слова, согласно модельке, сильно выше, чем вероятность исходного. И прогонять это по отдельности для каждого слова.
источник

D(

David (ddale) Dale in Natural Language Processing
Vlad
Подскажите пожалуйста, как правильно называется такая задача: замена текста, написанного с неправильной раскладкой клавиатуры. Т.е. из 'ghbdtn' надо получить 'привет', а из 'руддщ' получить 'hello'. И ещё бы такое для украинской раскладки)

Это можно сделать простой заменой по буквам, но... а если у меня будет текст на англе с правильной раскладкой, а я его на русский сменю? Как это отлавливать? Тут уже не просто замена букв получается. Или когда смешанный текст, например 'hello vjq lheu' - 'hello мой друг'
А вообще, это частный случай спелл-чекера)
источник

V

Vlad in Natural Language Processing
А готового ничего под это нету?
источник

V

Vlad in Natural Language Processing
Я это хочу к JamSpell прикрутить)
источник