Size: a a a

Обсуждения техдирские

2020 July 20

AS

Andrey Shetukhin in Обсуждения техдирские
И это уже не 25 килобайт в секунду, это просто некорректная работа приложения.
источник

MB

M B in Обсуждения техдирские
Andrey Shetukhin
Да, кстати. Почему библиотека ПЛОХАЯ.

Делай раз:
https://i.gyazo.com/fcb83c7e725294de3d551f6b93135852.png

Делай два:
https://i.gyazo.com/ff3a82d277ce680fddfae296b22c89d7.png

Определение того, что есть имя, а что - топоним зависит от номера предложения в тексте.

Это залёт, мальчики и девочки. Очень нехороший залёт. Так делать нельзя ни в коем случае.

Дело тут в том, что библиотека может ошибаться, но ошибка должна быть постоянной. А когда разметка зависит от места предложения в тексте - это отличный пример того, что нейросеть натренирована из рук вон плохо.
норм фидбэк, но нужно обосновать почему зависимость от положения предложения в тексте это плохо, иначе это очень нехороший залет, сам понимаешь.
источник

MB

M B in Обсуждения техдирские
как минимум потому что убрать зависимость легко, разбив на предложения, а добавить сложно )
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Это очень плохо потому, что определение типа в обоих случаях разное и зависит от положения в тексте.

Убрать зависимость невозможно, так как причина её - в самой архитектуре приложения, которое ничего вообще не знает о языке. Оно лишь подсвечивает то, что чем-то похоже на данные из обучающей коллекции документов. Которая.... да, сюрприз, собрана из текстов с предложениями.
источник

AS

Andrey Shetukhin in Обсуждения техдирские
То есть, получается, что если текст короткий, то там статистика вот такая. А если длинный - то другая. Ну ок. Значит мы должны обрабатывать только тексты заданной длины. Что само по себе смешно, если ты занимаешься анализом текстов хоть немного продолжительное время.
источник

MB

M B in Обсуждения техдирские
Andrey Shetukhin
Это очень плохо потому, что определение типа в обоих случаях разное и зависит от положения в тексте.

Убрать зависимость невозможно, так как причина её - в самой архитектуре приложения, которое ничего вообще не знает о языке. Оно лишь подсвечивает то, что чем-то похоже на данные из обучающей коллекции документов. Которая.... да, сюрприз, собрана из текстов с предложениями.
убрать конечно возможно если поставить простейший препроцессор в начале который разобьет тексты на предложения.
источник

AS

Andrey Shetukhin in Обсуждения техдирские
M B
убрать конечно возможно если поставить простейший препроцессор в начале который разобьет тексты на предложения.
Бхахахахахахаха, мяу. Типичный багфикс "я так вижу".
Чувак.  Ты правда не понимаешь, почему так сделать нельзя?
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Как устроены мозги нейросетки, я, разумеется, не знаю. Но могу предположить, что первоначальная разметка обучающей коллекции такова, что в первом предложении идут имена - топонимы - организации, а в последующих - в основном имена.

Ну вот оно и размечает в соответствии с полученным паттерном.

А это очень, очень нехорошо.
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Потому что нет анализа частей речи, а есть анализ похожести текста.
источник

MB

M B in Обсуждения техдирские
ну вот ты уже сделал вывод как оно все работает и почему это все гавно, молодец что сказать )
источник

MB

M B in Обсуждения техдирские
а еще всех засрал и самоутвердился хехе
источник

AS

Andrey Shetukhin in Обсуждения техдирские
M B
ну вот ты уже сделал вывод как оно все работает и почему это все гавно, молодец что сказать )
Да, я - молодец. Я занимаюсь анализом текстов примерно с 2003 года и знаю, как и что спросить у анализаторов текста, дабы найти ошибки и неточности.
источник

AS

Andrey Shetukhin in Обсуждения техдирские
M B
а еще всех засрал и самоутвердился хехе
Ну как же без этого-то? Особенно если оно НЕ работает.

Нет, я же не против, можно и дифференциальные уравнения решать нейросеточьками.
источник

MB

M B in Обсуждения техдирские
Andrey Shetukhin
Да, я - молодец. Я занимаюсь анализом текстов примерно с 2003 года и знаю, как и что спросить у анализаторов текста, дабы найти ошибки и неточности.
что ты взамен то предложил? давай покажи свое решение и расскажи как будешь сравнивать
источник

MB

M B in Обсуждения техдирские
Andrey Shetukhin
Ну как же без этого-то? Особенно если оно НЕ работает.

Нет, я же не против, можно и дифференциальные уравнения решать нейросеточьками.
диффуры и решают нейросеточками если что ))
источник

MB

M B in Обсуждения техдирские
как то справлялись до компов
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Если бы у нас был язык с чётко зафиксированным положением слов в предложении, этот подход бы работал. С ограничениями, но - работал.

Но в русском языке это не так.

И положение слова в предложении не строго задано.
В предложении не строго задано положение слова .
В предложении положение слова не строго задано .
В предложении положение слова задано не строго.
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Так что уносите. Это плохая, негодная реализация, от использования которой будет больше проблем, чем пользы.
источник

MB

M B in Обсуждения техдирские
твоя нейросеть же парсит эти предложения? )
источник

AS

Andrey Shetukhin in Обсуждения техдирские
M B
твоя нейросеть же парсит эти предложения? )
Которая внутри черепа - да. Но то другая нейросеть, не та, что на питоне.
источник