Телеграмм чат группы ctorecordschat страница 4713

И это уже не 25 килобайт в секунду, это просто некорректная работа приложения.

14:57пожаловаться #1

MB

Да, кстати. Почему библиотека ПЛОХАЯ.

Делай раз:
https://i.gyazo.com/fcb83c7e725294de3d551f6b93135852.png

Делай два:
https://i.gyazo.com/ff3a82d277ce680fddfae296b22c89d7.png

Определение того, что есть имя, а что - топоним зависит от номера предложения в тексте.

Это залёт, мальчики и девочки. Очень нехороший залёт. Так делать нельзя ни в коем случае.

Дело тут в том, что библиотека может ошибаться, но ошибка должна быть постоянной. А когда разметка зависит от места предложения в тексте - это отличный пример того, что нейросеть натренирована из рук вон плохо.

норм фидбэк, но нужно обосновать почему зависимость от положения предложения в тексте это плохо, иначе это очень нехороший залет, сам понимаешь.

15:02пожаловаться #2

MB

как минимум потому что убрать зависимость легко, разбив на предложения, а добавить сложно )

15:03пожаловаться #3

AS

Это очень плохо потому, что определение типа в обоих случаях разное и зависит от положения в тексте.

Убрать зависимость невозможно, так как причина её - в самой архитектуре приложения, которое ничего вообще не знает о языке. Оно лишь подсвечивает то, что чем-то похоже на данные из обучающей коллекции документов. Которая.... да, сюрприз, собрана из текстов с предложениями.

15:05пожаловаться #4

AS

То есть, получается, что если текст короткий, то там статистика вот такая. А если длинный - то другая. Ну ок. Значит мы должны обрабатывать только тексты заданной длины. Что само по себе смешно, если ты занимаешься анализом текстов хоть немного продолжительное время.

15:07пожаловаться #5

MB

Это очень плохо потому, что определение типа в обоих случаях разное и зависит от положения в тексте.

Убрать зависимость невозможно, так как причина её - в самой архитектуре приложения, которое ничего вообще не знает о языке. Оно лишь подсвечивает то, что чем-то похоже на данные из обучающей коллекции документов. Которая.... да, сюрприз, собрана из текстов с предложениями.

убрать конечно возможно если поставить простейший препроцессор в начале который разобьет тексты на предложения.

15:11пожаловаться #6

AS

M B

убрать конечно возможно если поставить простейший препроцессор в начале который разобьет тексты на предложения.

Бхахахахахахаха, мяу. Типичный багфикс "я так вижу".
Чувак. Ты правда не понимаешь, почему так сделать нельзя?

15:12пожаловаться #7

AS

Как устроены мозги нейросетки, я, разумеется, не знаю. Но могу предположить, что первоначальная разметка обучающей коллекции такова, что в первом предложении идут имена - топонимы - организации, а в последующих - в основном имена.

Ну вот оно и размечает в соответствии с полученным паттерном.

А это очень, очень нехорошо.

15:12пожаловаться #8

AS

Потому что нет анализа частей речи, а есть анализ похожести текста.

15:12пожаловаться #9

MB

ну вот ты уже сделал вывод как оно все работает и почему это все гавно, молодец что сказать )

15:13пожаловаться #10

MB

а еще всех засрал и самоутвердился хехе

15:13пожаловаться #11

AS

M B

ну вот ты уже сделал вывод как оно все работает и почему это все гавно, молодец что сказать )

Да, я - молодец. Я занимаюсь анализом текстов примерно с 2003 года и знаю, как и что спросить у анализаторов текста, дабы найти ошибки и неточности.

15:14пожаловаться #12

AS

M B

а еще всех засрал и самоутвердился хехе

Ну как же без этого-то? Особенно если оно НЕ работает.

Нет, я же не против, можно и дифференциальные уравнения решать нейросеточьками.

15:15пожаловаться #13

MB

Да, я - молодец. Я занимаюсь анализом текстов примерно с 2003 года и знаю, как и что спросить у анализаторов текста, дабы найти ошибки и неточности.

что ты взамен то предложил? давай покажи свое решение и расскажи как будешь сравнивать

15:15пожаловаться #14

MB

Ну как же без этого-то? Особенно если оно НЕ работает.

Нет, я же не против, можно и дифференциальные уравнения решать нейросеточьками.

диффуры и решают нейросеточками если что ))

15:16пожаловаться #15

MB

как то справлялись до компов

15:16пожаловаться #16

AS

Если бы у нас был язык с чётко зафиксированным положением слов в предложении, этот подход бы работал. С ограничениями, но - работал.

Но в русском языке это не так.

И положение слова в предложении не строго задано.
В предложении не строго задано положение слова .
В предложении положение слова не строго задано .
В предложении положение слова задано не строго.

15:18пожаловаться #17

AS

Так что уносите. Это плохая, негодная реализация, от использования которой будет больше проблем, чем пользы.

15:19пожаловаться #18

MB

твоя нейросеть же парсит эти предложения? )