Size: a a a

Обсуждения техдирские

2020 July 20

ИП

Иван Повстен... in Обсуждения техдирские
M B
и чем помогает сказать что что-то говно? ты же просто сказал медленно и привел пример когда неправильно работает. Медленно это относительная величина, где пример быстрой либы? где результаты сравнительного тестирования на естественных текстах? ничего этого нет, есть просто твое мнение ничем не подкрепленное
Ты можешь заказать такое иследование, нужно всего 10-30 миллионов рублей
источник

AS

Andrey Shetukhin in Обсуждения техдирские
M B
и чем помогает сказать что что-то говно? ты же просто сказал медленно и привел пример когда неправильно работает. Медленно это относительная величина, где пример быстрой либы? где результаты сравнительного тестирования на естественных текстах? ничего этого нет, есть просто твое мнение ничем не подкрепленное
Как минимум тем, что прочитавшие задумаются, надо ли подобное тащить в проект.
Относительность можно измерить на том же ES, на Sphinx, на библиотеке Яндекса, и много где.

Тестировать же имеет смысл только то, что проходит базовые проверки на адекватность работы. Это поделие такую проверку не прошло.

Это точно то же самое, когда преподаватель в институте разворачивает студента после первой обнаруженной грубой ошибки: нет смысла смотреть дальше, пока есть такое, это просто потеря времени.
источник

AS

Andrey Shetukhin in Обсуждения техдирские
И - да. Сравнительное исследование стоит денег. За него, внезапно, надо платить.
источник

AS

Andrey Shetukhin in Обсуждения техдирские
> ничего этого нет, есть просто твое мнение ничем не подкрепленное

Не, ну я регулярно вижу, что есть избирательная слепота. Но чтобы не смочь разглядеть разницу на двух скриншотах - это перебор, наверное.
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Иван Повстен
Ты можешь заказать такое иследование, нужно всего 10-30 миллионов рублей
А смысл в таких тратах? Оно не проходит самых базовых проверок.

Я понимаю, там протестировать mysql vs postgres, но тут, простите за аналогию, парзер SQL не работает.
источник

АП

Александр Поволоцкий... in Обсуждения техдирские
Andrey Shetukhin
А смысл в таких тратах? Оно не проходит самых базовых проверок.

Я понимаю, там протестировать mysql vs postgres, но тут, простите за аналогию, парзер SQL не работает.
Работает. Но периодически считает себя парсером HTML. Насколько я понимаю, это одна из главных проблем нейронной сети - понять, что она там внутри себя делает, нереально
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Александр Поволоцкий
Работает. Но периодически считает себя парсером HTML. Насколько я понимаю, это одна из главных проблем нейронной сети - понять, что она там внутри себя делает, нереально
Так я не предлагаю залезть под капот. Всё, что требуется - чтобы результат для начала был стабильным.

И только потом уже можно говорить о качестве разметки, о соотношении ошибок, о false positives, false negatives, о точности/охвате.

А тут говорить не о чем, оно просто генерирует рандом. Да даже втупую набитый словарь со стеммингом будет лучше и главное - быстрее работать.
источник

AS

Andrey Shetukhin in Обсуждения техдирские
А генерирует рандом оно просто потому, что используется defective by design подход. В русском языке так попросту не работает. Это, кстати, не означает, что в каком-то другом языке работать не будет. Возможно - будет, я этого не знаю.
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Решение дифференциальных уравнений нейросетью как оно есть. Хотя на втором курсе университета учат, как это делать правильно.
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Просто надо дорасти до понимания, что нейросети - не универсальное решение,  и что для разработки продукта надо понимать, как оно устроено (не нейросети и ML, а предметная область, к которой ML хотят прикрутить).

Я, например, не вижу ничего плохого в нейросетках, которые раскрашивают картины под ван Гога.

Но блин.

Это поделие - просто позор какой-то.
источник

VK

Vartan Khachaturov in Обсуждения техдирские
так ты результаты тестов-то покажи :)
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Так ты скриншоты посмотри.
источник

АС

Алёша Спокойник... in Обсуждения техдирские
Погнали по третьему кругу ;)
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Если их опять не удалили, хехехехе
источник

VK

Vartan Khachaturov in Обсуждения техдирские
Andrey Shetukhin
Так ты скриншоты посмотри.
у них на сайте?
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Andrey Shetukhin
Да, кстати. Почему библиотека ПЛОХАЯ.

Делай раз:
https://i.gyazo.com/fcb83c7e725294de3d551f6b93135852.png

Делай два:
https://i.gyazo.com/ff3a82d277ce680fddfae296b22c89d7.png

Определение того, что есть имя, а что - топоним зависит от номера предложения в тексте.

Это залёт, мальчики и девочки. Очень нехороший залёт. Так делать нельзя ни в коем случае.

Дело тут в том, что библиотека может ошибаться, но ошибка должна быть постоянной. А когда разметка зависит от места предложения в тексте - это отличный пример того, что нейросеть натренирована из рук вон плохо.
Вот тут
источник

VK

Vartan Khachaturov in Обсуждения техдирские
А, вижу
источник

DS

Dmitry Simonov in Обсуждения техдирские
@sloneus , если я ещё раз сегодня увижу продажу Тебя, забаню на неделю
источник

AS

Andrey Shetukhin in Обсуждения техдирские
Dmitry Simonov
@sloneus , если я ещё раз сегодня увижу продажу Тебя, забаню на неделю
Дима, да хоть на год. Я - профессионал, я занимаюсь этой темой, работу не ищу, себя не продаю. Я пишу о том, как оно есть. Если тебя бомбит - это ТВОИ проблемы.
источник

DS

Dmitry Simonov in Обсуждения техдирские
Andrey Shetukhin
Дима, да хоть на год. Я - профессионал, я занимаюсь этой темой, работу не ищу, себя не продаю. Я пишу о том, как оно есть. Если тебя бомбит - это ТВОИ проблемы.
!warn не вопрос! договорились про "на год" :)
источник