Телеграмм чат группы natural_language_processing страница 756

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

1772 membersпожаловаться на группу

2020 July 27

I

I Апрельский... in Natural Language Processing

German Zvonchuk

Здравствуйте Друзья,

у меня есть в БД много-много объявлений по продаже и аренде квартир.

Мне нужен механизм, при помощи которого я смогу определять, какое объявление является продажей, какое арендой на месяц, а какое объявление об аренде посуточно.

Может у кого-то был такой опыт?
Как эффективнее всего сделать это?

Стоит ли опираться только на текст или брать в расчет и цену и пытаться сделать правильный вывод?

Руками разметь сотни полторы. А потом обучи shallow классификатор на мешке слов и нетекстовой инфе (цене, что там ещё).

Как-то так мне кажется: https://scikit-learn.org/stable/auto_examples/compose/plot_column_transformer.html#sphx-glr-auto-examples-compose-plot-column-transformer-py

scikit-learn.org

Column Transformer with Heterogeneous Data Sources — scikit-learn 0.23.1 documentation

scikit-learn: machine learning in Python

источник

13:09пожаловаться #1

ZZ

Zigfrid Zvezdin in Natural Language Processing

Есть отличная платформа для аннотации текстов (для обучения модели классификации) prodi.gy
Но стоит дорого.
Какие есть простые и интуитивные в использовании похожие приложения?

источник

16:54пожаловаться #2

YB

Yuri Baburov in Natural Language Processing

Zigfrid Zvezdin

Есть отличная платформа для аннотации текстов (для обучения модели классификации) prodi.gy
Но стоит дорого.
Какие есть простые и интуитивные в использовании похожие приложения?

Doccano + свой классификатор, если классификация

источник

16:57пожаловаться #3

Р

Ромаша in Natural Language Processing

Zigfrid Zvezdin

Есть отличная платформа для аннотации текстов (для обучения модели классификации) prodi.gy
Но стоит дорого.
Какие есть простые и интуитивные в использовании похожие приложения?

https://github.com/heartexlabs/label-studio

heartexlabs/label-studio

Label Studio is a multi-type data labeling and annotation tool with standardized output format - heartexlabs/label-studio

источник

16:58пожаловаться #4

S

Serezha in Natural Language Processing

Zigfrid Zvezdin

Есть отличная платформа для аннотации текстов (для обучения модели классификации) prodi.gy
Но стоит дорого.
Какие есть простые и интуитивные в использовании похожие приложения?

Там лицензия вечная. Почему дорого?

источник

16:58пожаловаться #5

ZZ

Zigfrid Zvezdin in Natural Language Processing

Там лицензия вечная. Почему дорого?

Не для личного использования, для компании (там нужно брать паками по 5 юзеров)

источник

16:59пожаловаться #6

ZZ

Zigfrid Zvezdin in Natural Language Processing

Спасибо за ссылки

источник

17:00пожаловаться #7

FF

Futorio Franklin in Natural Language Processing

Doccano + свой классификатор, если классификация

В дукане беды с загрузкой датасета, максимум 1 мб

источник

17:17пожаловаться #8

FF

Futorio Franklin in Natural Language Processing

И нельзя удалить много обучающих примеров сразу, админка выкидывает ошибку

источник

17:18пожаловаться #9

YB

Yuri Baburov in Natural Language Processing

Futorio Franklin

В дукане беды с загрузкой датасета, максимум 1 мб

Да не должно быть. Бд какая?

источник

17:18пожаловаться #10

FF

Futorio Franklin in Natural Language Processing

стандартная из docker-compose

источник

17:19пожаловаться #11

YB

Yuri Baburov in Natural Language Processing

Futorio Franklin

И нельзя удалить много обучающих примеров сразу, админка выкидывает ошибку

Так удали из консоли джанги. В общем, проблемы решаемы, просто в проди.джи некоторые из них за вас уже решили.

источник

17:19пожаловаться #12

YB

Yuri Baburov in Natural Language Processing

Futorio Franklin

стандартная из docker-compose

Постгрес. Ну, он тем больше тормозит, чем больше документов. Берите мускул. Но в общем всё решается.

источник

17:20пожаловаться #13

FF

Futorio Franklin in Natural Language Processing

Постгрес. Ну, он тем больше тормозит, чем больше документов. Берите мускул. Но в общем всё решается.

В самом вебе пишется, что нельзя загрузить больше 1 мб

источник

17:21пожаловаться #14

YB

Yuri Baburov in Natural Language Processing

Futorio Franklin

В самом вебе пишется, что нельзя загрузить больше 1 мб

Больше 1мб чего? Файл? Настройки нджинкса покрути.

источник

17:21пожаловаться #15

AO

Alex Orgish in Natural Language Processing

Вместо ручной разметки можно попробовать почти автоматическую:
https://www.snorkel.org/use-cases/01-spam-tutorial

источник

17:28пожаловаться #16

S

Serezha in Natural Language Processing

Постгрес. Ну, он тем больше тормозит, чем больше документов. Берите мускул. Но в общем всё решается.

Шта? Индексы в базах для чего придумали :)

источник

17:38пожаловаться #17

FF

Futorio Franklin in Natural Language Processing

Да тут дело в другом, чтобы допилить вменяемого состояния нужно знать джангу, энжинкс и фронтенд потому он тоже бывает лагает

источник

17:39пожаловаться #18

YB

Yuri Baburov in Natural Language Processing

Шта? Индексы в базах для чего придумали :)

Я думал, что речь шла о миллионе записей. У постгреса из-за mvvc подсчёт количества записей -- o(n), если не использовать хаки с приближенным количеством результатов. проверяет каждую запись, не удалена ли она

источник

17:40пожаловаться #19

FF

Futorio Franklin in Natural Language Processing

Оно и понятно конечно почему так, но очень сильно раздражает временами

источник

17:40пожаловаться #20