Size: a a a

Natural Language Processing

2021 December 17

KV

Konstantin Vishnivet... in Natural Language Processing
Это называется КЛАДР и доступен он свободно. Преобразуйте самописной утилитой в нужный Вам формат хранения и наслаждайтесь.
источник

MP

Mike Pogosov in Natural Language Processing
Добрый день. А dbf там больше нет?
источник

M

Max in Natural Language Processing
Добрый. Кажется, нет...
источник

IP

Ilya Prokin in Natural Language Processing
Всем привет. С хирургом-онкологом из Бордо исследуем возможность решения проблемы с данными в госпиталях во Франции - обработкой неструктурированных данных и извлечением структуры и инсайтов. Если кому-то интересна эта проблематика, пишите в личку буду рад рассказать подробнее
источник

Eg

Elena gisly in Natural Language Processing
https://fias.nalog.ru/Updates а тут же есть ФИАС в формате КЛАДР — этот как раз dbf'ы
источник

Eg

Elena gisly in Natural Language Processing
https://fias.nalog.ru/DataArchive и полная БД тоже в виде dbf
источник

КМ

Константин Маркион... in Natural Language Processing
Ловите.
источник

M

Max in Natural Language Processing
Спасибо!
источник

M

Max in Natural Language Processing
На 31 Гб? Мне казалось там XML (по заголовку таблицы). Спасибо.
Буду иметь в виду!
источник

VM

Victor Maslov in Natural Language Processing
на сегодня в этой стране значение слов "парсить", "парсер", "парсинг"  совсем не то, о котором вы подумали

никто не видел и не представляет уже значение этого слова, поэтому используют его для чего угодно, например, недавно проскакивал заказ на "парсинг видео из 480p в 360p"
источник

🐙

🐙 in Natural Language Processing
я отталкивался от "дико неудобно". Когда говорят про "парсить", "дико неудобно" и структурированный документ, то на ум приходит разбор html'ок regexp'ами :)
источник

DG

Denis Gordeev in Natural Language Processing
https://en.wikipedia.org/wiki/Parsing т.е. построение структуры данных. Как раз про XML.
источник

VM

Victor Maslov in Natural Language Processing
автор сообщения не имел ввиду парсинг
он имел ввиду просто импорт какой-либо библиотекой -- ему не нравится, что файлов много, и м.б. у библиотек плохой интерфейс
источник

V

Vic in Natural Language Processing
у нас есть опыт в диалоговых моделях, тут с датасетом проблема и затравочных токенах, но и не только
источник

DD

David Dale in Natural Language Processing
Подозреваю, что дело в адаптерах, так как без них, скорее всего, модель генерирует на "привет" что-то осмысленное.
Вопрос первый: как эти адаптеры инициализируются?
Если вставить адаптеры, но не обучать их, что генерируется?
источник

V

Vic in Natural Language Processing
написал в лс
источник

AS

Artem Snegirev in Natural Language Processing
Да тоже белеберда получается

привет а мы, ван ма ван, ван ван ван мы ван ван
привет из, при,, с, до, в, с мы, ф, мы,, наш ф

https://colab.research.google.com/drive/1u7hM-uNIkCbd88_NPBb7u8rCDlMvz_qo?usp=sharing

Как будто адаптеры вообще не тренились, наверно я ими косячно воспользовался
источник

ИМ

Игорь Михайлов... in Natural Language Processing
Всем привет, ищу кто может реализовать сентиментный анализ сообщений из чата (рус, англ). Кто готов в эти выходные обсудить сроки и стоимость, напишите плз в личку. Подробности проекта тоже в личке.
источник

SancheZz Мов in Natural Language Processing
Лс
источник
2021 December 19

КЗ

Катя Забабурина... in Natural Language Processing
Всем привет! Знает ли кто-нибудь датасет из фраз для управления каким-либо умным бытовым устройством (стиральная машинка, например, микроволновка или тот же пылесос)? Что-то вроде <Текст запроса> – <Категория запроса> : 'Нужно постирать как можно скорее' – 'Режим быстрая стирка' или похожее на этот вид.
источник