Size: a a a

Natural Language Processing

2020 September 07

DD

Deka Dancer in Natural Language Processing
А есть хоть чтото для генерации вопросов по тексту/фразе?
источник

DZ

Dmitrii Zhurman in Natural Language Processing
спасибо
источник

SZ

Sergey Zhuravlev in Natural Language Processing
Добрый день. Только начинаю разбираться в теме, по этому не судите строго за вопрос. Использую EasyOCR для распознавания товаров. В EasyOCR есть на Гите словарик русский на котором обучение проводилось, но там общие слова, а у меня есть большой готовый словарь именно из нужной мне сферы товаров и маркетинга. Не подскажите как можно проще всего натренировать OCR по моему словарю? Чтоб порог входа был не высоким. Так как автор EasyOCR предлагает присылать ему словари для обучения, но только новых языков, то не хочется его тревожить моим вопросом.
источник

А

Александра in Natural Language Processing
Добрый вечер,
Подскажите, какие теще конференции планируются в ближайшее время? Хотим выступить с докладом, но не успеваем к 20 сентября
источник
2020 September 08

rr

ragib rahi in Natural Language Processing
Can I get any job help as I lost my job in this pandemic situation
I hv done datascience and I was working as a powerbi developer for the last 6 months
источник

AW

Alex Wortega in Natural Language Processing
Коллеги, а как лучше распознать таблицу в документе? Есть следующая задача: на вход поступает документ в виде картинок, нужно выделить области где находится таблица, текст, всякие символики и тд. Как это лучше сделать?
источник

AW

Andrew Witwicki in Natural Language Processing
Alex Wortega
Коллеги, а как лучше распознать таблицу в документе? Есть следующая задача: на вход поступает документ в виде картинок, нужно выделить области где находится таблица, текст, всякие символики и тд. Как это лучше сделать?
Может контуры в opencv
источник

AW

Andrew Witwicki in Natural Language Processing
Если большой и квадратный значит таблица
источник

SS

Sergey Shulga in Natural Language Processing
Andrew Witwicki
Если большой и квадратный значит таблица
Святая наивность. А если это рисунок/штамп/таблица без контуров? Эта задача в лоб не решается. И я в итоге решал ее через нейронки, а не через opencv
источник

AW

Andrew Witwicki in Natural Language Processing
Sergey Shulga
Святая наивность. А если это рисунок/штамп/таблица без контуров? Эта задача в лоб не решается. И я в итоге решал ее через нейронки, а не через opencv
давайте вообще индуса тогда посадим, может же попасться картинка с изображением таблицы и что тогда
источник

A

Arcady in Natural Language Processing
Andrew Witwicki
давайте вообще индуса тогда посадим, может же попасться картинка с изображением таблицы и что тогда
А картинка с изображением таблицы не будет таблицей? :) Утиный тест на неё не распространяется?
источник

χλ

χоρоший ☽☽☽ λисuчко... in Natural Language Processing
ragib rahi
Can I get any job help as I lost my job in this pandemic situation
I hv done datascience and I was working as a powerbi developer for the last 6 months
ГГ
источник

AW

Andrew Witwicki in Natural Language Processing
Arcady
А картинка с изображением таблицы не будет таблицей? :) Утиный тест на неё не распространяется?
в контексте "неправильная таблица" которую не надо парсить, не будет
источник

A

Arcady in Natural Language Processing
Кстати, недавно в Радио-т обсуждение было, как ребята из abbyy делают распознавание счетов
источник

A

Arcady in Natural Language Processing
Andrew Witwicki
в контексте "неправильная таблица" которую не надо парсить, не будет
Так документ в виде картинок - это и есть «неправильная таблица»
источник
2020 September 09

ЕТ

Евгений Томилов... in Natural Language Processing
Дамы и господа, направьте меня, пожалуйста, что именно мне гуглить.

У меня есть интервью с людьми, построенные следующим образом: было несколько текстов, которые люди читали и потом на основе этих текстов задавались вопросы.

Теперь я хочу выделить основные темы этих интервью, причём посмотреть, есть ли разница в темах в зависимости от разных текстов. Достаточно ли мне будет просто делать тематическое моделирование, предварительно разбив исходные тексты по группам или есть более тонкие методы?

Я точно читал про тематическое моделирование, при котором мы ещё информацию в него дополнительную кладём. Спасибо.
источник

PR

Petr Rjevsky in Natural Language Processing
Евгений Томилов
Дамы и господа, направьте меня, пожалуйста, что именно мне гуглить.

У меня есть интервью с людьми, построенные следующим образом: было несколько текстов, которые люди читали и потом на основе этих текстов задавались вопросы.

Теперь я хочу выделить основные темы этих интервью, причём посмотреть, есть ли разница в темах в зависимости от разных текстов. Достаточно ли мне будет просто делать тематическое моделирование, предварительно разбив исходные тексты по группам или есть более тонкие методы?

Я точно читал про тематическое моделирование, при котором мы ещё информацию в него дополнительную кладём. Спасибо.
Видимо, речь идет о мультимодальных тематических моделях (в модель в отдельные модальности включаются метаданные типа автора текста, источника и тд). Помню, что делал такое с помощью bigartm.
источник

RS

Ruslan Sabirov in Natural Language Processing
Евгений Томилов
Дамы и господа, направьте меня, пожалуйста, что именно мне гуглить.

У меня есть интервью с людьми, построенные следующим образом: было несколько текстов, которые люди читали и потом на основе этих текстов задавались вопросы.

Теперь я хочу выделить основные темы этих интервью, причём посмотреть, есть ли разница в темах в зависимости от разных текстов. Достаточно ли мне будет просто делать тематическое моделирование, предварительно разбив исходные тексты по группам или есть более тонкие методы?

Я точно читал про тематическое моделирование, при котором мы ещё информацию в него дополнительную кладём. Спасибо.
А этот датасет с интервью, текстами и вопросами где-то можно достать?
источник

ЕТ

Евгений Томилов... in Natural Language Processing
Ruslan Sabirov
А этот датасет с интервью, текстами и вопросами где-то можно достать?
Он закрытый, простите.
источник

ЕТ

Евгений Томилов... in Natural Language Processing
Petr Rjevsky
Видимо, речь идет о мультимодальных тематических моделях (в модель в отдельные модальности включаются метаданные типа автора текста, источника и тд). Помню, что делал такое с помощью bigartm.
Спасибо!
источник