Телеграмм чат группы natural_language

https://github.com/episodeyang/deep-auto-punctuation
https://github.com/panda-baba/bert_punct
https://github.com/nkrnrnk/BertPunc
https://github.com/miguelballesteros/LSTM-punctuation
https://github.com/dave-chatmost/pytorch-punctuator
https://github.com/bedapudi6788/deepcorrect
https://github.com/tensorflow/lingvo/tree/master/lingvo/tasks/punctuator
https://github.com/alpoktem/punkProse

https://github.com/ottokart/punctuator2

GitHub

ottokart/punctuator2

A bidirectional recurrent neural network model with attention mechanism for restoring missing punctuation in unsegmented text - ottokart/punctuator2

источник

13:17пожаловаться #8

эдуард in Natural Language Processing

Dmitry

https://github.com/episodeyang/deep-auto-punctuation
https://github.com/panda-baba/bert_punct
https://github.com/nkrnrnk/BertPunc
https://github.com/miguelballesteros/LSTM-punctuation
https://github.com/dave-chatmost/pytorch-punctuator
https://github.com/bedapudi6788/deepcorrect
https://github.com/tensorflow/lingvo/tree/master/lingvo/tasks/punctuator
https://github.com/alpoktem/punkProse

https://github.com/ottokart/punctuator2

GitHub

ottokart/punctuator2

A bidirectional recurrent neural network model with attention mechanism for restoring missing punctuation in unsegmented text - ottokart/punctuator2

находил это сообщение вчера. русских моделек там нет, а тренить нет времени под эту задачу. только если брать deeppavlov'скую и пихать в bertpunc, но до этого пока не добрался

источник

13:23пожаловаться #9

АК

Андрей Ключаревский in Natural Language Processing

Здравствуйте!
Посоветуйте аналог Копискепу для сопоставления текстов https://www.copyscape.com/compare.php
Хочу проверять уникальность всех неопубликованных статей друг относительно друга.

Сейчас пользуюсь Voyant tools, но копирайтеры не потянут - слишком сложен

Copyscape

Compare Two Web Pages or Articles - Copyscape

Free comparison of two web pages or pieces of text, powered by Copyscape's technology.

источник

23:00пожаловаться #10

2020 March 18

Ivan in Natural Language Processing

Привет всем, подскажите пожалуйста на счёт yargy парсера и natasha. Можно ли с использованием Yargy для написании своих правил для извлечения какой-либо информации из текста добавлять в парсер extractor из библиотеки Natasha и использовать их одновременно? Например я хочу вытащить из текста НДС и значение после, но оно может быть либо числом с % либо расписанным числом, дак вот можно ли в написанные правила для извлечения НДС вставить MoneyExtractor в конце чтобы корректно извлекать величину НДС?

источник

14:43пожаловаться #11

Alex Mak in Natural Language Processing

Приветствую всех!

Подскажите, а есть ли какие-то общедоступные датасеты судебных решений? (Интересуют при этом судебные решения по КАСКО.)

источник

14:52пожаловаться #12

Vlad in Natural Language Processing

Белый дом, а также группа институтов, включая некоторые компании, просят помощи технического сообщества в исследованиях над COVID-19.

Если вы ML-инженер и вам знакома работа с NLP (natural language processing), вы можете помочь исследователям получить какие-то инсайды исходя из огромного датасета в 30 000 научных статей про короновирус.

Список задач которые пытаются решить:
https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge/tasks
На первом месте: "What is known about transmission, incubation, and environmental stability?".

Датасет:
https://pages.semanticscholar.org/coronavirus-research

Анонс:
https://www.whitehouse.gov/briefings-statements/call-action-tech-community-new-machine-readable-covid-19-dataset/

Kaggle

COVID-19 Open Research Dataset Challenge (CORD-19)

An AI challenge with AI2, CZI, MSR, Georgetown, NIH & The White House

источник

15:32пожаловаться #13

СУ

Сергей Устьянцев in Natural Language Processing

Всем привет! А если в берте брать выходы с нескольких слоёв, то как обычно с ними поступают? Суммируют/усредняют? Конкатенируют? Или по обстоятельствам?

источник

23:04пожаловаться #14

Yaroslav Emelianov in Natural Language Processing

Берут взвешенную сумму, а веса обучают

источник

23:38пожаловаться #15

2020 March 19

СУ

Сергей Устьянцев in Natural Language Processing

а с какими весами?

источник

00:15пожаловаться #16