Size: a a a

Natural Language Processing

2021 April 29

OS

Oleg Serikov in Natural Language Processing
дописывать после каждого токена синтаксическую часть его конллу разметки?
источник

A

Andrei in Natural Language Processing
в смысле менять сам токен?
источник

OS

Oleg Serikov in Natural Language Processing
превращать текст кошка ест картошку в кошка 1 2 ест 2 0 картошку 3 2  

# text = кошка ест картошку
1  кошка  кошка  NOUN  _  Animacy=Anim|Case=Nom|Gender=Fem|Number=Sing  2  nsubj  _  TokenRange=0:5
2  ест  есть  VERB  _  Aspect=Imp|Mood=Ind|Number=Sing|Person=3|Tense=Pres|VerbForm=Fin|Voice=Act  0  root  _  TokenRange=6:9
3  картошку  картошка  NOUN  _  Animacy=Inan|Case=Acc|Gender=Fem|Number=Sing  2  obj  _  SpaceAfter=No|TokenRange=10:18
источник

A

Andrei in Natural Language Processing
мм, спасибо за хинт!
источник

OS

Oleg Serikov in Natural Language Processing
а есть классический русский датасет на сентимент в отзывах в кине?
источник
2021 April 30

AP

Alexey Potapov in Natural Language Processing
А чем готовым можно онтологических категорий к таблице англоязычных  научных абстрактов нарыть 2 источника - 1) биология, медицина, фарма 2) все науки включая (1) ?

И что сейчас самое точное ?
источник

АК

Алексей Кожушко... in Natural Language Processing
Всем привет, можете пожалуйста подсказать, как можно сравнить 2 текста на схожесть, если один текст переписан на основе другого, и нельзя сказать что они имеют одинаковую структуру, слова и т.п, но возможно имеют в себе одинаковые названия (например мероприятия, названия мест)
источник

GF

Grigory Frantsuzov in Natural Language Processing
Прогнать через NER оба и сравнить результаты
источник

АК

Алексей Кожушко... in Natural Language Processing
Ок, спасибо
источник

RS

Ruslan Sabirov in Natural Language Processing
Привет!
Поделитесь, пожалуйста, опытом, как техника gradients accumulation (накопление градиента) работает в трансформерах.
Насколько сильно позволяет ускорить тренировку?
источник

AL

Alexey Lemeshevski in Natural Language Processing
Переслано от Alexey Lemeshevski
Всем привет! Сегодня (30 апреля 2021) в 20:00, в рамках очередного митапа Parsing Conf ( https://t.me/parsing_conf ) расскажу про методики, алгоритмы и архитектуру решения для обхода (парсинга) множества сайтов и извлечения ценной информации из них. Думаю, это будет интересно всем, у кого есть задачи сбора дата-сетов, проверки. Отдельно может быть интересно тем, кто парсит новости и строит бизнесы на этих данных. Доклад для тех, кто уже знает парсинг, но ещё не погружался в broad-crawl техники.

Ссылка в zoom (в 20:00 по Москве):
https://us02web.zoom.us/j/86560046252?pwd=eWVVOG0wSkIxNHJxbzVwUFc2NkMxUT09
источник

OV

Olga Velikay in Natural Language Processing
А будет ли запись данного эфира?
источник

МС

Михаил Синегубов... in Natural Language Processing
после 22 мая, там у орга какие то обязательства, как я понял
источник

OV

Olga Velikay in Natural Language Processing
Хорошо,спасибо
источник

DD

David Dale in Natural Language Processing
Друзья, а какие вы знаете качественные general purpose семантические парсеры для русского или английского языка?
Задача - превращать предложения в графовые представления, так чтобы эти представления были одинаковые (или хотя бы похожие) у предложений, одинаковых по смыслу.
источник

A

Andrei in Natural Language Processing
а можно пример хотя бы некачественных?)
источник

SS

Sergey Sikorskiy in Natural Language Processing
У графоманов сейчас эпидемия эмбедингов, так что ждать от них чего-нибудь путного не стоит … )
источник

DD

David Dale in Natural Language Processing
Какие-то семантические графчики есть в пулленти для русского.
Для английского есть стремноватый graphbrain и довольно приличная, но сложная amrlib - это из того, что быстро нагуглилось.
источник

AL

Alexey Lemeshevski in Natural Language Processing
Есть презентация, сейчас пришлю ссылку)
источник

AL

Alexey Lemeshevski in Natural Language Processing
https://yadi.sk/i/xdL6SN20aue8Ag - там много текста, основные идеи решений broad-crawl задач и задач авто-извлечения данных
источник