Телеграмм чат группы natural_language_processing страница 1092

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

2538 membersпожаловаться на группу

2021 March 05

SL

Shelest Listjev in Natural Language Processing

Спросите здесь лучше. В чём именно вопрос?

Есть данные для NER формата (text, {"entities": [(index, index, label)]})
Пытаюсь проверить, как будет выглядеть пример training dat'ы:

doc = nlp("Laura flew to Silicon Valley.")
gold_dict = {"entities": [(0, 5, "PERSON"), (14, 28, "LOC")]}
example = Example.from_dict(doc, gold_dict)

Получаю example (док) почему-то с пустыми pos, dep, lemma и тд. Есть только токены и ner лэйблы.
Почему эти слоты пустые?

ps. язык текста - русский

источник

13:27пожаловаться #1

IK

Igor Kucherevsky in Natural Language Processing

Shelest Listjev

Есть данные для NER формата (text, {"entities": [(index, index, label)]})
Пытаюсь проверить, как будет выглядеть пример training dat'ы:

doc = nlp("Laura flew to Silicon Valley.")
gold_dict = {"entities": [(0, 5, "PERSON"), (14, 28, "LOC")]}
example = Example.from_dict(doc, gold_dict)

Получаю example (док) почему-то с пустыми pos, dep, lemma и тд. Есть только токены и ner лэйблы.
Почему эти слоты пустые?

ps. язык текста - русский

Потому что вы смотрите тренировочные данные для NER

источник

14:43пожаловаться #2

SL

Shelest Listjev in Natural Language Processing

Igor Kucherevsky

Потому что вы смотрите тренировочные данные для NER

Вы правы, тренировочные данные действительно для НЕР, но ведь нлп объект так же включает в себя токенизацию, лемматизацию, пос, депенданси и прочее, необходимое для тренировки NER.
Как, в таком случае, получить полный набор?

doc = nlp(text)

tags = offsets_to_biluo_tags(doc, entities_cleared)

entities_x = biluo_tags_to_spans(doc, tags)
doc.ents = entities_x
gold_docs.append(doc)
DocBin(docs=gold_docs).to_disk("train_file.spacy")

Здесь докбин сохраняет вместе с остальным?

источник

14:53пожаловаться #3

IK

Igor Kucherevsky in Natural Language Processing

Shelest Listjev

Вы правы, тренировочные данные действительно для НЕР, но ведь нлп объект так же включает в себя токенизацию, лемматизацию, пос, депенданси и прочее, необходимое для тренировки NER.
Как, в таком случае, получить полный набор?

doc = nlp(text)

tags = offsets_to_biluo_tags(doc, entities_cleared)

entities_x = biluo_tags_to_spans(doc, tags)
doc.ents = entities_x
gold_docs.append(doc)
DocBin(docs=gold_docs).to_disk("train_file.spacy")

Здесь докбин сохраняет вместе с остальным?

nlp, являющийся объектом Language необязательно содержит все эти свойства, Вы можете создать модель с нуля, например и оставить там только токенизацию и НЕР, для НЕР эти зависимости не обязательны. Если вы доучиваете готовую модель с частями речи и зависимостями , параметры этих объектов не изменяются, но скорее всего используются при обучении, а обучается только модуль ner модели spacy. Надеюсь меня поправят более знающие товарищи, если я ошибся. Пишу как понимаю

источник

17:43пожаловаться #4

SL

Shelest Listjev in Natural Language Processing

В моем случае, я использую:

nlp = spacy.load('ru_core_news_lg')

А там точно есть зависимости, постаги и т.д.

источник

18:01пожаловаться #5

IK

Igor Kucherevsky in Natural Language Processing

Эти зависимости формируются для документа после прохождения конвейера, вы же показываете формат данных использующийся для тренировки

источник

19:27пожаловаться #6

2021 March 06

VB

Valery Belyanin in Natural Language Processing

ищу готовую программу анализа частотности текста на русском языке (с лемматизатором и сохранением предложений - если есть). Не подскажите ли?

источник

00:01пожаловаться #7

OS

Oleg Serikov in Natural Language Processing

Valery Belyanin

ищу готовую программу анализа частотности текста на русском языке (с лемматизатором и сохранением предложений - если есть). Не подскажите ли?

Antconc?

источник

02:19пожаловаться #8

N

Natalia in Natural Language Processing

https://korpus.cz/quitaup/

источник

02:21пожаловаться #9

A

Aakash in Natural Language Processing

Hey,any one know here how recommender system algo is created?

источник

22:23пожаловаться #10

NG

Never Give up in Natural Language Processing

Hello I was trying to used SVM classifier to classified tweets sentiment analysis into postive ,negative and neutral where the classes are unbalanced and the highest number is neutral .the problem that I faced it not predicted the negative it gives me precision ,recall and accuracy of zero for the negative

источник

23:34пожаловаться #11

AW

Alex Wortega in Natural Language Processing

Gpt3 small обученная на 2ch
https://drive.google.com/file/d/1_cngWxqG7fNdak_82cGp1zCd2QpCkfAq/view?usp=drivesdk

источник

23:39пожаловаться #12

FF

Futorio Franklin in Natural Language Processing

Gpt3 small обученная на 2ch
https://drive.google.com/file/d/1_cngWxqG7fNdak_82cGp1zCd2QpCkfAq/view?usp=drivesdk

Можно даже понять, почему без примеров

источник

23:41пожаловаться #13

AW

Alex Wortega in Natural Language Processing

Futorio Franklin

Можно даже понять, почему без примеров

Теперь у меня есть нейродвачеры...

источник

23:41пожаловаться #14

FF

Futorio Franklin in Natural Language Processing

Я вот ради смеха дообучал ту же модель на токсик датасете мейла

источник

23:41пожаловаться #15

AW

Alex Wortega in Natural Language Processing

Futorio Franklin

Я вот ради смеха дообучал ту же модель на токсик датасете мейла

Я на бугуртах поставил обучать

источник

23:42пожаловаться #16

FF

Futorio Franklin in Natural Language Processing

на токсике бред получается один, видимо, слишком разрозненный и примитивный текст

источник

23:43пожаловаться #17

T

Teemoor in Natural Language Processing

Gpt3 small обученная на 2ch
https://drive.google.com/file/d/1_cngWxqG7fNdak_82cGp1zCd2QpCkfAq/view?usp=drivesdk

источник

23:43пожаловаться #18

AW

Alex Wortega in Natural Language Processing

#нейрошит
-кто ты, а?

-В мире есть люди с ограниченными физическими возможностями. Они живут и работают в домах-интернатах или обычных квартирах.Они могут гулять на улице без шапки по выходным дням – им достаточно выйти из дома».

источник

23:43пожаловаться #19

FF

Futorio Franklin in Natural Language Processing

Futorio Franklin

на токсике бред получается один, видимо, слишком разрозненный и примитивный текст

Сколько не крутил топ k топ n количество бимов и температуры

источник

23:43пожаловаться #20