Телеграмм чат группы natural_language_processing страница 716

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Natural Language Processing

1710 membersпожаловаться на группу

2020 July 08

AK

Anton Kolonin in Natural Language Processing

Valentin Okhapkin

В том же spaCy имеется свойство токена ancestors. Позволяет выявить полную группу связанных слов. https://spacy.io/api/token#ancestors

Token · spaCy API Documentation

An individual token — i.e. a word, punctuation symbol, whitespace, etc.

Возможность формального представления (в том числе ручных валидации и корректировки) языковых моделей spacy предоставаляет? Если да - дайте ссылку на английскую грамматику в виде файла.

источник

11:24пожаловаться #1

VO

Valentin Okhapkin in Natural Language Processing

его недостаточно, он все придаточные предложения и обороты подтянет, нужно ограничиваться по типам связей.

Отсечь эти придаточные паттерном dep_ по условию

источник

11:25пожаловаться #2

YB

Yuri Baburov in Natural Language Processing

Возможность формального представления (в том числе ручных валидации и корректировки) языковых моделей spacy предоставаляет? Если да - дайте ссылку на английскую грамматику в виде файла.

у вас нейронная модель,
вы можете датасет менять как угодно,
но потом модель придётся переучивать целиком (или частично, переобучая для исправленных примеров).

источник

11:25пожаловаться #3

AK

Anton Kolonin in Natural Language Processing

у вас нейронная модель,
вы можете датасет менять как угодно,
но потом модель придётся переучивать целиком (или частично, переобучая для исправленных примеров).

Зачем тогда вы это пишете? Я же сразу сказал, что это не интересует еще в прошлой дискуссии. Смысл отвечать на вопросы, которые никто не задавал?

источник

11:26пожаловаться #4

YB

Yuri Baburov in Natural Language Processing

Зачем тогда вы это пишете? Я же сразу сказал, что это не интересует еще в прошлой дискуссии. Смысл отвечать на вопросы, которые никто не задавал?

а, я вас неправильно понял. я думал вам на выходе нужна грамматика, а не синтаксис в явном виде задавать.

источник

11:27пожаловаться #5

AK

Anton Kolonin in Natural Language Processing

а, я вас неправильно понял. я думал вам на выходе нужна грамматика, а не синтаксис в явном виде задавать.

Юрий, уже который раз вы пытаетесь очень бурно, многословно и всесторонне отвечать на вопросы, даже не вникнув в их смысл. Уж извините. Еще раз - вот контекст вопроса https://github.com/aigents/aigents-java/issues/22 - Да - нам нужно как задавать грамматики вручную, так и иметь возможность глазами посматривать и править грамматики полученные из "нейросетевых" моделей.

Natural language production based on formal grammar · Issue #22 · aigents/aigents-java

Overview: In the end, ideally, we want the natural language text to be produced in a quality higher than provided by modern conversational intelligence chatbots (such as https://replika.ai/ ) howev...

источник

11:35пожаловаться #6

YB

Yuri Baburov in Natural Language Processing

Юрий, уже который раз вы пытаетесь очень бурно, многословно и всесторонне отвечать на вопросы, даже не вникнув в их смысл. Уж извините. Еще раз - вот контекст вопроса https://github.com/aigents/aigents-java/issues/22 - Да - нам нужно как задавать грамматики вручную, так и иметь возможность глазами посматривать и править грамматики полученные из "нейросетевых" моделей.

Natural language production based on formal grammar · Issue #22 · aigents/aigents-java

Overview: In the end, ideally, we want the natural language text to be produced in a quality higher than provided by modern conversational intelligence chatbots (such as https://replika.ai/ ) howev...

"Какие есть альтернативы с формальными (читаемыми и редактируемыми) грамматиками?" вот это я понял неоднозначно.

источник

11:35пожаловаться #7

YB

Yuri Baburov in Natural Language Processing

Юрий, уже который раз вы пытаетесь очень бурно, многословно и всесторонне отвечать на вопросы, даже не вникнув в их смысл. Уж извините. Еще раз - вот контекст вопроса https://github.com/aigents/aigents-java/issues/22 - Да - нам нужно как задавать грамматики вручную, так и иметь возможность глазами посматривать и править грамматики полученные из "нейросетевых" моделей.

Natural language production based on formal grammar · Issue #22 · aigents/aigents-java

Overview: In the end, ideally, we want the natural language text to be produced in a quality higher than provided by modern conversational intelligence chatbots (such as https://replika.ai/ ) howev...

после вашего объяснения стало понятнее

источник

11:36пожаловаться #8

AK

Anton Kolonin in Natural Language Processing

Вот здесь подробно описан наш подход https://www.youtube.com/watch?v=J9u2V2Mn42w - если интерсно - послушайте. Если не интересно, нет смысла тратить время на переписку. Замечу только, что лексическую неоднозначность LG позволяет устранять - изучите матчасть - чем "saw.v" отличается от "saw.n". Семантическую неоднозначность LG не позволяет устранять и это действительно боль, но я в данной дискуссии про это не спрашивал 😊

Unsupervised Understandable Language Learning - по-русски

Автоматическое формирование языковых человеко-читаемых языковых моделей (грамматик и онтологий) обучением на неразмеченных текстовых корпусах в проектах OpenCog и SingularityNET, а также - как это может использоваться в проекте Aigents - рассказывает Антон Колонин

источник

11:38пожаловаться #9

YB

Yuri Baburov in Natural Language Processing

Вот здесь подробно описан наш подход https://www.youtube.com/watch?v=J9u2V2Mn42w - если интерсно - послушайте. Если не интересно, нет смысла тратить время на переписку. Замечу только, что лексическую неоднозначность LG позволяет устранять - изучите матчасть - чем "saw.v" отличается от "saw.n". Семантическую неоднозначность LG не позволяет устранять и это действительно боль, но я в данной дискуссии про это не спрашивал 😊

Unsupervised Understandable Language Learning - по-русски

Автоматическое формирование языковых человеко-читаемых языковых моделей (грамматик и онтологий) обучением на неразмеченных текстовых корпусах в проектах OpenCog и SingularityNET, а также - как это может использоваться в проекте Aigents - рассказывает Антон Колонин

а вот если у вас есть есть несколько разных значений в одной части речи ? и у них разная прикрепляемость...
и это всё называется "лексическая неоднозначность", как мне кажется.

источник

11:39пожаловаться #10

VO

Valentin Okhapkin in Natural Language Processing

Возможность формального представления (в том числе ручных валидации и корректировки) языковых моделей spacy предоставаляет? Если да - дайте ссылку на английскую грамматику в виде файла.

К сожалению, данными в виде файла не обладаю. Могу лишь сказать, что spaCy дает возможность вести разработку своих языковых моделей. Обратите внимание на разделы Tag map и Morph rules. Вероятно, это близко к тому, что вы ищете. https://spacy.io/usage/adding-languages

источник

11:42пожаловаться #11

YB

Yuri Baburov in Natural Language Processing

а вот если у вас есть есть несколько разных значений в одной части речи ? и у них разная прикрепляемость...
и это всё называется "лексическая неоднозначность", как мне кажется.

там saw.v.1 и saw.v.2 нету, случаем? "видел" vs "пилить".
( i saw with a saw — я пилю пилой)

источник

11:42пожаловаться #12

YB

Yuri Baburov in Natural Language Processing

Valentin Okhapkin

К сожалению, данными в виде файла не обладаю. Могу лишь сказать, что spaCy дает возможность вести разработку своих языковых моделей. Обратите внимание на разделы Tag map и Morph rules. Вероятно, это близко к тому, что вы ищете. https://spacy.io/usage/adding-languages

напрямую возможные фреймы глаголов в spacy действительно нельзя задавать... (фреймы в русском языке: https://github.com/olesar/framebank )
но я сомневаюсь, что кто-то для всего языка их сможет задать, особенно с учётом размытости норм языка и десятков миллионов частных случаев.
Я.Г. Тестелец целую книгу посвятил таким примерам ( https://studfile.net/preview/2675241/page:5/ и далее )

olesar/framebank

Russian FrameBank offline resources. Contribute to olesar/framebank development by creating an account on GitHub.

источник

11:49пожаловаться #13

AK

Anton Kolonin in Natural Language Processing

там saw.v.1 и saw.v.2 нету, случаем? "видел" vs "пилить".
( i saw with a saw — я пилю пилой)

Не помню - откройте сами грамматику по ссылке и посмотрите - в этом вся прелесть 😊 Кстати, вот манускрипт основного текущего идеолога LG https://arxiv.org/abs/1901.01341

источник

11:50пожаловаться #14

AK

Anton Kolonin in Natural Language Processing

напрямую возможные фреймы глаголов в spacy действительно нельзя задавать... (фреймы в русском языке: https://github.com/olesar/framebank )
но я сомневаюсь, что кто-то для всего языка их сможет задать, особенно с учётом размытости норм языка и десятков миллионов частных случаев.
Я.Г. Тестелец целую книгу посвятил таким примерам ( https://studfile.net/preview/2675241/page:5/ и далее )

olesar/framebank

Russian FrameBank offline resources. Contribute to olesar/framebank development by creating an account on GitHub.

> но я сомневаюсь, что кто-то для всего языка их сможет задать, особенно с учётом размытости норм языка и десятков миллионов частных случаев.
А это уже другая тема - я её обсуждаю как раз в видео выше. Речь идет не о ручном задании а об интерпретируемом представлении 😉

источник

11:51пожаловаться #15

YB

Yuri Baburov in Natural Language Processing

> но я сомневаюсь, что кто-то для всего языка их сможет задать, особенно с учётом размытости норм языка и десятков миллионов частных случаев.
А это уже другая тема - я её обсуждаю как раз в видео выше. Речь идет не о ручном задании а об интерпретируемом представлении 😉

так интерпретируемое представление и в виде UD может быть, как я вам показал.
просто не будет возможности явно добавлять правила, кроме как через примеры разметки.

источник

11:53пожаловаться #16

YB

Yuri Baburov in Natural Language Processing

да, в русском языке В.А. Тузов создавал подобные фреймовые правила.
у него был парсер, но он в заброшенном виде сейчас.

источник

11:56пожаловаться #17

YB

Yuri Baburov in Natural Language Processing

http://www.dialog-21.ru/digest/2001/articles/tuzov/
там был уровень проработки кстати на порядок выше, чем у LinkGrammar

источник

11:57пожаловаться #18

AG

Alex Gruzdev in Natural Language Processing

Помогите установить fasttext. Создал окружение под анакондой для установки. По умолчанию python 2.7. Установка fasttext не проходит, требует python >= 3.6. Создал другое окружение с python 3.7. Установка завершилась. Но теперь модуль fasttext не найден.

источник

12:20пожаловаться #19

MT

Mikhail Tikhomirov in Natural Language Processing

Добрый день!
Возникло желание обучаться на большом количестве данных, которое не влезает в оперативную память, используя pytorch + transformers на нескольких гпу. Сейчас используется де факто код от transformers с DistributedSampler + DataLoader которые работают поверх TensorDataset.

Хочется что-то типа асинхронного подхода, когда данные подгружаются по мере требования, но заранее. Есть ли у кого опыт \ пример подобного подхода?

источник

12:25пожаловаться #20