Size: a a a

Natural Language Processing

2020 July 17

РН

Роман Некрасов... in Natural Language Processing
Eugene Solomatin
Без разметки и онтологий любая база " сырых" текстов это только Информационная помойка.
К сожалению, в реальном мире всё сурово. Датасеты с учителем большая редкость. В крайнем случае, лишь частичное привлечение учителя.
источник

ES

Eugene Solomatin in Natural Language Processing
I Апрельский
что под онтологией понимается?
Классика..


Ontology learning (ontology extraction, ontology generation, or ontology acquisition) is the automatic or semi-automatic creation of ontologies, including extracting the corresponding domain's terms and the relationships between the concepts that these terms represent from a corpus of natural language text, and encoding them with an ontology language for easy retrieval.
источник

ES

Eugene Solomatin in Natural Language Processing
Роман Некрасов
К сожалению, в реальном мире всё сурово. Датасеты с учителем большая редкость. В крайнем случае, лишь частичное привлечение учителя.
Есть процедуры автоматизации построения онтологий.
И мы ими активно пользуемся..
источник

ES

Eugene Solomatin in Natural Language Processing
Много хороших обзоров на эту тему..
Например, https://cyberleninka.ru/article/n/metody-avtomaticheskogo-postroeniya-ontologiy
источник

ES

Eugene Solomatin in Natural Language Processing
I Апрельский
FB, например, генерирует вопросы, маскируя слова и таким образом избавляет от необходимости разметки

https://github.com/facebookresearch/UnsupervisedQA
Спасибо. Отличная ссылка!
источник

РН

Роман Некрасов... in Natural Language Processing
Eugene Solomatin
Есть процедуры автоматизации построения онтологий.
И мы ими активно пользуемся..
web 2.0 умер вместе со стандартом OWL. изучал эту тему. к сожалению, глубокий скепсис по сравнению с глубинным обучением. но спасибо за материалы. изучу. глубинное обучение привлекает тем, что можно масштабировать не только на языковые модели, но и на любые символьные, включая кодирование временных рядов.
источник
2020 July 18

ES

Eugene Solomatin in Natural Language Processing
Роман Некрасов
web 2.0 умер вместе со стандартом OWL. изучал эту тему. к сожалению, глубокий скепсис по сравнению с глубинным обучением. но спасибо за материалы. изучу. глубинное обучение привлекает тем, что можно масштабировать не только на языковые модели, но и на любые символьные, включая кодирование временных рядов.
🤝👍
источник

SS

Sergey Sikorskiy in Natural Language Processing
Eugene Solomatin
Много хороших обзоров на эту тему..
Например, https://cyberleninka.ru/article/n/metody-avtomaticheskogo-postroeniya-ontologiy
Спасибо. Действительно очень интересный обзор.
Можете порекомендоавть почитать что-то еще подобного уровня?
Можете порекомендовать чаты посвященные онтологиям?
TIA
источник

I

I Апрельский... in Natural Language Processing
думаю, что можно поискать про knowledge graph
например, http://kgb-workshop.org/
источник

I

I Апрельский... in Natural Language Processing
семантик веб не то чтобы умер. хайп прошел. но рисеч там идет: https://2020.eswc-conferences.org/accepted-papers/
источник

I

I Апрельский... in Natural Language Processing
а с последними успехами в нлп — внимание должно вернуться
источник

SS

Sergey Sikorskiy in Natural Language Processing
I Апрельский
думаю, что можно поискать про knowledge graph
например, http://kgb-workshop.org/
knowledge graph - это, IMHO, другое, хотя и похожее.
источник

I

I Апрельский... in Natural Language Processing
Да я и не говорю, что это одно и тоже. Я скорее имел в виду что методы близки. Но это я издалека смотрю -- приму уточнения с радостью
источник

OS

Oleg Serikov in Natural Language Processing
I Апрельский
а с последними успехами в нлп — внимание должно вернуться
хаха внимание
источник

I

I Апрельский... in Natural Language Processing
И любовь! 💞
источник

SS

Sergey Sikorskiy in Natural Language Processing
I Апрельский
Да я и не говорю, что это одно и тоже. Я скорее имел в виду что методы близки. Но это я издалека смотрю -- приму уточнения с радостью
IMHO, knowledge graph - это граф,  который связывает named entities из различных источников. Источником данных может быть и онтология (или сразу несколько разных онтологий). IMHO, точнее это было-бы назвать Linked Data. Термин "knowledge graph" - это чисто маркетинговое название от Google, который в свое время купил DBpedia, которая занималась тем, что извлекала данные из инфобоксов Wikipedia.
Но даже подлинкованные онтологии в knowledge graph содержат только отношения. Там нет правил.
Например: tableware
А вот кусочек из нормальной онтологии:

(subclass Tableware Device)
(documentation Tableware EnglishLanguage "&%Devices that are used in &%Ingesting (&%Eating
and/or &%Drinking) a meal.  This coves dishware, flatware, and glassware.")

(=>
 (instance ?T Tableware)
 (hasPurpose ?T
   (exists (?I)
     (and
       (instance ?I Ingesting)
       (instrument ?I ?T)))))
источник

I

I Апрельский... in Natural Language Processing
Sergey Sikorskiy
IMHO, knowledge graph - это граф,  который связывает named entities из различных источников. Источником данных может быть и онтология (или сразу несколько разных онтологий). IMHO, точнее это было-бы назвать Linked Data. Термин "knowledge graph" - это чисто маркетинговое название от Google, который в свое время купил DBpedia, которая занималась тем, что извлекала данные из инфобоксов Wikipedia.
Но даже подлинкованные онтологии в knowledge graph содержат только отношения. Там нет правил.
Например: tableware
А вот кусочек из нормальной онтологии:

(subclass Tableware Device)
(documentation Tableware EnglishLanguage "&%Devices that are used in &%Ingesting (&%Eating
and/or &%Drinking) a meal.  This coves dishware, flatware, and glassware.")

(=>
 (instance ?T Tableware)
 (hasPurpose ?T
   (exists (?I)
     (and
       (instance ?I Ingesting)
       (instrument ?I ?T)))))
Спасибо. А онтология -- это что такое?
источник

I

I Апрельский... in Natural Language Processing
Sergey Sikorskiy
IMHO, knowledge graph - это граф,  который связывает named entities из различных источников. Источником данных может быть и онтология (или сразу несколько разных онтологий). IMHO, точнее это было-бы назвать Linked Data. Термин "knowledge graph" - это чисто маркетинговое название от Google, который в свое время купил DBpedia, которая занималась тем, что извлекала данные из инфобоксов Wikipedia.
Но даже подлинкованные онтологии в knowledge graph содержат только отношения. Там нет правил.
Например: tableware
А вот кусочек из нормальной онтологии:

(subclass Tableware Device)
(documentation Tableware EnglishLanguage "&%Devices that are used in &%Ingesting (&%Eating
and/or &%Drinking) a meal.  This coves dishware, flatware, and glassware.")

(=>
 (instance ?T Tableware)
 (hasPurpose ?T
   (exists (?I)
     (and
       (instance ?I Ingesting)
       (instrument ?I ?T)))))
В примере я вижу
1) ряд сущностей (tableware, ingesting)
2) связанных отношениями (instance, hasPurpose)
3) какое-то дерево -- дерево вывода назову

То есть хочется предположить, что онтология -- это KG + вывод/правила вывода
источник

SS

Sergey Sikorskiy in Natural Language Processing
Онтология - это отношения + правила/логика.
Одни отношения - это просто таксономия.
источник

SS

Sergey Sikorskiy in Natural Language Processing
I Апрельский
В примере я вижу
1) ряд сущностей (tableware, ingesting)
2) связанных отношениями (instance, hasPurpose)
3) какое-то дерево -- дерево вывода назову

То есть хочется предположить, что онтология -- это KG + вывод/правила вывода
1, 2, и 3 пришли из онтологии. Скорее всего из WordNet.
источник