Size: a a a

Natural Language Processing

2019 December 26

YB

Yuri Baburov in Natural Language Processing
Yuri Baburov
+
Но ты занимался российской наукой, я согласен, что в Англии этот термин в этом значении пришёл позже.
https://ru.m.wikipedia.org/wiki/%D0%9F%D0%BE%D1%80%D0%BE%D0%B6%D0%B4%D0%B0%D1%8E%D1%89%D0%B0%D1%8F_%D1%81%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D0%BA%D0%B0 скажем, это в Америке, где влияние Хомского было сильнее.
Плюс мы говорим о том, что бывает семантика слов, фраз, предложений, текстов, и это тоже немного разные вещи.
источник

YB

Yuri Baburov in Natural Language Processing
Brenoritvrezorkre
Вот берём мы и строим идеальную дистрибутивную семантическую модель относительно некоторого датасета. Она различает разную близость по содержанию и близость по употреблению. Что дальше мы можем здесь сделать? Я к Денису. Относительно дистрибутивной семантики это уже всё.
После этого на практике переходят к какой-то онтологии, то есть, от семантики идут к прагматике
источник

DK

Denis Kirjanov in Natural Language Processing
Brenoritvrezorkre
Вот берём мы и строим идеальную дистрибутивную семантическую модель относительно некоторого датасета. Она различает разную близость по содержанию и близость по употреблению. Что дальше мы можем здесь сделать? Я к Денису. Относительно дистрибутивной семантики это уже всё.
смотри, мне кажется, мы тут все согласны в целом и не согласны с какими-то вопросами формальных определений

всем, кажется, очевидно, что какие-то свойства, связанные с семантикой этих слов такая моделька уловит.

понятно, что никаких "почему" язык так устроен ей задавать бессмысленно. В этом смысле это не семантика. В смысле того, что она ловит какие-то семантические свойства, она семантическая.
источник

YB

Yuri Baburov in Natural Language Processing
Brenoritvrezorkre
Не объяснено, например, почему слово "лосось" близко к слову "рыба". А этим, казалось бы, что занимается?
Кроме дистрибутивной семантики есть семантические словари (тезаурусы), часто как часть онтологии предметной области/задачи.
источник

B

Brenoritvrezorkre in Natural Language Processing
Yuri Baburov
После этого на практике переходят к какой-то онтологии, то есть, от семантики идут к прагматике
Причём тут прагматика, я не понимаю
источник

YB

Yuri Baburov in Natural Language Processing
Brenoritvrezorkre
Причём тут прагматика, я не понимаю
Потому что онтология строится для предметной области. Прагматика изучает слова, фразы, предложения в контекте их использования же.
источник

YB

Yuri Baburov in Natural Language Processing
Поскольку тяжело идти вглубь, то задачи делят на две группы: где нашей куцей легко получаемой семантической информации хватает, и на нерешённые :)
источник

B

Brenoritvrezorkre in Natural Language Processing
Denis Kirjanov
смотри, мне кажется, мы тут все согласны в целом и не согласны с какими-то вопросами формальных определений

всем, кажется, очевидно, что какие-то свойства, связанные с семантикой этих слов такая моделька уловит.

понятно, что никаких "почему" язык так устроен ей задавать бессмысленно. В этом смысле это не семантика. В смысле того, что она ловит какие-то семантические свойства, она семантическая.
Ну это может быть в этом отношении семантикой только тогда, когда научатся различать близость по содержанию от близости по употреблению, как и синонимию от других форм близости по содержанию. Сейчас дистрибутивная семантика вообще этого делать не умеет.

Но если представим идеальную дистрибутивную семантику, по классификации Хомского это всё равно E-language, просто мы выловили некоторые факты о том, что нам только предстоит изучать.
источник

DK

Denis Kirjanov in Natural Language Processing
Yuri Baburov
Потому что онтология строится для предметной области. Прагматика изучает слова, фразы, предложения в контекте их использования же.
нет, онтология никакого отношения к прагматике не имеет, она ж у тебя бесконтекстная
источник

B

Brenoritvrezorkre in Natural Language Processing
Yuri Baburov
Потому что онтология строится для предметной области. Прагматика изучает слова, фразы, предложения в контекте их использования же.
Пожалуй, об онтологиях у вас тоже странное представление )
источник

DK

Denis Kirjanov in Natural Language Processing
Brenoritvrezorkre
Ну это может быть в этом отношении семантикой только тогда, когда научатся различать близость по содержанию от близости по употреблению, как и синонимию от других форм близости по содержанию. Сейчас дистрибутивная семантика вообще этого делать не умеет.

Но если представим идеальную дистрибутивную семантику, по классификации Хомского это всё равно E-language, просто мы выловили некоторые факты о том, что нам только предстоит изучать.
ну это вопрос точки зрения
с моей точки зрения, если мы вылавливаем какие-то семантические отношения между словами с определенном качеством, то уже неважно, как именно мы их выучили -- мы сделали что-то, моделирующее семантику.
источник

YB

Yuri Baburov in Natural Language Processing
Denis Kirjanov
нет, онтология никакого отношения к прагматике не имеет, она ж у тебя бесконтекстная
Ну, вот тут можно делить и так и сяк. Контекста слов там нет, но обычно там не все значения есть, и это тоже уже имеет отношение к прагматике языка.
Если там есть термин "приветствие" -- это обозначение смысла фраз приветствия и может быть одновременно набор фраз, обозначающих приветствие.
Хорошо, давай это будем называть семантикой задачи/предметной области.
источник

B

Brenoritvrezorkre in Natural Language Processing
Denis Kirjanov
ну это вопрос точки зрения
с моей точки зрения, если мы вылавливаем какие-то семантические отношения между словами с определенном качеством, то уже неважно, как именно мы их выучили -- мы сделали что-то, моделирующее семантику.
Ну пока мы ещё не сделали, так как для семантики это всё равно довольно-таки сырые данные. Например, семантическая несинонимичная связь в рамках "лосось — рыба" устроена иначе, чем столь же несинонимичная связь в рамках "лес — поляна".
источник

YB

Yuri Baburov in Natural Language Processing
Brenoritvrezorkre
Ну это может быть в этом отношении семантикой только тогда, когда научатся различать близость по содержанию от близости по употреблению, как и синонимию от других форм близости по содержанию. Сейчас дистрибутивная семантика вообще этого делать не умеет.

Но если представим идеальную дистрибутивную семантику, по классификации Хомского это всё равно E-language, просто мы выловили некоторые факты о том, что нам только предстоит изучать.
Ну а у тезауруса же этой проблемы дистрибутивной семантики нет?
источник

YB

Yuri Baburov in Natural Language Processing
Yuri Baburov
Ну а у тезауруса же этой проблемы дистрибутивной семантики нет?
Скажем так, у маппинга слов текста на тезаурус
источник

B

Brenoritvrezorkre in Natural Language Processing
В свою очередь, вот может дистрибутивная семантика отлавливать конкретно синонимию.

"Холостяк — неженатый взрослый мужчина" отлично от "Париж — Столица Франции", и обе отличны от "Вода — H2O", и все эти отличны от более сложных и неоднозначных вещей по типу "Масса (в одних контекстах) — масса (в других)"
источник

B

Brenoritvrezorkre in Natural Language Processing
Так что для семантика всё то, что можно было бы ожидать перспективного конкретно от дистрибутивной семантики, это где-то в лучшем случае хороший фильтр совершенной бессмыслицы в просто кучу необработанных данных. Вряд ли можно ожидать, что дистрибутивная семантика смогла бы отлавливать такого рода различия. Уже было бы хорошо, если бы она научилась хотя бы выделять синонимию.
источник

YB

Yuri Baburov in Natural Language Processing
Brenoritvrezorkre
Так что для семантика всё то, что можно было бы ожидать перспективного конкретно от дистрибутивной семантики, это где-то в лучшем случае хороший фильтр совершенной бессмыслицы в просто кучу необработанных данных. Вряд ли можно ожидать, что дистрибутивная семантика смогла бы отлавливать такого рода различия. Уже было бы хорошо, если бы она научилась хотя бы выделять синонимию.
Просто современная семантика <> дистрибутивная семантика
источник

B

Brenoritvrezorkre in Natural Language Processing
Вы говорите о какой-то современной семантике, только сегодня, по всей видимости, узнав, что такое семантика (по крайней мере услышав про формальную семантику).
источник

YB

Yuri Baburov in Natural Language Processing
Другие задачи типа WSD решают другими методами, с использованием дистр сем, но не одной ей. А вы прямо знак равенства ставите
источник