Телеграмм чат группы natural_language

Порождающая семантика

+
Но ты занимался российской наукой, я согласен, что в Англии этот термин в этом значении пришёл позже.

https://ru.m.wikipedia.org/wiki/%D0%9F%D0%BE%D1%80%D0%BE%D0%B6%D0%B4%D0%B0%D1%8E%D1%89%D0%B0%D1%8F_%D1%81%D0%B5%D0%BC%D0%B0%D0%BD%D1%82%D0%B8%D0%BA%D0%B0 скажем, это в Америке, где влияние Хомского было сильнее.
Плюс мы говорим о том, что бывает семантика слов, фраз, предложений, текстов, и это тоже немного разные вещи.

Wikipedia

Порожда́ющая сема́нтика, генерати́вная семантика — одно из направлений в теории трансформационных порождающих грамматик, ставившее целью построить модель языка по схеме «от значения к тексту» и «от текста к значению» . Представляла собой частный метод грамматического описания.

13:50пожаловаться #1

YB

Brenoritvrezorkre

Вот берём мы и строим идеальную дистрибутивную семантическую модель относительно некоторого датасета. Она различает разную близость по содержанию и близость по употреблению. Что дальше мы можем здесь сделать? Я к Денису. Относительно дистрибутивной семантики это уже всё.

После этого на практике переходят к какой-то онтологии, то есть, от семантики идут к прагматике

Denis Kirjanov in Natural Language Processing

13:52пожаловаться #2

DK

Brenoritvrezorkre

Вот берём мы и строим идеальную дистрибутивную семантическую модель относительно некоторого датасета. Она различает разную близость по содержанию и близость по употреблению. Что дальше мы можем здесь сделать? Я к Денису. Относительно дистрибутивной семантики это уже всё.

смотри, мне кажется, мы тут все согласны в целом и не согласны с какими-то вопросами формальных определений

всем, кажется, очевидно, что какие-то свойства, связанные с семантикой этих слов такая моделька уловит.

понятно, что никаких "почему" язык так устроен ей задавать бессмысленно. В этом смысле это не семантика. В смысле того, что она ловит какие-то семантические свойства, она семантическая.

13:52пожаловаться #3

YB

Brenoritvrezorkre

Не объяснено, например, почему слово "лосось" близко к слову "рыба". А этим, казалось бы, что занимается?

Кроме дистрибутивной семантики есть семантические словари (тезаурусы), часто как часть онтологии предметной области/задачи.

13:53пожаловаться #4

B

Brenoritvrezorkre in Natural Language Processing

После этого на практике переходят к какой-то онтологии, то есть, от семантики идут к прагматике

Причём тут прагматика, я не понимаю

13:54пожаловаться #5

YB

Brenoritvrezorkre

Причём тут прагматика, я не понимаю

Потому что онтология строится для предметной области. Прагматика изучает слова, фразы, предложения в контекте их использования же.

13:55пожаловаться #6

YB

Поскольку тяжело идти вглубь, то задачи делят на две группы: где нашей куцей легко получаемой семантической информации хватает, и на нерешённые :)

13:56пожаловаться #7

B

Brenoritvrezorkre in Natural Language Processing

Denis Kirjanov

смотри, мне кажется, мы тут все согласны в целом и не согласны с какими-то вопросами формальных определений

всем, кажется, очевидно, что какие-то свойства, связанные с семантикой этих слов такая моделька уловит.

понятно, что никаких "почему" язык так устроен ей задавать бессмысленно. В этом смысле это не семантика. В смысле того, что она ловит какие-то семантические свойства, она семантическая.

Ну это может быть в этом отношении семантикой только тогда, когда научатся различать близость по содержанию от близости по употреблению, как и синонимию от других форм близости по содержанию. Сейчас дистрибутивная семантика вообще этого делать не умеет.

Но если представим идеальную дистрибутивную семантику, по классификации Хомского это всё равно E-language, просто мы выловили некоторые факты о том, что нам только предстоит изучать.

Denis Kirjanov in Natural Language Processing

13:57пожаловаться #8

DK

Потому что онтология строится для предметной области. Прагматика изучает слова, фразы, предложения в контекте их использования же.

нет, онтология никакого отношения к прагматике не имеет, она ж у тебя бесконтекстная

13:57пожаловаться #9

B

Brenoritvrezorkre in Natural Language Processing

Потому что онтология строится для предметной области. Прагматика изучает слова, фразы, предложения в контекте их использования же.

Пожалуй, об онтологиях у вас тоже странное представление )

Denis Kirjanov in Natural Language Processing

13:57пожаловаться #10

DK

Brenoritvrezorkre

Ну это может быть в этом отношении семантикой только тогда, когда научатся различать близость по содержанию от близости по употреблению, как и синонимию от других форм близости по содержанию. Сейчас дистрибутивная семантика вообще этого делать не умеет.

Но если представим идеальную дистрибутивную семантику, по классификации Хомского это всё равно E-language, просто мы выловили некоторые факты о том, что нам только предстоит изучать.

ну это вопрос точки зрения
с моей точки зрения, если мы вылавливаем какие-то семантические отношения между словами с определенном качеством, то уже неважно, как именно мы их выучили -- мы сделали что-то, моделирующее семантику.

13:59пожаловаться #11

YB

Denis Kirjanov

нет, онтология никакого отношения к прагматике не имеет, она ж у тебя бесконтекстная

Ну, вот тут можно делить и так и сяк. Контекста слов там нет, но обычно там не все значения есть, и это тоже уже имеет отношение к прагматике языка.
Если там есть термин "приветствие" -- это обозначение смысла фраз приветствия и может быть одновременно набор фраз, обозначающих приветствие.
Хорошо, давай это будем называть семантикой задачи/предметной области.

14:02пожаловаться #12

B

Brenoritvrezorkre in Natural Language Processing

Denis Kirjanov

ну это вопрос точки зрения
с моей точки зрения, если мы вылавливаем какие-то семантические отношения между словами с определенном качеством, то уже неважно, как именно мы их выучили -- мы сделали что-то, моделирующее семантику.

Ну пока мы ещё не сделали, так как для семантики это всё равно довольно-таки сырые данные. Например, семантическая несинонимичная связь в рамках "лосось — рыба" устроена иначе, чем столь же несинонимичная связь в рамках "лес — поляна".

14:05пожаловаться #13

YB

Brenoritvrezorkre

Ну это может быть в этом отношении семантикой только тогда, когда научатся различать близость по содержанию от близости по употреблению, как и синонимию от других форм близости по содержанию. Сейчас дистрибутивная семантика вообще этого делать не умеет.

Но если представим идеальную дистрибутивную семантику, по классификации Хомского это всё равно E-language, просто мы выловили некоторые факты о том, что нам только предстоит изучать.

Ну а у тезауруса же этой проблемы дистрибутивной семантики нет?

14:05пожаловаться #14

YB

Ну а у тезауруса же этой проблемы дистрибутивной семантики нет?

Скажем так, у маппинга слов текста на тезаурус

14:05пожаловаться #15

B

Brenoritvrezorkre in Natural Language Processing

В свою очередь, вот может дистрибутивная семантика отлавливать конкретно синонимию.

"Холостяк — неженатый взрослый мужчина" отлично от "Париж — Столица Франции", и обе отличны от "Вода — H2O", и все эти отличны от более сложных и неоднозначных вещей по типу "Масса (в одних контекстах) — масса (в других)"

14:10пожаловаться #16

B

Brenoritvrezorkre in Natural Language Processing

Так что для семантика всё то, что можно было бы ожидать перспективного конкретно от дистрибутивной семантики, это где-то в лучшем случае хороший фильтр совершенной бессмыслицы в просто кучу необработанных данных. Вряд ли можно ожидать, что дистрибутивная семантика смогла бы отлавливать такого рода различия. Уже было бы хорошо, если бы она научилась хотя бы выделять синонимию.

14:13пожаловаться #17

YB

Brenoritvrezorkre

Так что для семантика всё то, что можно было бы ожидать перспективного конкретно от дистрибутивной семантики, это где-то в лучшем случае хороший фильтр совершенной бессмыслицы в просто кучу необработанных данных. Вряд ли можно ожидать, что дистрибутивная семантика смогла бы отлавливать такого рода различия. Уже было бы хорошо, если бы она научилась хотя бы выделять синонимию.

Просто современная семантика <> дистрибутивная семантика

14:13пожаловаться #18

B

Brenoritvrezorkre in Natural Language Processing

Вы говорите о какой-то современной семантике, только сегодня, по всей видимости, узнав, что такое семантика (по крайней мере услышав про формальную семантику).

14:14пожаловаться #19

YB

Другие задачи типа WSD решают другими методами, с использованием дистр сем, но не одной ей. А вы прямо знак равенства ставите