Size: a a a

Natural Language Processing

2019 December 26

YB

Yuri Baburov in Natural Language Processing
давайте проведём ещё одно деление тогда
источник

YB

Yuri Baburov in Natural Language Processing
есть модели дистрибутивной семантики, где дистрибутивность — относится именно к способу обучения на большом корпусе текстов
источник

YB

Yuri Baburov in Natural Language Processing
а есть модели другие, где тоже используется ML/DL, но моделируются именно какие-то способности человека, по обратной связи от человека.
источник

YB

Yuri Baburov in Natural Language Processing
например, возьмём sentiment analysis как возможно простейший пример
источник

B

Brenoritvrezorkre in Natural Language Processing
Ну вот рассмотрим использование тезауруса
источник

YB

Yuri Baburov in Natural Language Processing
или да, использование тезауруса и WSD (word sense disambiguation)
источник

YB

Yuri Baburov in Natural Language Processing
всё же тезаурус это уже в том числе и про какие-то внутренние представление понятий в мозгу человека?
источник

B

Brenoritvrezorkre in Natural Language Processing
Тезаурус — это размеченное самими людьми. Там мы имеем толковый словарь и список по некоторому пониманию близких слов. Но если мы изучаем тезаурусы, то это всё равно во многом про E-language, так как там мы будем иметь:

1. Во-первых, модель толкового словаря очень плохо подходит для описания содержания слов и скорее является некоторым набором удобных для употребления и чтения дескрипций;

2. Во-вторых, близкие слова (что характеризует тезаурус) составляются всё так же по жёстко не закреплённым критериям, и мы не можем, просто посмотрев на тезаурус, а тем более прошерстив это компьютером, сказать, почему в данном случае близкие слова имеют такой набор пар, а в другом — другой.
источник

B

Brenoritvrezorkre in Natural Language Processing
Так что это пусть и отличается от дистрибутивной семантики, но это всё равно набор сырых данных
источник

YB

Yuri Baburov in Natural Language Processing
а если люди размечают тезаурусом смыслы слов во фразах, а не определения дают?
источник

B

Brenoritvrezorkre in Natural Language Processing
Пример?
источник

B

Brenoritvrezorkre in Natural Language Processing
Просто дайте конкретный источник, и я покажу, почему в этом конкретном источнике всё равно сырые данные.
источник

YB

Yuri Baburov in Natural Language Processing
"люди стали<"стали" в значении "стать", т.е. становиться> веселее"
источник

YB

Yuri Baburov in Natural Language Processing
я так понял, не сырым это будет лишь в случае, когда мы будем сканировать человеческий мозг.
источник

B

Brenoritvrezorkre in Natural Language Processing
Ну вот указали некоторые люди, что "стать" — это в значении "становиться". Может, кому-то стало от этого легче, но не семантику. Поскольку не ясно, что значит "становиться". То есть, бессмысленные данные, может, стали чуть менее бессмысленными, но не для того, кто занимается meaning, reference и другими вещами (независимо от тусовки).
источник

B

Brenoritvrezorkre in Natural Language Processing
Наверное, лучше так сказать: не семантицисту. Иначе путаница может быть.
источник

B

Brenoritvrezorkre in Natural Language Processing
Yuri Baburov
я так понял, не сырым это будет лишь в случае, когда мы будем сканировать человеческий мозг.
Просканировав человеческий мозг, мы получим ещё одну большую кучу сырых необработанных данных, только других
источник

BZ

Below Zero in Natural Language Processing
Brenoritvrezorkre
Ну вот указали некоторые люди, что "стать" — это в значении "становиться". Может, кому-то стало от этого легче, но не семантику. Поскольку не ясно, что значит "становиться". То есть, бессмысленные данные, может, стали чуть менее бессмысленными, но не для того, кто занимается meaning, reference и другими вещами (независимо от тусовки).
а что значит "заниматься meaning"?
источник

B

Brenoritvrezorkre in Natural Language Processing
Ну вот в данном случае сейчас приведу пример
источник

B

Brenoritvrezorkre in Natural Language Processing
Вот хорошо, добрые люди установили, что "стали" — это "стать", т.е. "становиться" (вообще говоря, на самом деле у них разное содержание, так что это разве что косвенная помощь).

Семантицисту же интересно, что такое "становиться", "стали" и "стать". Например, он сразу обратит внимание на роль в содержании этих слов того же

https://en.wikipedia.org/wiki/Grammatical_aspect
источник