Size: a a a

Natural Language Processing

2019 December 26

B

Brenoritvrezorkre in Natural Language Processing
И ещё Денис написал, что построение формальных моделей не является самоцелью. Это неправильно или не очень корректно. В формальной семантике это является самоцелью, так как именно построение формальных моделей позволяет строго установить семантические отношения. Конечно, эти формальные модели строятся не просто так и не о чём угодно.
источник

B

Brenoritvrezorkre in Natural Language Processing
Хомский давал в своём интервью очень хорошее сравнение, позволяющее разделять I и E.
источник

B

Brenoritvrezorkre in Natural Language Processing
Сам Хомский в своём интервью сравнивает это с арифметикой и арифметическими алгоритмами. Набор правил, используемых и манипулируемых понятий составляет предмет арифметики, и аксиомы Пеано являются формализацией её фрагмента. То же, каким образом что-либо мы можем подсчитать, как перевести один набор данных в другие — предмет арифметических алгоритмов.
источник

B

Brenoritvrezorkre in Natural Language Processing
Например, говорит он же, чтобы сложить 8 и 5, можно использовать такой алгоритм:

x = 10 - 8;
y = 5 - x;
z = 10 + y.

Ответом будет z.

Это не арифметика.
источник

B

Brenoritvrezorkre in Natural Language Processing
10 + 5 - 10 + 8
источник

B

Brenoritvrezorkre in Natural Language Processing
Так вот, подобное, но уже относительно использования человеческих языков, генеративистов не очень интересует. Это может быть элементом косвенного интереса. Например, нас может заинтересовать, почему здесь используется 10 и имеет ли это значение при исследовании арифметики.
источник

B

Brenoritvrezorkre in Natural Language Processing
Отличие от арифметики такое, что мы не знаем аксиом Пеано здесь, они от нас принципиально не зависят, и мы пытаемся их восстановить через такие-то наборы свидетельств и теоретические допущения, что так мы говорим, например, а так — будет просто бессмыслица (в некотором роде).
источник

B

Brenoritvrezorkre in Natural Language Processing
Вряд ли эти две категории в лингвистике можно разделить именно строго, так как та же коммуникация вполне может влиять и вполне себе влияет на грамматические правила, постепенно, и в итоге язык меняется (функционалисты могут приводить такие примеры). Но это ладно, ведь мы можем это описать как элементы функционирования знаковой системы, абстрагировавшись от тех, кто это запускает; более важным является то, что часто не ясно, идёт в данном случае речь о знаковой системе или же об употреблении. Часто выходят какие-то смешанные данные, но потом мы постепенно теоретически разделяем. Но граница существует: одно про абстрактные правила, в абстрактном представлении ни от кого не зависящие, другое про речь, наши мотивы при нарушении правил, про конвенциональность, общение, сленг и так далее.
источник

B

Brenoritvrezorkre in Natural Language Processing
Так вот, тезаурусы скорее отражают способы нашего общения при составлении тезаурусов и упрощают некоторые алгоритмы, чем являются чем-то теоретически значимым. Тут это всего лишь набор пустых помеченных данных, которые ещё нужно привести к каким-то сырым данным, которые можно нормально обрабатывать.
источник

B

Brenoritvrezorkre in Natural Language Processing
Я закончил в этот раз.
источник

YB

Yuri Baburov in Natural Language Processing
а подумай вот над чем: а нейросеть не пытается своей генерализацией внутри эту "теорию объясняющую синтаксис/семантику/прагматику языка" построить? или нужно чтобы теория была именно вербализована?
а человек своим пониманием языка не строит ли внутри себя эту теорию, может он просто не умеет её правильно вербализовывать?
источник

YB

Yuri Baburov in Natural Language Processing
вообще я это вижу из твоего описания как разницу именно между практикой (использования языка) и теорией (использования языка), только описанную через другие понятия.
источник

YB

Yuri Baburov in Natural Language Processing
и тут ответ будет ровно такой же, как с построением общего ИИ: нам не хватает инструментов, чтобы строить устойчивые вербализованные модели чего-либо более сложного чем простая статистика с помощью алгоритмов, включая алгоритмы DL. то есть сейчас твоя задача просто неразрешима. но принципиально этой границы тем не менее нет, и человек (точнее, скорее сообщество людей) медленно и педантично за десятилетия, используя современные методы научной деятельности и научного познания, такую теорию строит в каждой области человеческого знания, но вот компьютеру пока до этого никак не дотянуться.
источник

B

Brenoritvrezorkre in Natural Language Processing
Yuri Baburov
а подумай вот над чем: а нейросеть не пытается своей генерализацией внутри эту "теорию объясняющую синтаксис/семантику/прагматику языка" построить? или нужно чтобы теория была именно вербализована?
а человек своим пониманием языка не строит ли внутри себя эту теорию, может он просто не умеет её правильно вербализовывать?
Нет, не пытается. Нейросети так не работают.
источник

YB

Yuri Baburov in Natural Language Processing
Brenoritvrezorkre
Нет, не пытается. Нейросети так не работают.
почему ты так считаешь?
по мне, использование языка человеком и обучение нейросети языку дистрибутивным методом достаточно близки по сути. а вот теория уже стоит особняком — без школы ты бы не знал ничего про подлежащие и сказуемые, существительные и глаголы, но нормально бы говорил.
источник

B

Brenoritvrezorkre in Natural Language Processing
Достаточно посмотреть математические модели нейросетей и узнать, что они делают, исходя из математических моделей.
источник

YB

Yuri Baburov in Natural Language Processing
Brenoritvrezorkre
Достаточно посмотреть математические модели нейросетей и узнать, что они делают, исходя из математических моделей.
то есть, у тебя есть уверенность, что человек действует с языком по теории?
но ребёнок же разговаривает, не зная теории
источник

B

Brenoritvrezorkre in Natural Language Processing
В смысле? О чём ты?
источник

B

Brenoritvrezorkre in Natural Language Processing
Я про ИНН говорил
источник

YB

Yuri Baburov in Natural Language Processing
причём тут мат модель нейросети вообще?
источник