Size: a a a

Язык программирования Julia / Julia programming language

2020 December 27

RS

Roman Samarev in Язык программирования Julia / Julia programming language
Вторая ссылка - стэнфордовский учебник. Новее
источник

АО

Андрей Оськин... in Язык программирования Julia / Julia programming language
Я так подозреваю.
источник

RS

Roman Samarev in Язык программирования Julia / Julia programming language
Андрей Оськин
За прошедшгие 9 лет очень много чего успело поменяться.
Не совсем. Появилось направление нейросетевой обработки текстов. Лингвистика без лингвистов и всё такое. Но базовые методы остались
источник

RS

Roman Samarev in Язык программирования Julia / Julia programming language
Задачи бывают разные. Некоторые вещи принципиально не решаемы теми методами, которые популярны сейчас. Например анализ текста с позиции количества предложений, количество пассивных конструкций, повторения определённых частей речи и пр.
источник

АО

Андрей Оськин... in Язык программирования Julia / Julia programming language
Я сейчас наверное скажу вещь, от которой у знатока NLP слезы будут на глазах, но вроде как успехи GPT-3 показывают, что весь лингвистический аппарат не очень то и нужен. Правильно приготовленная достаточно большая сетка сможет все правила самостоятельно выучить из языка и не надо никакого ручного анализа делать.
источник

RS

Roman Samarev in Язык программирования Julia / Julia programming language
Анализ о котором я написал - это довольно типовые метрики анализа, например, резюме
источник

RS

Roman Samarev in Язык программирования Julia / Julia programming language
На счёт GPT-3, не углублялся в детали. Но: требует наличия существенно объема оперативки; обучить самому - слишком дорого, а доучить под нужную предметную область - не факт, что получится.
источник

RS

Roman Samarev in Язык программирования Julia / Julia programming language
Я не думаю, что подобные методы полностью вытеснят традиционные методы обработки текста. Они довольно дорогие в использовании, для начала. Даже при наличии предобученных моделей.
источник

RS

Roman Samarev in Язык программирования Julia / Julia programming language
Андрей Оськин
Я сейчас наверное скажу вещь, от которой у знатока NLP слезы будут на глазах, но вроде как успехи GPT-3 показывают, что весь лингвистический аппарат не очень то и нужен. Правильно приготовленная достаточно большая сетка сможет все правила самостоятельно выучить из языка и не надо никакого ручного анализа делать.
На счёт правил языка, кстати, есть одна фундаментальная проблема - изменение языка во времени. Не представляю как решают в GPT. Скорее всего, никак. А язык постоянно меняется. И правила могут стать неиспользуемыми лет через 100…. На литературном языке 18-го века мы уже не общаемся.
источник

RS

Roman Samarev in Язык программирования Julia / Julia programming language
У языка есть темпоральность, которую следует учитывать при загрузке источников. По-моему, этот факт просто игнорируется, а нейросеть обучается просто на актуальной статистике по всем найденным текстам
источник

RS

Roman Samarev in Язык программирования Julia / Julia programming language
Это к тому, что лингвисты, которые словари или правила готовят, эти моменты учтут
источник

KT

Kirill Tsaregorodtse... in Язык программирования Julia / Julia programming language
А когда-то лингвисты мечтали формальными грамматиками язык покрыть )
источник

RS

Roman Samarev in Язык программирования Julia / Julia programming language
Ну попытки то есть. Например вокруг сообщества https://opencog.org/ построить автоматическое средство построения грамматики языка.

http://aigents.com/papers/2020/InterpretableLanguageProcessing2020.pdf
источник

АО

Андрей Оськин... in Язык программирования Julia / Julia programming language
Хочется высказаться, но так как о предметной области у меня знание типичного прохожего с улицы, то промолчу 😊))))

В любом случае, если будут какие-то наработки и где-то что-то можно будет поправить/оптимизировать/доработать, то будет интересно помочь.

Просто возвращаясь к тому, что я говорил вначале - просто чтение статей/книг недостаточно. Вот например в книжке "АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ И КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА" есть целая Часть V глава 2 про методы классификации без учителя. Ну и как бы в Julia есть Clustering.jl в котором все эти методы реализованы. Что с ними делать, и как это может помочь в практической задаче NLP - неясно.
источник

RS

Roman Samarev in Язык программирования Julia / Julia programming language
Практические наработки - это уже решение конкретных задач. Желательно с внедрением. Начиная со студенческих курсовых. Но даже с этим сейчас пока ещё проблема.
источник

AL

Anatoly Levenchuk in Язык программирования Julia / Julia programming language
Да, я давно говорю, что лингвистику нужно на свалку отправлять. При этом там ещё и такие материалы есть, которые масла в огонь подливают (в них нейро-символические модели уступают чисто нейросеткам, то есть символьные представления, которые вроде как помогают — вот не помогают!): https://www.deepmind.com/research/publications/Object-based-attention-for-spatio-temporal-reasoning-Outperforming-neuro-symbolic-models-with-flexible-distributed-architectures
источник

RS

Roman Samarev in Язык программирования Julia / Julia programming language
Если что, я тоже не лингвист. Просто первая область деятельности, в которую я погрузился, была область информационно поисковых систем и полнотекстовый поиск + сопутствующая обработка.
источник

AL

Anatoly Levenchuk in Язык программирования Julia / Julia programming language
Вообще, кто хочет обзоров свежих по обсуждаемым вопросам универсальной алгоритмики aka AI (там, правда, не поминается язык), глядите https://ailev.livejournal.com/1548016.html
источник
2020 December 28

АО

Андрей Оськин... in Язык программирования Julia / Julia programming language
Интересный туториал, нашёл его случайно в твиттере, не видел этих ребят в обычных каналах.

https://htmlpreview.github.io/?https://github.com/probcomp/Genify.jl/blob/main/tutorial/tutorial.html

Там начинается про Probabilistic Programming, но потом они переходят на то, как можно модифицировать код функции с помощью IRTools и это конечно очень интересно. Вообще, помимо обычного языка в Джулии есть ещё этот огромный пласт вещей типа Cassette которые позволяют совершенно фантастические вещи делать. Когда ты пишешь один код, а он потом переписывается во что-то другое и обучения решать задачи, которых раньше решать не умел.
источник

KT

Kirill Tsaregorodtse... in Язык программирования Julia / Julia programming language
источник