Size: a a a

Natural Language Processing

2019 December 26

YB

Yuri Baburov in Natural Language Processing
второй мозг вообще почти всегда помогает, так что я всегда за любые конструктивные обсуждения в любом (большом) количестве.
источник

ck

cnstntn kndrtv in Natural Language Processing
Может быть в slack переехать? Там есть каналы, ответы в сообщениях. Когда всё в одном чате - сообщения теряются и не очень удобно строить цепочки обсуждений.
источник

YB

Yuri Baburov in Natural Language Processing
cnstntn kndrtv
Может быть в slack переехать? Там есть каналы, ответы в сообщениях. Когда всё в одном чате - сообщения теряются и не очень удобно строить цепочки обсуждений.
можно, но один слэк в рамках ODS.ai уже есть, и практика показывает, что эти площадки дополняют друг друга — всегда находятся люди обсуждать и там и здесь. (мне кажется, в основном т.к. у канала в telegram намного выше обнаружимость)
источник

V

Victoria in Natural Language Processing
извините, подброшу шутку по сезону
источник

Р

Родион in Natural Language Processing
Всем привет, может знает кто - есть ли готовое решение по скоращениям русского языка, которое их разворачивает? (например адреса)
источник

Y

Yurii in Natural Language Processing
Yuri Baburov
спасибо. я тоже после похожего обсуждения в группе @AGIRussia подумываю теперь о том, чтобы к весне подготовить доклад о проблемах использования DL для общего ИИ и возможных решениях. потому что все низколежащие фрукты уже собрали, но общую проблему не решили, и теперь градус обсуждения и недовольства текущим состоянием дел будет лишь повышаться.
Вот и хорошо что не решили). А то я не успеваю.
источник

SS

Sergey Sikorskiy in Natural Language Processing
Denis Kirjanov
вот тут еще подкаст предлагали )
Судя по всему, та тема не оставила людей равнодушными 🙂
источник

NS

Nikolay Shmyrev in Natural Language Processing
Родион
Всем привет, может знает кто - есть ли готовое решение по скоращениям русского языка, которое их разворачивает? (например адреса)
Смотря куда разворачивает. А вообще вот тут много полезного было:

https://www.kaggle.com/c/text-normalization-challenge-russian-language/discussion
источник

YB

Yuri Baburov in Natural Language Processing
Ну, вряд ли ему в транслит, наверное, ему всё же ул. -> улица, д. -> деревня (или дом? ;) , п -> посёлок (или проспект?).
Так что я бы писал кастомный ner какой-нибудь, а данные наковырял из ФИАСа + текст из интернета с адресами фирм.
источник

B

Brenoritvrezorkre in Natural Language Processing
Так, почитал немного обсуждение Дениса, Сергея и там остальных, до конца не дотянул, но думаю теперь, что нужно кое-что сказать насчёт того, что писал я
источник

B

Brenoritvrezorkre in Natural Language Processing
Из того, что я писал, у кого-то может сложиться впечатление, что I-Language-исследования -- это сугубо через интроспекцию, но это не является верным
источник

B

Brenoritvrezorkre in Natural Language Processing
В таких исследованиях мы изучаем знаковую систему как таковую. В первую очередь это грамматика и семантика, но на самом деле это ещё и части прагматики, по типу устройства контекстной зависимости выражений, и то, как развиваются эти знаковые системы (та же грамматикализация очень наглядна как понятие) и так далее.
источник

Р

Родион in Natural Language Processing
спасибо за ответы @yuri_baburov @nshmyrev
источник

B

Brenoritvrezorkre in Natural Language Processing
В E-Language-исследованиях (я не думаю, что есть строгая теоретическая граница, но она всё же есть) мы рассматриваем именно то, как можно использовать такие-то знаковые системы, как это используют общества и так далее. Корпусы, тезаурусы и прочее имеют большой элемент не только такого контента, как работает знаковая система, но и очень много того, как мы общаемся, как мы привыкли что-то употреблять, следы нашей коммуникации и так далее, а то и полностью состоят из такого контента.
источник

B

Brenoritvrezorkre in Natural Language Processing
В целом E-исследования можно проводить чисто описательно: вот мы берём кучу текста и получаем, что есть такие-то языковые явления на базе данных об употреблении.
источник

B

Brenoritvrezorkre in Natural Language Processing
Для I-исследований это может быть просто вспомогательными данными, и здесь нас интересуют именно правила знаковой системы. Которые вообще-то конфликтуют с тем, как мы привыкли общаться. Тот же самый Buffalo Buffalo... и подобные примеры.
источник

B

Brenoritvrezorkre in Natural Language Processing
Роль интроспекции остаётся важной в таких исследованиях, так как позволяет отсекать abstract nonsense в создании моделей. Но я не считаю, что простые умозрительные методы и интуиция достаточны.
источник

B

Brenoritvrezorkre in Natural Language Processing
Но чем абстрактнее область, тем это сложнее делать, так как сложность проблематики усложняется.
источник

B

Brenoritvrezorkre in Natural Language Processing
Так, ещё кто-то там спрашивал о семантике вопросительных предложений. Семантика есть и была найдена в рамках эротетической (интеррогативной) логики. Это Хинтикка и дальше.
источник

B

Brenoritvrezorkre in Natural Language Processing
Только проблема вопросов несколько сложнее, так как есть вопросоподобные предложения, которые вопросами по сути не являются. Например, в рамках косвенных речевых актов, где через как бы вопрос мы можем выразить приказ, который будет иметь другую семантику.
источник