Size: a a a

Natural Language Processing

2019 December 26

D

Dmitry in Natural Language Processing
А какие этичные варианты применения? Есть ли такие?
источник

V

V in Natural Language Processing
Dmitry
Фейсбук например зарабатывает обратную систему - выявление фейковых новостей))
опять же, эта битва кажется заранее проигранной. детектить фейки можно, но false positives в решении такой задачи крайне нежелательны, да и не везде такую модель развернут. фейки и пропаганду же, в свою очередь, можно пропихивать везде, буквально на всех сервисах, где можно оставить комментарий.
источник

V

V in Natural Language Processing
Dmitry
А какие этичные варианты применения? Есть ли такие?
лично я никакого применения кроме геймификации не вижу, но может я просто не думал об этом. различные боты, игры с процедурной генерацией диалогов - это всё при должном умении тоже можно монетизировать. но как мне кажется - это всё-таки ближе к интерактивному искусству. HistoryAIBot - это как своеобразная арт-инсталляция.
источник

V

V in Natural Language Processing
"нейроболталки" неплохо чувствуют себя и в составе умных помощников, например той же Алисы, как один из видов развлечения пользователя и "очеловечивания" взаимодействия бота с пользователем
источник

YB

Yuri Baburov in Natural Language Processing
V
лично я никакого применения кроме геймификации не вижу, но может я просто не думал об этом. различные боты, игры с процедурной генерацией диалогов - это всё при должном умении тоже можно монетизировать. но как мне кажется - это всё-таки ближе к интерактивному искусству. HistoryAIBot - это как своеобразная арт-инсталляция.
Ещё поисковый спам. Любой текст можно расширить парой абзацев от генератора. А вот для других применений, где нужно передавать смысл, его уже конечно недостаточно.
источник

V

V in Natural Language Processing
Yuri Baburov
Ещё поисковый спам. Любой текст можно расширить парой абзацев от генератора. А вот для других применений, где нужно передавать смысл, его уже конечно недостаточно.
это скорее к неэтичным методам относится. уж там-то есть где разугляться, да.
источник

V

V in Natural Language Processing
и никакой детектор фейков не поможет, кроме того, что в голове у человека...
источник

YB

Yuri Baburov in Natural Language Processing
V
это скорее к неэтичным методам относится. уж там-то есть где разугляться, да.
На мой взгляд, не особо есть где разгуляться. Есть ещё у человека фильтр на авторитет и соц рейтинг автора/издания для поступающей информации.
источник

V

V in Natural Language Processing
Yuri Baburov
На мой взгляд, не особо есть где разгуляться. Есть ещё у человека фильтр на авторитет и соц рейтинг автора/издания для поступающей информации.
возможно, мои наблюдения - это anecdotal evidence чистой воды (интересно было бы собрать реальную статистику), но те, на кого направлены инструменты подобной пропаганды или иного воздействия, вполне охотно ведутся на полуавтоматические комментарии и даже, как говорится, вступают в разговоры с копипастой. и поисковые движки всё ещё удаётся обмануть "чёрной" поисковой оптимизацией. модели, подобные GPT-2, просто помогают удешевить процесс за счёт полной его автоматизации.
источник

YB

Yuri Baburov in Natural Language Processing
V
возможно, мои наблюдения - это anecdotal evidence чистой воды (интересно было бы собрать реальную статистику), но те, на кого направлены инструменты подобной пропаганды или иного воздействия, вполне охотно ведутся на полуавтоматические комментарии и даже, как говорится, вступают в разговоры с копипастой. и поисковые движки всё ещё удаётся обмануть "чёрной" поисковой оптимизацией. модели, подобные GPT-2, просто помогают удешевить процесс за счёт полной его автоматизации.
Да скоро везде комменты закроют уже, будут по белым спискам
источник

B

Brenoritvrezorkre in Natural Language Processing
Yuri Baburov
Тут омонимия на самом деле вот в чём: есть семантика слов, есть семантика фраз, семантика предложений.
NER -- семантика слов и коротких фраз (точнее, многословных выражений -- Multi-Word Entities, MWE), притом одна часть, векторное представление -- другая часть семантики слов и фраз (тематическая в основном, аналог информации о гиперниме слова/фразы). А ты под семантикой подразумеваешь исключительно логическую часть семантики предложения: решение задачи SRL и даже включаешь туда прагматическую часть о том, что это означает в данном контекте (семантика текста!) в данном конкретном мире.
В инженерном смысле синтаксис и семантика более мелких кусков используется для более крупного куска, так что и тебе это будет полезно. Как сделать качественный SRL без этого, а тем более качественную логическую семантику в контексте -- я не представляю. Но да, это разные вещи, безусловно.
Это вы кому?
источник

B

Brenoritvrezorkre in Natural Language Processing
Любой NLP с попытками выделить закономерности, будь это какая задача, относится к теме семантики в стандартном её значении в лучшем случае только косвенно.
источник

B

Brenoritvrezorkre in Natural Language Processing
Семантика в стандартном значении может иметь прямое отношение к NLP только в том случае, когда у нас есть парсер, который одновременно пытается угадать контекст и проводит синтаксический и семантический разбор с переводом предложений в некоторую логику предикатов. Тогда семантика в стандартном её понимании используется для разбора. Но это практически предельно сложная задача, и, кроме того, в рамках того, как здесь фигурирует семантика, это не про поиск закономерностей, а про перевод на формальный язык.
источник

B

Brenoritvrezorkre in Natural Language Processing
Предельно сложная это задача хотя бы в определении и систематизации всех вещей, которые имеют место в соответствующей литературе и постоянно появляются вновь и вновь
источник

B

Brenoritvrezorkre in Natural Language Processing
Кроме того, это сложно автоматизировать, так как в угадывании контекста робота не заставишь просто так брать и что-то понимать.
источник

B

Brenoritvrezorkre in Natural Language Processing
А это: определение, какая модальность в тексте сейчас; разрешение ambiguous grammar; разрешение омонимии; реверс-инжиниринг полисемии; много чего в целом.
источник

B

Brenoritvrezorkre in Natural Language Processing
Вы сами понимаете, хотя бы в контексте разрешения неоднозначности, что это сложная задача, которую трудно привести в автоматический вид. А без этого мы не сделаем адекватный перевод.
источник

B

Brenoritvrezorkre in Natural Language Processing
Определение семантики я беру из логики (Тарский и далее) и (формальной) семантики естественного языка, включая генеративную и так далее.
источник

VI

Vitaly Ivanin in Natural Language Processing
Brenoritvrezorkre
Предельно сложная это задача хотя бы в определении и систематизации всех вещей, которые имеют место в соответствующей литературе и постоянно появляются вновь и вновь
А есть попытки заставить нейронку автоматически строить модель сущностей домена и сопостовлять её с текстом?
источник

VI

Vitaly Ivanin in Natural Language Processing
или это невозможно ввиду отсутсвия одновремнно интерактивного домена и текстов для него
источник