Size: a a a

Natural Language Processing

2019 December 31

AI

Alexey V. Ilyin 🦔 in Natural Language Processing
А звук тут чем поможет, если они сентимент ищут?
источник

AI

Alexey V. Ilyin 🦔 in Natural Language Processing
Alexander
Если честно, то мне кажется 1) не получится реализовать адекватно.
Так как мусора в кусках текста на столько много, то реализовать 2) тоже будет проблематично.
3) - не решение проблемы на 100% и опять же вопрос как реализовывать.
4) - не знаю как реализовывать, но наверное это лучшее что можно было бы предложить. Оператор будет видеть не какой-то неструктурированный набор текста, а осмысленное словосочетание ("дорогие услуги", "неудобный сервис", и т.д.).
5) У меня сомнения на счёт этого. Regular expressions находят хотя бы негативные слова из тонны мусора, без этого мне кажется любой последующий алгоритм будет плохо работать. То что успел понять точно - выкидывание regular expressions ведёт к значительному замедлению расчётов.
6) Думаю это не повредит и например способ 4) не будет без этого работать. На это уйдут месяцы, и хорошо бы знать, что они были потрачены не зря и есть общая идея как улучшить результаты.

В общем, спасибо что дочитали до конца и я открыт к любым вашим идеям.
Ну можно попробовать сентимент диалога оценивать (по кускам моделью, а потом эвристиками), и в случае грусти делать резюмирование
источник

AI

Alexey V. Ilyin 🦔 in Natural Language Processing
Но это идея с потолка, резюмирование само по себе не оч сейчас работает, а в разговорной речи горы мусора всегда
источник

V

Vlad in Natural Language Processing
Nikolay Shmyrev
Без анализа звука эта задача не решится.
Поддерживаю, в большинстве таких систем, которые умеют переводить запись разговора в текст, этот текст представляется как диалог с таймингами и подписями "клиент" и "оператор". Во всяком случае, знаю несколько примеров, где такая схема внедрена и успешно используется
источник

V

Vlad in Natural Language Processing
А если у нас есть структурированный диалог, то там уже довольно легко найти фразы, где клиенту что-то не нравится или наоборот, очень нравится
источник

NS

Nikolay Shmyrev in Natural Language Processing
источник

NS

Nikolay Shmyrev in Natural Language Processing
In this paper, we propose to improve emotion recognition by combining acoustic information and conversation transcripts. On the one hand, an LSTM network was used to detect emotion from acoustic features like f0, shimmer, jitter, MFCC, etc. On the other hand, a multi-resolution CNN was used to detect emotion from word sequences. This CNN consists of several parallel convolutions with different kernel sizes to exploit contextual information at different levels. A temporal pooling layer aggregates the hidden representations of different words into a unique sequence level embedding, from which we computed the emotion posteriors. We optimized a weighted sum of classification and verification losses. The verification loss tries to bring embeddings from the same emotions closer while separating embeddings from different emotions. We also compared our CNN with state-of-the-art text-based hand-crafted features (e-vector). We evaluated our approach on the USC-IEMOCAP dataset as well as the dataset consisting of US English telephone speech. In the former, we used human-annotated transcripts while in the latter, we used ASR transcripts. The results showed fusing audio and transcript information improved unweighted accuracy by relative 24% for IEMOCAP and relative 3.4% for the telephone data compared to a single acoustic system
источник

NS

Nikolay Shmyrev in Natural Language Processing
текст 60%
источник

NS

Nikolay Shmyrev in Natural Language Processing
со звуком 70%
источник

A

Alexander in Natural Language Processing
Vlad
Поддерживаю, в большинстве таких систем, которые умеют переводить запись разговора в текст, этот текст представляется как диалог с таймингами и подписями "клиент" и "оператор". Во всяком случае, знаю несколько примеров, где такая схема внедрена и успешно используется
Эта система уже есть.
источник

A

Alexander in Natural Language Processing
Vlad
А если у нас есть структурированный диалог, то там уже довольно легко найти фразы, где клиенту что-то не нравится или наоборот, очень нравится
Это как раз сейчас о чём и вопрос - как лучше это сделать?
источник

A

Alexander in Natural Language Processing
Спасибо. Но доступа к аудио у меня нет :(
источник

AI

Alexey V. Ilyin 🦔 in Natural Language Processing
Nikolay Shmyrev
со звуком 70%
Кек
источник

AI

Alexey V. Ilyin 🦔 in Natural Language Processing
Оверфиттинг же
источник

AI

Alexey V. Ilyin 🦔 in Natural Language Processing
Alexander
Спасибо. Но доступа к аудио у меня нет :(
Хочу предупредить, что распознавание базовых эмоций по аудио/тексту - это полная жесть, если у вас не нет кучи ресурсов на это, то лучше начните с более простых кейсов (типа сентимента)
источник

AB

Arcady Balandin in Natural Language Processing
Alexey V. Ilyin 🦔
Хочу предупредить, что распознавание базовых эмоций по аудио/тексту - это полная жесть, если у вас не нет кучи ресурсов на это, то лучше начните с более простых кейсов (типа сентимента)
А во фразе I had no relationship with this woman, Monica Lewinski какая эмоция?
источник
2020 January 01

YB

Yuri Baburov in Natural Language Processing
Alexander
Какие есть идеи на сегодняшний день:
1) Попробовать другие pre-trained модели (какие порекомендуете?).
2) Попробовать отследить где начинается предложение с негативным словом и где оно заканчивается (есть ли разработанные модели для этого?).
3) Модель которая бы говорила что-то вроде "этот кусок текста мусор и его оценивать не надо, его выкидываем".
4) Topic modeling. То есть все негативные куски текста классифицировать по топикам.
5) Выкинуть этап с regular expressions.
6) Сделать тестовые данные для модели, а не использовать pre-trained модель
Взять более качественную модель для текста. Текст для неё портить, чтобы она умела в испорченном тексте находить плохой сентимент.
источник

YB

Yuri Baburov in Natural Language Processing
Yuri Baburov
Взять более качественную модель для текста. Текст для неё портить, чтобы она умела в испорченном тексте находить плохой сентимент.
И возможно будет полезным уметь делать aspect-oriented sentiment, ведь может быть сказано прямо противоположное выдернутой из контекста фразе.
источник

IN

Ilya Nikitin in Natural Language Processing
А чатик живет в новогоднюю ночь
источник

IN

Ilya Nikitin in Natural Language Processing
источник