Size: a a a

Natural Language Processing

2020 January 22

ИГ

Иван Гладуш in Natural Language Processing
>Что за запись такая: [11, 17)
Промежуток с 11 элемента по 17 включая начало и не включая конец
источник

ИГ

Иван Гладуш in Natural Language Processing
У Наташи в рулах имени есть такой тег NAME_CRF = tag('I') кто-то может подсказать что он означает ?
источник

ck

cnstntn kndrtv in Natural Language Processing
Иван Гладуш
У Наташи в рулах имени есть такой тег NAME_CRF = tag('I') кто-то может подсказать что он означает ?
источник

AK

Alexander Kukushkin in Natural Language Processing
Lenich
кстати, поддерживает, нашёл изменение цветов вот так:

import colorama
from colorama import Fore, Style
print(f"{Fore.GREEN} Hello World {Style.RESET_ALL}")


и цветной JSON ещё нашёл:

import json
from pygments import highlight, lexers, formatters
formatted_json = json.dumps(json.loads(json_data), indent=4)
colorful_json = highlight(formatted_json, lexers.JsonLexer(), formatters.TerminalFormatter())


*когда сам ответил на свой вопрос*
В ipymarkup есть вариант визуализации для консоли не цветом а ascii графикой https://github.com/natasha/ipymarkup#usage
источник

ID

Ivan Dolgov in Natural Language Processing
Всем привет, подскажите, пожалуйста, dataset'ов для POS tagging'а? Лучше, чтобы было что-то похожее на Social Media, но в целом без разницы. И можете проконсультировать, например, по поводу самых ходовых датасетов и всего такого? Спасибо
источник

D

Dmitry in Natural Language Processing
Коллеги, кто-нибудь сталкивался с проблемой при транскрибировании телефонных разговоров с тем, что ни одна STT не распознает определенный кусок записи?
источник

D

Dmitry in Natural Language Processing
Хотя человеческим ухом там нормально слышится что говорит человек
источник
2020 January 23

AF

Alexander Fedorenko in Natural Language Processing
Dmitry
Хотя человеческим ухом там нормально слышится что говорит человек
если для google, то код языка верно указали в конфиге?
Мало ли ...))
источник

D

Dmitry in Natural Language Processing
Alexander Fedorenko
если для google, то код языка верно указали в конфиге?
Мало ли ...))
Код верный
источник

D

Dmitry in Natural Language Processing
Да и аудио много, одинакового формата одинаковых условий обработки.
источник

D

Dmitry in Natural Language Processing
Н одних работает на других нет
источник

AF

Alexander Fedorenko in Natural Language Processing
Dmitry
Н одних работает на других нет
а варианты преобразования с помощью эквалайзера не пробовали?
чтобы частоту голоса выделить
Понимаю, что это шаг в сторону, но если нужно решить задачу, то и такие шаги приходится нам всем делать
источник

RI

Roman Iudichev in Natural Language Processing
Dmitry
Коллеги, кто-нибудь сталкивался с проблемой при транскрибировании телефонных разговоров с тем, что ни одна STT не распознает определенный кусок записи?
Если удастся понять, в чём была проблема с такого рода записями - то это подход к решению обратной задачи: защита аудиозаписей от распознавания системами STT (не 100% bulletproof, но, м.б. и в таком виде кому-то пригодится).
источник

AF

Alexander Fedorenko in Natural Language Processing
Roman Iudichev
Если удастся понять, в чём была проблема с такого рода записями - то это подход к решению обратной задачи: защита аудиозаписей от распознавания системами STT (не 100% bulletproof, но, м.б. и в таком виде кому-то пригодится).
Обычно защита - это или шум или кодировка как на спец аппаратуре
источник

RI

Roman Iudichev in Natural Language Processing
Alexander Fedorenko
Обычно защита - это или шум или кодировка как на спец аппаратуре
Дополню свое предложение:
"... без потери распознавания живым оператором."
источник

AF

Alexander Fedorenko in Natural Language Processing
Roman Iudichev
Дополню свое предложение:
"... без потери распознавания живым оператором."
Так системы же тоже обучаются и должны достигнуть качества "уха"
источник

RI

Roman Iudichev in Natural Language Processing
Alexander Fedorenko
Обычно защита - это или шум или кодировка как на спец аппаратуре
Хотя согласен - м.б. [даже наверняка]  такая задача уже решена.
источник

RI

Roman Iudichev in Natural Language Processing
Alexander Fedorenko
Так системы же тоже обучаются и должны достигнуть качества "уха"
В идеале - да.
Но они же не сами это делают.
А когда менеджеры приходят к программистам и спрашивают: "Когда будет готово?",
программисты обычно закатывают глаза, тихо матерятся про себя и выдают оценку ППП.
источник

SP

Sebastian Pereira in Natural Language Processing
Коллеги, у меня огромный текстовый файл, который (не спрашивайте почему) нельзя поделить на части. Spacy виснет на стадии парсера  nlp(doc) может есть какой-то ленивый способ этого избежать?
источник

SP

Sebastian Pereira in Natural Language Processing
Построчно тоже не вариант, к сожалению.
источник