Size: a a a

2019 May 30

GG

George Gaál in Data Engineers
Далее заматчить все события по этому классификатору
источник

AB

Alex Bal in Data Engineers
George Gaál
Скорее для начала нужен классификатор отказов
а это не есть некий паттерн ?
источник

AB

Alex Bal in Data Engineers
я бы для начало опредлил что есть true, что есть false ..... а далее уже классифицировал выполнение в рамках тогоже true/false
источник

GG

George Gaál in Data Engineers
Alex Bal
а это не есть некий паттерн ?
Ну, я не знаю как это назвать
источник

AB

Alex Bal in Data Engineers
идея очень прикольная, если рассматривать CI/CD .... и некую эволюцию, этих процедур..... в сторону ML
источник

AB

Alex Bal in Data Engineers
George Gaál
Ну, я не знаю как это назвать
источник

AB

Alex Bal in Data Engineers
так ?
источник

GG

George Gaál in Data Engineers
Примерно
источник

FL

Fedor Lavrentyev in Data Engineers
DemDev
Ну long-term идея в том, чтобы система могла автоматически анализировать логи, составлять regex'ы и категоризировать их, чтобы затем автоматически ставить причину падения для deployment'ов
Кажется, что на ваших объемах вручную проанализировать все известные ошибки и составить регэкспы будет на три порядка дешевле, чем писать артифишиал интеллидженс машин лёрнинг десижн мейкер.
На данных большего объёма можно будет выстроить систему автоматизации первой линии поддержки, наклепать эвристик для упрощения разметки и тулов для классификации новых типов ошибок. И только когда это всё будет сделано, и этого будет уже не хватать, настанет время расчехлять "честное" машинное обучение.
источник
2019 May 31

ЕГ

Евгений Глотов in Data Engineers
Alex Bal
согласен .... regex или еще, что нужны паттерны как true так и false для обучения..... что бы система могла разпознать, что делать в конкрентной ситуации или обучится этому на истории.....
Это не обязательно, есть одноклассовые методы для выявления аномалий, работают даже на небольших выборках
источник

GG

George Gaál in Data Engineers
Евгений Глотов
Это не обязательно, есть одноклассовые методы для выявления аномалий, работают даже на небольших выборках
можно поподробнее?
источник

ЕГ

Евгений Глотов in Data Engineers
источник

FL

Fedor Lavrentyev in Data Engineers
George Gaál
можно поподробнее?
Семейство алгоритмов, которые пытаются обощить исходную выборку, а потом оценивают вероятность, что новый элемент принадлежит к этой выборке. Много разных вариантов и теорий, как это сделать.
В целом, это весьма неустойчивый и требовательный к данным подход. Если есть возможность свести задачу к многоклассовой классификации - надо сводить.
источник

GG

George Gaál in Data Engineers
Fedor Lavrentyev
Семейство алгоритмов, которые пытаются обощить исходную выборку, а потом оценивают вероятность, что новый элемент принадлежит к этой выборке. Много разных вариантов и теорий, как это сделать.
В целом, это весьма неустойчивый и требовательный к данным подход. Если есть возможность свести задачу к многоклассовой классификации - надо сводить.
Т.е. как я понимаю, категоризация (как я и говорил) все равно изначально ?
источник

FL

Fedor Lavrentyev in Data Engineers
Я не понял, что вы имеете ввиду, простите. =(
Категоризация - это термин не из машинного обучения.
источник

GG

George Gaál in Data Engineers
Я не mlщик 😭
источник

АП

Алексей Пахомов in Data Engineers
Как фанат ml в data engineering Вкину свои 5 копеек. Логи как сгенерированая информация я так понимаю может быть распаршена, зная алгоритмы генерации. Задача извлечения паттернов - здравствуй nlp
источник

АП

Алексей Пахомов in Data Engineers
Но я так понимаю можно сделать кластеризацию на этом пространстве. Это позволит для начала узнать типы фейлов. Для классификации пока не определены классы.
источник

АП

Алексей Пахомов in Data Engineers
Для начала попробуйте прогнать логи через Фаст текст и на предложении Провести кластеризацию. Это соберёт паттерны вполне не плохо.
источник

GG

George Gaál in Data Engineers
О, фасттекст опять. Он же жесть какой ресурсоемкий и вроде оптимизирован для гпу ?
источник