Size: a a a

Data Science Chat

2021 November 07

VP

Vladimir Popov in Data Science Chat
круто
источник

VP

Vladimir Popov in Data Science Chat
Надо попробовать.
источник

TW

TikTok Warrior in Data Science Chat
Не надо
источник

JT

Jack Torrance in Data Science Chat
всем привет! есть ли смысл делать масштабирование данных для бустинга на деревьях?
источник

В

Вадим in Data Science Chat
Деревья не чувствительны к масштабированию признаков. Если под масштабированием ты подразумеваешь умножение на скаляр
источник
2021 November 08

AG

Artyom Gruzdev in Data Science Chat
есть, если деревья используют линейные модели в листьях, в LightGBM есть такая опция, 'linear_lambda': 0.01, 'linear_tree': True
источник

В

Валентин👾 in Data Science Chat
Здравствуйте, подскажите пожалуйста по классификации текстов на BERT.
Вот допустим здесь есть переобученная модель ruBert (http://docs.deeppavlov.ai/en/master/features/pretrained_vectors.html#bert)
Я хочу дообучить эту модель для классификации моих текстов, но у этой модели есть ограничение - длина текстов не должна привышать 512 токенов. Тексты, естественно, длиннее, и 512 токенов очень мало. Собственно, как решается это проблема? Как запихиваются тексты целиком при таком ограничении предобученных моделей?
источник

В

Вадим in Data Science Chat
Ну у тебя классификация же текста ? Разбей на 2
источник

В

Вадим in Data Science Chat
Пусть у тебя текст 600 токенов
источник

В

Вадим in Data Science Chat
Найди правило по которому ты будешь разбивать
источник

В

Валентин👾 in Data Science Chat
Что? Текст разбить на отдельные части с одинаковыми метками класса и учить модель как будто это отдельные, несвязанные наблюдения?
источник

AK

Alexander Khachikyan in Data Science Chat
источник

В

Вадим in Data Science Chat
подходов есть несколько, в том числе пропихивание информации от первой части во вторую. Есть папира на этот счет. Можно ее почитать
источник

В

Валентин👾 in Data Science Chat
окей спасибо
источник

DM

Denis Markov in Data Science Chat
Добрый день. Мы тут готовим к запуску Vektonn.io — open source проект для повышения скорости вывода на продакшен и сопровождения жизненного цикла ML-моделей.

Так что если тут есть разработчики, которым интересно было бы его протестировать, поучаствовать в развитии или помочь экспертным мнением — пожалуйста, пишите.

Хочется сделать реально полезный продукт, а потому нуждаемся в обратной связи и готовы многое адаптировать под ваши задачи.
источник

SD

Stanislav Demchenko in Data Science Chat
покидайте ресурсов, где можно норм вкатиться в оценку размера объекта на экране. (сам объект и объект, размеры которого мы знаем, могут перемещаться в кадре)
источник

TU

Telegtam User in Data Science Chat
Можно ли уже с этими знаниями и выполненным проектом в рамках курса идти в бой, т.е. писать резюме?
источник

TU

Telegtam User in Data Science Chat
Чекай курсы от хуевей/стенфорда/яндекса
источник

n

novveak in Data Science Chat
напиши, сходи на собесы, узнаешь
источник

АА

Абстрактный Аутист... in Data Science Chat
Подскажите, пожалуйста, что не так с этой регуляркой?
источник