Size: a a a

Data Science Chat

2021 September 26

N

Na3aga in Data Science Chat
источник

N

Na3aga in Data Science Chat
этот скриншот и у вас в видео кстати есть
источник

N

Na3aga in Data Science Chat
они уже более 2х лет как обновили возможности
источник

В

Виталий in Data Science Chat
Действительно чуть больше года назад они сделали бесплатный доступ.
источник

В

Виталий in Data Science Chat
Спасибо за замечание
источник

KT

Kamil Taygunov in Data Science Chat
всем привет! есть варианты WordNetLemmatizer из nltk использовать для русских слов?
источник

S

Ssv in Data Science Chat
Попробуй генетические алгоритмы
источник
2021 September 27

Miss Очепятка... in Data Science Chat
Результаты сравнивают по метрикам качества(тест выборке и кросс тесты). А на сколько Вы готовы потерять в качестве, что бы выиграть в скорости это вопрос к заказчику работы. Кто-то и 10% готов потерять, а кому то и 1% жалко.
источник

ES

Elena Shamis in Data Science Chat
Обычно, когда вы размечаете картинки для детекции, то на выходе возможны 2 варианта:
1. Множество xml файлов по именам самого имиджа
2. Текстовый файл формата  примерно: имя, имя класса, координаты прямоунольника. Иногда координаты считаются, как свиги относительно центра прямоугольника ( yolo формат), иногда непосредственно.
Что нужно нейросети - это, в общем, как вы сами напишете ее кормление данными. Например, tf detection api в в туториале описывает, что просит xml. Но мне это было неудобно, я переписала так, чтоб она csv с координатами брала
источник

ES

Elena Shamis in Data Science Chat
Посмотрите туториал по tenzorflow detection api, там есть про это. Или одно из множества статей с примером применения его
источник

S

Ssv in Data Science Chat
roboflow
источник

IM

Ilya Muromets in Data Science Chat
Ребята, есть у кого курс по Data Science
источник

IM

Ilya Muromets in Data Science Chat
?
источник

A

Andrey in Data Science Chat
в смысле)
источник

IM

Ilya Muromets in Data Science Chat
Курс
источник

IM

Ilya Muromets in Data Science Chat
Слитый
источник

A

Alex in Data Science Chat
Их сотни а то и тысячи слитых платных и столько же бесплатных, гуглить религия не позволяет?
источник

GD

Georgy Dorokhov in Data Science Chat
Вопрос наверное больше к дата инженерам, но все же - кто-нибудь использовал temporal как оркестратор?
источник

M

Mr.Fantomz in Data Science Chat
Всем здравствуйте.
Имеется задача постоянного просчета математической функции в n количестве потоков/процессов на языке Python.

Если конкретнее:
Нужно вычислять функцию в 1000 потоках и выдавать общее кол-во просчётов и среднюю скорость результатов в секунду за определенный промежуток времени.
ОС: GNU Linux

1. Какой метод для Py лучше использовать для параллельной многозадачности(multiprocessing или threads)?
Вычитал, что для *nix систем fork-и эффективны, multiprocessing их и использует

2. Исходя из выбранного инструмента, как выводить общую скорость и кол-во просчётов(например в консоль)

ПыСы: В данной задаче принципиальна асинхронность потоков и нежалательность возможных долгих прерываний к общей бд.
Имеется ли какой-то способ общего пространства памяти для процессов/потоков без прерываний на обращение к накопителям и бд
источник

D

Dmitry in Data Science Chat
привет
у кого-то есть опыт тренировки embeddings на нейронке, чтобы потом с их помощью трансформировать категориальные данные в датасете и кормить это, к примеру, в xgboost?
источник