Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2021 March 28

ЯН

Ярослав Н in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Господа, подскажите ресурс где можно датасеты скачать.
Задача - сделать нейронку для определения неисправностей двигателя по звуку работы двигателя.
Датасет не могу найти
источник

MM

Matvey Ma in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ярослав Н
Господа, подскажите ресурс где можно датасеты скачать.
Задача - сделать нейронку для определения неисправностей двигателя по звуку работы двигателя.
Датасет не могу найти
kaggle
источник

И

Илья in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ярослав Н
Господа, подскажите ресурс где можно датасеты скачать.
Задача - сделать нейронку для определения неисправностей двигателя по звуку работы двигателя.
Датасет не могу найти
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
@VadimChashechnikov , вот оно епт.
источник

I

Ilya in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ilya
@VadimChashechnikov , вот оно епт.
точно для дополнительного изменения измерения для адаптации под задачи CV.
источник
2021 March 29

MI

Madiar Isabek in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
источник

MI

Madiar Isabek in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
ребят
источник

MI

Madiar Isabek in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
почему код не запускается?
источник

MI

Madiar Isabek in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
тип отоброжаеться *
источник

MI

Madiar Isabek in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
сорян
источник

MI

Madiar Isabek in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
оказ импорт не туда ввел
источник
2021 March 30

D

Dima🐼 in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Всем хай) Решаю задачу классификации новостей. Имеется как текст самой новости, так и изображения из неё. Изображений может быть несколько, а может не быть вообще. Я написал нейросеть, которая пытается по тексту классифицировать новость. Но вот как быть с изображениями ?
1) Если изображения нет, то  будет ли ОК загрузить полностью черную картинку, например ? Или есть подход получше ?
2) Не совсем понятно как нейросети подать сразу несколько изображений для одной новости. Можно, например, продублировать новость в датасете столько раз, сколько встречается картинок, но я снова не уверен, что это ОК. Это норм ? А если нет, то какие альтернативы ?
источник

SD

Sergey Dulikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ну сначала нужно задаться вопросом, действительно ли часто в картинке содержится информация необходимая для классификации новости? Мне кажется это не так.
источник

S

S A in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Всем привет! Нужна помощь, тоже задача на классификацию.
Пытаемся понять по описанию научной статьи к какой научной области она относится. В чем трабл: у нас есть очень много статей с их описанием и тем, к каким предметным областям они принадлежат. Как сказать модели, что мол вот смотри только на те, которые есть у документа и покажи к чему это ближе? Мы делаем это бертом.
То есть ещё раз: статья А, у неё 3 темы, допустим химия математика и физика. Всего имеем допустим 27 тем. Вот как тут дать понять, что нужно смотреть только на химию матан и физику? И так примерно с 1 млн статей =) Везде микс из научных областей, примерно по 3-6 тем в каждом доке. То есть я хочу понять, что в статье А N область преобладает на M%, чем остальные. Считаю её основной в этой статье.
источник

И

Илья in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Dima🐼
Всем хай) Решаю задачу классификации новостей. Имеется как текст самой новости, так и изображения из неё. Изображений может быть несколько, а может не быть вообще. Я написал нейросеть, которая пытается по тексту классифицировать новость. Но вот как быть с изображениями ?
1) Если изображения нет, то  будет ли ОК загрузить полностью черную картинку, например ? Или есть подход получше ?
2) Не совсем понятно как нейросети подать сразу несколько изображений для одной новости. Можно, например, продублировать новость в датасете столько раз, сколько встречается картинок, но я снова не уверен, что это ОК. Это норм ? А если нет, то какие альтернативы ?
Собирал датасет картинок парсингом новостей,
Подтверждаю слова Сергея. Картинка в среднем только в около 12% случаев была уникальная и относилась только к статье.
Лучше сосредоточиться на тексте.
источник

TN

Timofey Naumenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Хм, а если в целом работать с этим, при условии, что картинка помогает понять текст, но в текст все равно содержит основную информацию? Я бы, наверное, попытался встроить кодировку картинки в пайплайн так, что encoder-decoder текста воспринимали ее просто как один токен. Но надо еще, чтобы текстовая составляющая проникала в картинку тоже, как мне кажется.
источник

G

Group in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Конференция по анализу данных, машинному обучению и искусственному интеллекту Data Fusion состоится уже сегодня

30-31 марта состоится Data Fusion — бесплатная международная онлайн-конференция для исследователей и разработчиков в области DS и ML, посвященная вопросу синергии данных и модельных подходов.

В программе — лекции от ведущих исследователей: Руслана Салахутдиновa, Константина Воронцова, Дмитрия Ветрова, Андрея Райгородского, Евгения Бурнаева. Также среди спикеров: Родриго Ривера Кастро (Skoltech), Дебмалая Бисвас (ex-Nokia), Андрей Леонидов (МФТИ), Александр Крайнов (Яндекс), Михаил Бурцев (Deep Pavlov), Валерий Бабушкин (Facebook), Ирина Пионтковская (Huawei), Виктор Кантор (МТС), Александр Мамаев (Mail.ru Group), Сергей Иванов (Criteo), Денис Суржко (ВТБ), Юрий Дорн (Ozon), Андрей Леонидов (МФТИ), Стивен Крайн (Microsoft), Александр Савельев (IBM) и многие другие.

Предстоит два дня интересных докладов. Среди тем первого дня   — Фабрика искусственного интеллекта и MLops. Среди тем второго дня — NLP, рекомендательные системы, графовая аналитика, компьютерное зрение, развитие нейросетевых алгоритмов, ML&security, временные ряды в экономике.

Регистрация и программа по ссылке. Конференция бесплатная, пройдет в онлайн-формате.
источник

T

Timur in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Всем еще раз привет) Смотрите, мне нужно написать нн, которая будет говорить это звук собаки или нет. Это же обычная задача классификации, да? Просто я не совсем понимаю какой датасет делать для данной задачи. Очевидно, что нужен лай собак, но что еще? Я же не могу сделать так, чтобы все примеры в трен. выборке были от собак.
источник

IM

IVAN MALAKHOV in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Timur
Всем еще раз привет) Смотрите, мне нужно написать нн, которая будет говорить это звук собаки или нет. Это же обычная задача классификации, да? Просто я не совсем понимаю какой датасет делать для данной задачи. Очевидно, что нужен лай собак, но что еще? Я же не могу сделать так, чтобы все примеры в трен. выборке были от собак.
Дай собак и не дай собак )
источник

T

Timur in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Надеюсь все поняли)
источник