Size: a a a

Machine learning

2021 February 25

ВМ

Виталий Мурысев... in Machine learning
Zhomart Zhurayev
А как сделать по метрике ROC-AUC, нету идеи?
Сейчас не у компа, завтра скину.
Напомните мне, если я подумаю что мне приснилось)
источник

ZZ

Zhomart Zhurayev in Machine learning
Виталий Мурысев
Сейчас не у компа, завтра скину.
Напомните мне, если я подумаю что мне приснилось)
хорошо, пока что сам пробую метрики
источник

B

Bogdan in Machine learning
источник

C

Cyber Security in Machine learning
кто ни будь делал машинное обучение для того чтобы найти углы если даны позиций суставов то есть делал инверс кинематикс
источник

VB

Vladislav Bushmeniov in Machine learning
Привет, давайте представим, что у нас есть датафрейм, мы его будем сохранять в csv.
Как узнать какой будет размер csv, до операции сохранения ?
источник

VB

Vladislav Bushmeniov in Machine learning
потому что мне его нужно сохранять только в тех случаях, если csv не будет больше 3 мб
источник

VB

Vladislav Bushmeniov in Machine learning
считать символы в ячейках и узнать количество байт, не подходит
источник

Д

Дмитрий in Machine learning
Всем привет. Подскажите, пожалуйста, правильно я понял, что из этого пункта на выходе у нас сама функция и поверх нее просто прямая, проходящая через точки 1 и 15?
источник

V

Vladimir in Machine learning
Vladislav Bushmeniov
Привет, давайте представим, что у нас есть датафрейм, мы его будем сохранять в csv.
Как узнать какой будет размер csv, до операции сохранения ?
Можно более-менее грубо прикинуть - см. линк. Также будет зависеть от размера блока ФС, куда .csv будет сохраняться.
https://stackoverflow.com/questions/18089667/how-to-estimate-how-much-memory-a-pandas-dataframe-will-need/47751572
источник

VB

Vladislav Bushmeniov in Machine learning
источник

RS

Renat Shakirov in Machine learning
Привет, есть тут люди, которые использовали semi supervised?
источник

R

Rodion in Machine learning
Ребят, привет.
Кто как понял в "Задании по программированию: Линейная алгебра: сходство текстов и аппроксимация функций" (2-я неделя первого курса) 4-й шаг задания:

4. Составьте список всех слов, встречающихся в предложениях. Сопоставьте каждому слову индекс от нуля до (d - 1), где d — число различных слов в предложениях. Для этого удобно воспользоваться структурой dict.

В результирующем словаре какая пара key-value должна получиться? Необходимо посчитать сколько раз каждое уникальное слово встречается в предложении? Или?

Буду признателен за помощь
источник

GK

George Kasoev in Machine learning
Rodion
Ребят, привет.
Кто как понял в "Задании по программированию: Линейная алгебра: сходство текстов и аппроксимация функций" (2-я неделя первого курса) 4-й шаг задания:

4. Составьте список всех слов, встречающихся в предложениях. Сопоставьте каждому слову индекс от нуля до (d - 1), где d — число различных слов в предложениях. Для этого удобно воспользоваться структурой dict.

В результирующем словаре какая пара key-value должна получиться? Необходимо посчитать сколько раз каждое уникальное слово встречается в предложении? Или?

Буду признателен за помощь
Просто номер, кодируешь слова числами
источник

V

Vladimir in Machine learning
Vladislav Bushmeniov
import pandas as pd
import numpy as np
import os

big_df = pd.DataFrame(data=np.random.randn(int(2e6), 5))

big_df.iloc[:1000].to_csv('temp.csv')

rows_max = int(5e5)

row_from = 0
row_to = rows_max
file_n = 1

while True:
   fn_i = 'big_%s.csv' % str(file_n).zfill(3)
   big_df.iloc[row_from:row_to].to_csv(fn_i)

   if row_to > big_df.index.size:
       break

   row_from = row_to
   row_to = row_from + rows_max
   file_n += 1
   
print(os.path.getsize('temp.csv'))
источник

V

Vladimir in Machine learning
можно на конкретном наборе данных в коде прибросить размер например 1000 строк, и на этой основе построить логику по сплиту
источник

R

Ruslan in Machine learning
Кто-то понимает, в чем проблема? При использовании 'NaN' вместо np.nan ничего не меняется. Преобразование к int тоже верно выполняется
источник

IK

Ivan Krokhalyov in Machine learning
вместо проверку на равенство, лучше делать pd.isna(x)
источник

R

Ruslan in Machine learning
Ivan Krokhalyov
вместо проверку на равенство, лучше делать pd.isna(x)
Сработало. Спасибо!
источник

i

igor in Machine learning
Друзья вопрос опосредованный про степик
источник

i

igor in Machine learning
Вбиваю в поиск курс по критическому мышлению пишу полное имя.
А  выдается в поиске куча курсов в названии нет вообще критического мышления.
источник