Телеграмм чат группы datasciencecourse страница 4833

Всем привет. Подскажите, пожалуйста, правильно я понял, что из этого пункта на выходе у нас сама функция и поверх нее просто прямая, проходящая через точки 1 и 15?

источник

15:17пожаловаться #8

V

Vladimir in Machine learning

Vladislav Bushmeniov

Привет, давайте представим, что у нас есть датафрейм, мы его будем сохранять в csv.
Как узнать какой будет размер csv, до операции сохранения ?

Можно более-менее грубо прикинуть - см. линк. Также будет зависеть от размера блока ФС, куда .csv будет сохраняться.
https://stackoverflow.com/questions/18089667/how-to-estimate-how-much-memory-a-pandas-dataframe-will-need/47751572

Stack Overflow

How to estimate how much memory a Pandas' DataFrame will need?

I have been wondering... If I am reading, say, a 400MB csv file into a pandas dataframe (using read_csv or read_table), is there any way to guesstimate how much memory this will need? Just trying t...

источник

15:34пожаловаться #9

VB

Vladislav Bushmeniov in Machine learning

источник

15:35пожаловаться #10

RS

Renat Shakirov in Machine learning

Привет, есть тут люди, которые использовали semi supervised?

источник

15:40пожаловаться #11

R

Rodion in Machine learning

Ребят, привет.
Кто как понял в "Задании по программированию: Линейная алгебра: сходство текстов и аппроксимация функций" (2-я неделя первого курса) 4-й шаг задания:

4. Составьте список всех слов, встречающихся в предложениях. Сопоставьте каждому слову индекс от нуля до (d - 1), где d — число различных слов в предложениях. Для этого удобно воспользоваться структурой dict.

В результирующем словаре какая пара key-value должна получиться? Необходимо посчитать сколько раз каждое уникальное слово встречается в предложении? Или?

Буду признателен за помощь

источник

15:46пожаловаться #12

GK

George Kasoev in Machine learning

Rodion

Ребят, привет.
Кто как понял в "Задании по программированию: Линейная алгебра: сходство текстов и аппроксимация функций" (2-я неделя первого курса) 4-й шаг задания:

4. Составьте список всех слов, встречающихся в предложениях. Сопоставьте каждому слову индекс от нуля до (d - 1), где d — число различных слов в предложениях. Для этого удобно воспользоваться структурой dict.

В результирующем словаре какая пара key-value должна получиться? Необходимо посчитать сколько раз каждое уникальное слово встречается в предложении? Или?

Буду признателен за помощь

Просто номер, кодируешь слова числами

источник

15:53пожаловаться #13

V

Vladimir in Machine learning

Vladislav Bushmeniov

import pandas as pd
import numpy as np
import os

big_df = pd.DataFrame(data=np.random.randn(int(2e6), 5))

big_df.iloc[:1000].to_csv('temp.csv')

rows_max = int(5e5)

row_from = 0
row_to = rows_max
file_n = 1

while True:
fn_i = 'big_%s.csv' % str(file_n).zfill(3)
big_df.iloc[row_from:row_to].to_csv(fn_i)

if row_to > big_df.index.size:
break

row_from = row_to
row_to = row_from + rows_max
file_n += 1

print(os.path.getsize('temp.csv'))

источник

15:56пожаловаться #14

V

Vladimir in Machine learning

можно на конкретном наборе данных в коде прибросить размер например 1000 строк, и на этой основе построить логику по сплиту

источник

15:57пожаловаться #15

R

Ruslan in Machine learning