Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2020 November 20

YD

Yevhen Dmytrenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
источник

YD

Yevhen Dmytrenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
усложняется тем что перед этой группой может быть текст с пробелом спереди, а может быть вот так как тут представлено
источник

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Первый символ ловится .*
источник

YD

Yevhen Dmytrenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ivan
Первый символ ловится .*
как этого избежать?
источник

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Хз, думать надо, а у меня обед.
источник

YD

Yevhen Dmytrenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
поставить там не любое значение, а любое не цифровое значение?
источник

YD

Yevhen Dmytrenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
справедливо)
источник

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Как вариант, вместо точки поставить чтобы было не-цифровое значение
источник

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Либо потребовать чтобы перед цифрой был или пробел или ничего
источник

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
То есть вместо .* поставить \s{0, 1}
Тогда перед цифрой будет либо один пробел либо ничего
источник

YD

Yevhen Dmytrenko in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
вроде выкрутился)
источник

SP

Straxoff Pavel in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Всем привет

Может кто-то подсказать инструменты или способы сгенерировать датасет на основе существующего датасета?

Желательно при помощи spark, что-то не могу ничего нагуглить
источник

🎩

🎩 Vlad in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
pandas?
источник

SP

Straxoff Pavel in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ну тоесть есть датасет, какой-нибудь csv, я хочу на основе него сгенерировать ещё один но с другими значениями
источник

SP

Straxoff Pavel in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
🎩 Vlad
pandas?
Блин, не используем pandas(
источник

🎩

🎩 Vlad in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
с ним было бы легко, по спарку не знаю ничего, увы
источник

SP

Straxoff Pavel in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
🎩 Vlad
с ним было бы легко, по спарку не знаю ничего, увы
Тоесть он прям может посмотреть на мои данные и сделать такой же сет только с другими значениями ?
источник

SP

Straxoff Pavel in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Тип как-то рандомно нагенерит?
источник

🎩

🎩 Vlad in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD'))

   A   B   C   D
0   45  88  44  92
1   62  34   2  86
2   85  65  11  31
3   74  43  42  56
4   90  38  34  93
5    0  94  45  10
6   58  23  23  60
..  ..  ..  ..  ..
источник

SP

Straxoff Pavel in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ну тут просто инты
источник