Size: a a a

R language and Statistical data analysis

2020 January 23

AS

Alexander Semenov in R language and Statistical data analysis
Артём Клевцов
Любая тяга к монге - патология. В добавок она закончила своюб жизнь сменой лицензии из-за чего её выпилили из всех линукс дистров. Туда и дорога.
А куда сейчас ленивые JSON складывают?
источник

АК

Артём Клевцов in R language and Statistical data analysis
В PostgreSQL.
источник

ИЕ

Илья Ерошенков in R language and Statistical data analysis
В Oracle
источник

ИЕ

Илья Ерошенков in R language and Statistical data analysis
Хотя от задачи зависит. Если много данных, например миллионов 50-100 json, и надо еще что-то по ним агрегировать на уровне базы, то Postgre уже тяжко приходится.
источник

A

Alexander (AlexR) in R language and Statistical data analysis
Csv - наше все ;)
источник

А

Александр in R language and Statistical data analysis
Alexander (AlexR)
Csv - наше все ;)
RData top
источник

A

Alexander (AlexR) in R language and Statistical data analysis
Между прочим,да.
источник

IT

Inip Tyig in R language and Statistical data analysis
я, может крамолу страшную произнесу, но: « а почему не монгодб»
источник

IT

Inip Tyig in R language and Statistical data analysis
коли джсонами нужно вертеть, то скималессом пахнет по округе
источник

э

эдуард in R language and Statistical data analysis
Inip Tyig
я, может крамолу страшную произнесу, но: « а почему не монгодб»
https://habr.com/ru/post/272735/
вроде норм статья
источник
2020 January 24

PU

Philipp Upravitelev in R language and Statistical data analysis
уважаемые, немного противного на ночь
кто мне сможет рассказать, почему, зачем и как побороть?
> as.character(1.0)
[1] "1"


в питоне, например, так:
>>> str(1.0)
'1.0'
источник

ГД

Григорий Демин in R language and Statistical data analysis
format(1, nsmall = 1)
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
но почему так?
ведь даже если про неявное приведение типов говорить, то numeric таки более общий, чем integer
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
а решение с format() симпатичное, спасибо. я не додумался
источник

ГД

Григорий Демин in R language and Statistical data analysis
Почему так - не знаю. Надо сишный код смотреть. Это из разряда посчитать 0.1 + 0.2 в консоли в Р и в Питоне.  Видимо, R все-таки не для программистов предназначался.
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
эхЪ
источник

AS

Alexander Semenov in R language and Statistical data analysis
Григорий Демин
Почему так - не знаю. Надо сишный код смотреть. Это из разряда посчитать 0.1 + 0.2 в консоли в Р и в Питоне.  Видимо, R все-таки не для программистов предназначался.
И слава Богу!
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
что ж слава богу-то, есди поведение непрогнозируемое :(
источник

IT

Inip Tyig in R language and Statistical data analysis
Григорий Демин
Почему так - не знаю. Надо сишный код смотреть. Это из разряда посчитать 0.1 + 0.2 в консоли в Р и в Питоне.  Видимо, R все-таки не для программистов предназначался.
я бы сказал что просто формат данных для ieee-754 не для понимания людьми предназначался. Флоты в питоне, процессорные, поэтому такая канитель со сложением, есть decimal.Decimal, реализующий бигдецимал спецификацию как в джаве. а арчик, по дефолту в бигдецимал. а почему? а потому что он не протскорость просто
источник

IT

Inip Tyig in R language and Statistical data analysis
эдуард
https://habr.com/ru/post/272735/
вроде норм статья
Отличная негодная статья с хабра, прямо как выступление Бартунова в радио-Т. Кроме шуток: статья является примером банальной апологии. но что защищает автор? А тут все понятно: схема хорошо, а если совсем невмоготу, без схемы все равно можно, но в постгре. А почему? Ну потому, видимо, что автор умеет схемы и постгрю, и считает что они необходимы всегда.

Я сталкивался с предыдущей итерацией хейта к новому в БДведении. Один широко известный скулеголовый дедуля, Джо Селко, готов был головы отгрызать за поля 'id', он даже термин придумал: «id-оты». На идеи хранить XML (до восхода джсона еще лет 20 оставалось, но идея-то та же), он, с его слов, смеялся людям на коференциях в лицо (хорошо еще, что не ссал на трупы этих еретиков).

Более того, до сих пор бытует мнение, что БД ускоряют только в условиях множественного доступа, а если у вас монопольный досиуп к данным на время работы, то можно даже использовать одним текстовиком посдедовательность джсон объектов. Я даже как-то читал статейку, про то что доступность скльных БД подобно Эйнштейну в головах конспирологов, отбросившего науку на 100к лет в секунду, отбросло программную инженерию. Там все сводилось как раз к тому, что БД ради однорыльного доступа — неадекватна своими накладными расходами.

По-существу в итоге, могу отметить что в том виде, в каком поставлена задача никакая база со схемой не лучше и не хуже никакой безсхемной или колоночной базы.
источник