Size: a a a

2021 September 30

VP

Vitaly Pismarev in Data Engineers
Просто нужно принимать эту особенность
источник

I

Igar in Data Engineers
Сам hive2 делает через временную директорию. Но, сука, иногда по какой-то неведомой причине файлов нет ни в стейджинге, ни в основной директории.
источник

D

Dmitry in Data Engineers
для меня это мегафича. в мсскл например вся бд становиться колом если длинная транзакция забила темдб
источник

AS

Andrey Smirnov in Data Engineers
ок, вот точные цитаты
источник

VP

Vitaly Pismarev in Data Engineers
Блин, ну mvcc реализована в виде хранения старых и новых версий строк вместе. От этого и проблема. Например, я сам наблюдал как долгоиграющий селект на реплике клал основной сервер. В той статье тоже помнится есть такой кейс.
источник

D

Dmitry in Data Engineers
ты видел оракл без undo лога или что ты этим хочешь поведать ?
источник

ИК

Иван Калининский... in Data Engineers
Ну вот, а если в delta.io реализовано так, что работает без проблем, то в чем вопрос к фейковости acid? Фейк - значит подделка, не то, чем кажется
источник

VP

Vitaly Pismarev in Data Engineers
Я про постгрю выше писал.
источник

AZ

Anton Zadorozhniy in Data Engineers
Там миллион проблем из-за такой организации стораджа, и это родовая проблема которую сообщество не хочет решать ((
источник

AS

Alexey Stavrov in Data Engineers
А что происходит с ней?
Свойства ACID ломаются?
источник

D

Dmitry in Data Engineers
это разные вбросы. первый что дата лейк плох, там нет говно acid, как в lakehouse. но их delta.io с тем самым говно acid работает
второй вброс про acid. тут думаю разобрали
источник

VP

Vitaly Pismarev in Data Engineers
Где-то пару лет назад я слышал намерение её решать
источник

AS

Andrey Smirnov in Data Engineers
хз, в моем понимании просто все работает медленнно и печально
источник

AS

Alexey Stavrov in Data Engineers
Понятно, что это OLTP.
Но мы про ACID говорим?
источник

AS

Andrey Smirnov in Data Engineers
ну распределенные транзакции есть и в  mssql, но это не делает ее бигдатой
источник

AS

Alexey Stavrov in Data Engineers
Какие гарантии у MSSQL в этом случае?
Да и покажите ссылочкой, про что конкретно вы пишите.  Т.е. ссылку на эти распределенные транзакции покажите, чтобы понять, про что речь.
источник

AS

Alexey Stavrov in Data Engineers
А я отменил его?)
источник

А

Алексей in Data Engineers
у ораклового undo обратная сторона, у таблиц с множеством изменений начинают тормозить select, потому что нужно читать длинный связаный список undo одноблочными чтениями, вместо многоблочных в pg
источник

VP

Vitaly Pismarev in Data Engineers
Тебе уже сказали - у оракла это фича )
источник

VP

Vitaly Pismarev in Data Engineers
как и снапшот ту олд
источник