Size: a a a

2021 February 25

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
@dartov а вы бигдату на ленточных накопителях видели? Окромя хранения
я не уверен что понял вопрос, в смысле читать с лент по запросу аналитическим джобом?
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
я не уверен что понял вопрос, в смысле читать с лент по запросу аналитическим джобом?
Примерно такое
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
Примерно такое
нет, это плохой дизайн
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
нет, это плохой дизайн
ну я не могу согласиться, что плохой дизайн если честно, ну исходя из примергов того, что в живой природе я такого не видел и спрашиваю, может есть у кого
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
ну я не могу согласиться, что плохой дизайн если честно, ну исходя из примергов того, что в живой природе я такого не видел и спрашиваю, может есть у кого
я могу пояснить почему плохой дизайн :)
источник

AZ

Anton Zadorozhniy in Data Engineers
вы знаете что такое tape shoe-shining?
источник

K

KrivdaTheTriewe in Data Engineers
Неа не знаю, но могу предположить , что износ ленты на чтение запись
источник

A

Alex in Data Engineers
перемотка? (вернее косяки в момент этого события )
источник

K

KrivdaTheTriewe in Data Engineers
ну там я читал, что 250 раз чтения/записи
источник

K

KrivdaTheTriewe in Data Engineers
С другой стороны я Русалочку в детстве смотрел больше 250 раз
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
Неа не знаю, но могу предположить , что износ ленты на чтение запись
это остановка-перемотка назад ленты в результате того что поток на запись слишком медленный, или на чтение не успевает записать в приемник; этот процесс приводит к растягиванию ленты, и там очень трудно предсказать когда лента перестанет читаться, этого избегают изо всех сил
источник

AZ

Anton Zadorozhniy in Data Engineers
поэтому все промышленные библиотеки устроены так что перенос на ленты делается не с горячей системы под нагрузкой, а в отдельное окно, или с копии которая готова на быстрых дисках
источник

AZ

Anton Zadorozhniy in Data Engineers
это называется backup-to-disk-archive-to-tape
источник

AZ

Anton Zadorozhniy in Data Engineers
поэтому это плохая идея, подавать поток с ленты (а он там очень приличный, и сжатый) напрямую в аналитический процесс, у вас будет непредсказуемый износ ленты, а значит надо держать много копий, и видимо читать сразу копии в разных драйвах
источник

K

KrivdaTheTriewe in Data Engineers
Зато теперь все опять упрется в сеть)
источник

AZ

Anton Zadorozhniy in Data Engineers
дальше вы упираетесь в драйвы и роботы (а это дорогая часть библиотек, и их трудно скейлить)
источник

K

KrivdaTheTriewe in Data Engineers
Ну может быть
источник

AZ

Anton Zadorozhniy in Data Engineers
именно поэтому все ленточные решения работают так: у вас есть копия на диске, ее можно скинуть на ленты (сколько и каких лент - решает библиотека), также и при чтении
источник

K

KrivdaTheTriewe in Data Engineers
хотя  мне кажется нужен аппаратный map/reduce
источник

AZ

Anton Zadorozhniy in Data Engineers
аппаратный map/reduce в среде СУБД-строителей называется intelligent storage, так сделаны Netezza (которую кстати решили оживить) и Exadata
источник