Nurdinov Denis
Добрый день, коллеги! У меня такой вопрос если при перезаписи таблицы hive в spark вместо insertInto использовать save, будут ли проблемы? И был ли кого такой кейс когда одно spark приложение перезаписывало таблицу, а другое производило вставку данных в эту же таблицу? Какие проблему могут вытечь при такой параллельной работе?
При замене insertInto на save при перезаписи может начать падать из за того что Спарк плохо понимает форматы файлов.
Одновременная запись в одну таблицу возможна только если запись идёт в разные партиции. Если как вы описали, одна таска полностью перезаписывает таблицу, а вторая дозаписывает то одна из них упадёт