Господа пацаны, подскажите пожалуйста. Читаю 700мб json файл в спарке, стандартным способом:
df = spark.read.json(src_path)
При начальном подсчете показывает, что есть только одна запись, которую я делаю explode и получаю всего 1000 записей. Потом сохраняю в паркет, который весит всего 208кб. Не пойму где остальные данные.