Пожалуй, этот канальчик подойдёт для моих регулярных жалоб на жизнь мою нелёгкую. Для тех, кто не в курсе, кратко опишу суть моей повседневной жизни...
Я работаю в компании Wargaming и мы проводим массу опросов наших игроков. Массовую массу. Я вообще не знаю, проводит ли кто-то ещё на свете такую массовую массу опросов, что они становятся на какое-то время бигдатой.
Всё это обрабатывается в R с помощью кучи разных автоматических функций.
Итак, история первая. Несколько месяцев назад у меня начали падать скрипты или выдавать странные результаты. Выяснилось, что в игру на азиатском кластере были добавлены игроки с закрытого корейского. Но при этом номера у них остались корейские. А корейские номера - больше, чем держит в себе тип integer.
В итоге в одном месте было внесено изменение и вместо команды as.integer() стала использоваться as.integer64() из пакета bit64.
И всё было нормально до сегодняшнего дня. Сегодня мы обнаружили, что в результатах опроса, который проводился за пределами нашего региона - присутствуют русские игроки. Их немного и они ни на что не влияют в результатах, но их там быть заведомо не могло.
Расследование показало, что as.integer("") - это NA, пропуск. А as.integer64("") - это 0, число. И вот этот нулевой идентификатор определялся как русский. Потому что 0 попадает в интервал русских идентификаторов.
Понимаю, что это скучная история, но кроме этого чатика меня нигде не поймут...