надо с формами определится.. если краудсорс то чем проще тем лучше, вплоть до гугл таблиц
я думаю надо сначала 1-3 раза все самим сделать - чтобы определить что парсим-скачиваем-определяем сами, какой формат данных нужен, объем работы
потом будет видно что там подключить для краудсорса, может и скриптами будет 1-10 видов документов и можно будет локально все сделать