у меня rnn в планах попробовать, но априори - без серъезной предобработки данных не взлетят. данных мало, поэтому стата не соберется. и сильно шумные данные, кур/куриный/куринный/куриная/куриные - нужно кластеризовать по синонимам. и главное - я пробовал tfidf с n-gram - они только ухудшили, значит там последовательность не играет роли, "суп куриный" и "куриный суп" - одно и тоже с точки зрения задачи, но разные с точки зрения rnn