зависит от:
1) региона
2) базовой частотности каждой такой фразы
3) смысла и содержания самих фраз
4) существует ли на самом деле такая фраза, или это неявный дубль более осмысленной фразы, которая на одно слово или на один предлог длиннее
5) является ли фраза читабельной, и согласованы ли в ней набор и порядок стоп-слов
6) среднего чека/маржинальности/LTV
7) если базовая выше нескольких десятков или сотен тысяч, то по таким фразам минимальный порог отсечки точной частотности гораздо выше (см п.4)
здесь слишком много "если", чтобы однозначно и уверенно ответить, что с ними делать. я сам почти в 100% случаев убираю только высокочастотные фразы, у которых базовая частотность выше 1000, а точная = 0 или 1.
все остальные среднечастотные фразы внимательно просматриваю и решаю по месту, куда и с чем их группировать, надо ли это делать или убирать их в папку мусор.
и если не уверен, существует ли такая фраза и нет ли в таблице более осмысленных неявных дублей на 1 слово длиннее, фильтрую фразы по набору слов из этой фразы и вижу, встречаются ли ниже более логичные и читабельные фразы