Где почитать наврядли подскажу.
Но я бы эту задачу попробовал решить следующим образом:
Взял бы пачку заведомо "не эротишных" текстов, и пачку "эротишных". Собрал бы те слова из "эротишных", которые не встречаются в "обычных", отфильтровал бы от шума и получил этим самым набор признаков. Дальше раздать вес каждому признаку и прогнать все тексты через функцию, которая считает вес текста. Всё что превышает определённый вес - считать эротикой. )
Если задача реально важная, а не просто бытовая, то можно воспользоваться чужим трудом. Через какой-нибудь детский поиск в гугле гонять запросы и смотреть есть ли результаты в выдаче. Они уже давно эти проблемы с эротичностью решили же. Можно воспользоваться ;)