я не уверен, что есть устойчивая корелляция каких-то свойств интернет-поведения с методиками диагностики личности. также не уверен, что свойства личности устойчиво кореллируют с эффективностью рекламы.
За предсказанием черт личности по поведению в интернете есть простая аксиоматика - если человек не пытается притворяться кем-то другим, а "действует" в интернете самостоятельно и по своей воле, то это его как-то отличает от других.
Если взять историю браузинга 100 000 человек и сравнить друг с другом - окажется, что они отличаются. Отличия будут находится в сочетаниях мелких тематик, тональностей текста и даже конкретных формулировках, которые так или иначе больше нравятся одним и меньше другим. Ну то есть - одни будут читать про то, что "Прошенко снова напился и избил депутатов", а другие "S&P поднял рейтинг компании A"
В общем, для этого и есть та самая пресловутая Big Data - на больших числах видно, как человек проявляет устойчивые "паттерны"
А дальше вопрос, как эти паттерны интерпретировать. И тут нам нужна методика, которая будет отвечать двум критериям: 1. внеконтекстуальность - то есть это должна быть некая характеристика, которая человеку в целом присуща по жизни 2. устойчивость - она должна быть не про "сейчас", а про свойственно всреднем по жизни.
Таких "фичей" у человека не так много - одна из них черты. И конкретно, например, большая пятерка. Но не только - ценности (по Шварцу) и интеллект (который не IQ, а факторы из General g).
Если мы говорим про большую пятерку - ценность модели в том, что она подтверждена статистически (математически) - то есть на протяжении дестяков лет в разных частях планеты, у разных полов и возрастов, факторная структура сходилась (= действительно характеристики формирующие ту или иную черту закономерно в равной пропорции пристутствовали вместе)
То есть мы можем опереться как на нечто твердое - доказано, что с помощью большой пятерки можно описать любую личность закономерно и неслучайно. А из этого следует (опять же чисто математически), что с помощью такого подхода можно описать определенную долю дисперсии поведения - то есть не "угадать", а именно предсказать с вероятностью более высокой, чем случайность
И здесь очень важна ремарка, что на человека влияет сотни или тысячи факторов каждую секунду - от веществ, попавших с едой, настроения до конкретного детского воспоминания. Хорошо было бы учитывать все это. Тот, кто изобретет такого рода технологию - станет, увы, властелином мира и олицетворением всего того, о чем нас пугают в контексте больших данных. Ну а если у нас этого нет, то можно хотя бы попробовать использовать черты, ценности и интеллект - как устойчивые во времени и объясняющие достаточно значимый процент дисперсии поведения/предпочтений и т.п.
Теперь про рекламу - конечно, напрямую большая пятерка и другие характеристики не указывают на выбор или предпоятения. Но если мы говорим, что они валидно отличают людей друг от друга по параметрам, связанным с убеждениями, отношением к себе, жизни и т.п., то мы можем утверждать, что связь между устойчивыми диспозициями (чертами, ценностями...) и лайкингом/поведением есть. Не 100%, но много превосходящая случайность
Предположим, я человек, не уверенный в себе, но считающий, что в мире - главное свобода и хорошее отношение друг другу. Какая вероятность, что мне нужно показывать рекламу Хаммера?
А рекламу книги по восточным практикам?
А если вы знаете, что я такой - знаете ли вы, как мне продать, например, абонемент в фитнес клуб? :)
В общем, здесь чистая математика и статистика, как бы это странно и непривычно ни звучало в контексте таких потерявших в свое время научное доверие дисциплин, как психология и реклама :)