Size: a a a

Архитектура ИТ-решений

2020 December 21

DM

Denis Migulin in Архитектура ИТ-решений
данные - это сегментирование пользователей для рекламы
качество контента тут работает на удержание пользователей, т.е. это способ, а не цель
источник

AP

Alexey Pryanishnikov in Архитектура ИТ-решений
Denis Migulin
хотя уже есть подход к "обфускации" поведения в соцсети, когда параллельно с основной сессией открывается куча дополнительных, которые что-то смотрят по разным темам
это называется "миксер", но на сетевом уровне бороться с этим достаточно просто, эффективен подход только в районе аппликативного
источник

DM

Denis Migulin in Архитектура ИТ-решений
Alexey Pryanishnikov
это называется "миксер", но на сетевом уровне бороться с этим достаточно просто, эффективен подход только в районе аппликативного
вот это не понял. если это сделано плагином в браузере, как с этим бороться? паттерны выявлять только в работе плагина
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Denis Migulin
данные - это сегментирование пользователей для рекламы
качество контента тут работает на удержание пользователей, т.е. это способ, а не цель
Как быть это сказать. Воя я ввожу фейковые данные вообще, там полная херня в моих данных. Но вы по просмотру моих постов, в целом по поведению моему меня сегментируете, сравнивая с другими такими же придурками. Понятно примерно?
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Когда я комментирую статьи в Форбсе, мне часто будьдоги и носороги отвечают, причём в солнцезащитных очках и непременно из США.
источник

DM

Denis Migulin in Архитектура ИТ-решений
СС получает ваши данные и говорит, на какую рекламу вы скорее всего отреагируете и продает вас рекламным сетям
но поскольку ваши данные фейковые, то вы вообще не заинтересованы в этой рекламе
ок, вы развели рекламщиков на потерю денег в пользу СС, ценой потраченного времени. вопрос - нафига это вам?
источник

DM

Denis Migulin in Архитектура ИТ-решений
ну и есть еще 100 обычных юзеров, поэтому со временем СС научится вас отсекать от хорошей выборки
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Denis Migulin
СС получает ваши данные и говорит, на какую рекламу вы скорее всего отреагируете и продает вас рекламным сетям
но поскольку ваши данные фейковые, то вы вообще не заинтересованы в этой рекламе
ок, вы развели рекламщиков на потерю денег в пользу СС, ценой потраченного времени. вопрос - нафига это вам?
Да ладно, так не работает вообще. Вы меня отсегментировали, поняли что я придурок. Вы знаете, что нравится таким же придуркам как я. Я устал, на эмоциях, рационально не могу принимать решения в этом состоянии. Вы мне рекламу показали, я взял и купил.

Любой (почти) начинающий маркетолог знает, что большинство покупок осуществляется на эмоциональном уровне.
источник

DM

Denis Migulin in Архитектура ИТ-решений
Gennadiy Kruglov
Как быть это сказать. Воя я ввожу фейковые данные вообще, там полная херня в моих данных. Но вы по просмотру моих постов, в целом по поведению моему меня сегментируете, сравнивая с другими такими же придурками. Понятно примерно?
перечитал еще раз. в итоге похоже мы друг с другом согласились и спорить не о чем )
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Есть)) О качестве данных бессмысленно говорить в этом контексте. Это моё мнение.

И ещё мой мнение, что для разработки информационных продуктов не всегда нужны качественные данные
источник

AP

Alexey Pryanishnikov in Архитектура ИТ-решений
Denis Migulin
вот это не понял. если это сделано плагином в браузере, как с этим бороться? паттерны выявлять только в работе плагина
это зависит от области действия сбора данных.
Если собирает соцсеть, то ок.
А если собирает провайдер, то небольшой шум на трафике в одну конкретную соцсеть погоды для классификации профиля пользователя не сделает (там обычно вообще не важно, что именно внутри конкретного сайта делает пользователь). Ну и потом, поведение в браузере это вообще малая часть данных же.
Тогда уж надо для банковских транзакций миксер применять, для звонков телефонных и смс входящих, роутер домашний паразитным трафиком нагрузить и т.п.
источник

DM

Denis Migulin in Архитектура ИТ-решений
Gennadiy Kruglov
Какая природа у качественных данных?

Поьзователь по закону или в соответствии с договором ОБЯЗАН передавать достоверные данные о себе.

Откуда ошибки:
- Данные кто-то неправильно ввёл или он сам неправильно ввёл.
- Данные устарели (несвоевременно обновлялись).
- Интегрируются разные системы у которых разные модели и форматы  данные, не до конца разобрались как сопоставить данные и/или допустили ошибки при преобразовании.

Вот в этих случаях, когда пользователи обязаны предоставить достоверные данные, можно провести работу над восстановлением качества.

В иных, весьма спорно.
просто вот с этим не сходится. сегментирование придурков - это достаточно качественные данные (иначе бизнес бы не работал), хотя пользователь ничего и необязан
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Denis Migulin
просто вот с этим не сходится. сегментирование придурков - это достаточно качественные данные (иначе бизнес бы не работал), хотя пользователь ничего и необязан
Нет, сегментирование - это алгорим или модель ИИ. Алгорим или модель - это не данные, а информационный продукт построенный на данных.

Качественную модель, то есть модель с достаточно высокой точностью можно построить и на некачественных данных, но данных должно быть много
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Иными словами, если человек сам не напишет, что он придурок, это со временем можно понять по его поведению.
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Справедливости ради

Наборы данных для обучения (датасеты) могут в итоге быть качественные, у них качество данных достаточное для решения задач обучения моделей

И датасеты - это тоже информационный продукт

В любом случае, тут речь не идёт о качестве клиентских данных. Клиентские данные в нашем случае - это некачественное сырьё.

И много инвестировать в него смысла нет. Нет смысла много инвестировать в качество руды. Нужно улушать качество её обработки.

И чем ниже качество руды, тем больше её нужно для получения продукта.

Это ответ на вопрос, зачем нужны большие данные
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
То же самое относится и к банковским клиентским данным

Сами по себе данные клиентов банков - это сырьё, хоть и высококачественное, потому что к нему предьявляются высокие требования. Эти данные довольно точно отражают объекты реального мира и уж тем более на их основе можно принимать решения и производить операции.

И это сырьё имеет самостоятельную ценность

А вот золотая запись - это уже информационный продукт, потому что он построен на основе анализа данных.

Да, информационный продукт - это data product по-английски. Но на русском определение точнее, потому что между данными и информацией есть разница, а мы говорим именно об информации.
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
На сегодня всем спасибо!))
источник

I

Ivan in Архитектура ИТ-решений
У него еще в pdf формате есть то же самое https://martin.kleppmann.com/2020/11/18/distributed-systems-and-elliptic-curves.html
источник

I

Ivan in Архитектура ИТ-решений
Ivan
У него еще в pdf формате есть то же самое https://martin.kleppmann.com/2020/11/18/distributed-systems-and-elliptic-curves.html
А, кстати, под видео есть эта ссылка на pdf. Не обратил внимания.
источник

I

Ivan in Архитектура ИТ-решений
Leonid Vygovskiy
http://book.mixu.net/distsys/ и вот тоже в тему
👍)) хороший файл
источник