Size: a a a

Архитектура ИТ-решений

2020 November 02

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Eugene Istomin
Твой выход )
Что раскатаем? Greenplum? Hive?  Если у тебя есть пара миллионов рублей - что раскатаем?
Для чего?))
Для решения аналитических задач, и то и другое) Они для решения разных аналитических задач
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Eugene Istomin
Понятно, что за 70 млн можно пойти вот сюда
Схема не читается ваще)
источник

EI

Eugene Istomin in Архитектура ИТ-решений
Gennadiy Kruglov
Для чего?))
Для решения аналитических задач, и то и другое) Они для решения разных аналитических задач
На первой волне MVP ты не всегда понимаешь, сколько каких данных будет.
Сколько метаданных нужно будет - и дело не в количестве, а в пропорциях "горячие - холодные".

Молодёжь начинает с понятных табличных PG + какой-нибудь redis рядом
Чуть постарше идут в GP/шардирование
источник

EI

Eugene Istomin in Архитектура ИТ-решений
Gennadiy Kruglov
Для чего?))
Для решения аналитических задач, и то и другое) Они для решения разных аналитических задач
Для того, чтобы проверить десять-пятнадцать гипотез по пути к MVP, не сильно мутируя при этом со слоем хранения
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Eugene Istomin
На первой волне MVP ты не всегда понимаешь, сколько каких данных будет.
Сколько метаданных нужно будет - и дело не в количестве, а в пропорциях "горячие - холодные".

Молодёжь начинает с понятных табличных PG + какой-нибудь redis рядом
Чуть постарше идут в GP/шардирование
Ты понимаешь, что одним покемоном не решать задачу?

Горячие, допустим в PG. Холодные - в Хадупе.
источник

EI

Eugene Istomin in Архитектура ИТ-решений
Gennadiy Kruglov
Ты понимаешь, что одним покемоном не решать задачу?

Горячие, допустим в PG. Холодные - в Хадупе.
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Eugene Istomin
Для того, чтобы проверить десять-пятнадцать гипотез по пути к MVP, не сильно мутируя при этом со слоем хранения
Polyglot Persistent
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Допустим. Я имел ввиду экосистему Hadoop
источник

EI

Eugene Istomin in Архитектура ИТ-решений
Gennadiy Kruglov
Допустим. Я имел ввиду экосистему Hadoop
Да это понятно :)
Но на 3 млн не стоит идти в капекс, и покупать датаноды + настройку + ...
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Эластик причём тоже, то есть и Хадуп и Эластик. Эластик - для полнотекста, если полнотекст нужен
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Eugene Istomin
Да это понятно :)
Но на 3 млн не стоит идти в капекс, и покупать датаноды + настройку + ...
Тогда всё на PG
Ну или PG + Elastic
источник

EI

Eugene Istomin in Архитектура ИТ-решений
Gennadiy Kruglov
Тогда всё на PG
Ну или PG + Elastic
Нееее )
Это не вариант ) Потому что к PG ты не подцепишь ни аналитику, ни графы. Да, там есть GEO-движок хороший, но он не нужен тут
источник

EI

Eugene Istomin in Архитектура ИТ-решений
Gennadiy Kruglov
Тогда всё на PG
Ну или PG + Elastic
PG избыточна тут, имхо
Зачем тебе железные таблицы, если есть облачный хадуп?
источник

EI

Eugene Istomin in Архитектура ИТ-решений
Если мы говорим про консистентность данных (pk, fk связки) - то кроме локальных pg есть другие варианты
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Eugene Istomin
Нееее )
Это не вариант ) Потому что к PG ты не подцепишь ни аналитику, ни графы. Да, там есть GEO-движок хороший, но он не нужен тут
Почему не подцепишь? Ещё как подцепишь. Jupiter + Python + pandas + scikit-learn + seaborn + ...

Ты же MVP делаешь

PG и Elastic, Elastic для полнотекста, в PG его нет, а полнотекст почти всегда нужен
источник

EI

Eugene Istomin in Архитектура ИТ-решений
Gennadiy Kruglov
Почему не подцепишь? Ещё как подцепишь. Jupiter + Python + pandas + scikit-learn + seaborn + ...

Ты же MVP делаешь

PG и Elastic, Elastic для полнотекста, в PG его нет, а полнотекст почти всегда нужен
Оп, и тут у тебя app-часть начинает сотни часов есть.

» Elastic для полнотекста
На 2020 спорно, ES сейчас это не просто sphinx-like
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Вся аналитика сейчас на Python. GP - это если тебе нужен какой-нибудь бизнес дата вольт и BI-ные тулы сверху
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Eugene Istomin
Оп, и тут у тебя app-часть начинает сотни часов есть.

» Elastic для полнотекста
На 2020 спорно, ES сейчас это не просто sphinx-like
Конечно, он мощный да. Ну хорошо, ещё для телеметрии, всей, логи, трассировки, метрики
источник

EI

Eugene Istomin in Архитектура ИТ-решений
Gennadiy Kruglov
Конечно, он мощный да. Ну хорошо, ещё для телеметрии, всей, логи, трассировки, метрики
Ну вот ещё дальше :)
Кроме телеметрии ) Готов ли ты про бизнес-данные говорить?
источник

GK

Gennadiy Kruglov in Архитектура ИТ-решений
Eugene Istomin
Ну вот ещё дальше :)
Кроме телеметрии ) Готов ли ты про бизнес-данные говорить?
Нет конечно)
Кроме телеметрии и полнотекста, заметь) При этом, полнотекст - это ешё одна read model
источник