Size: a a a

Чат конференции HighLoad++

2020 February 06

A

Aleksandr in Чат конференции HighLoad++
Vasiliy Romaneev
что такое шелбот ?
я просто не в курсе.

P.S> я всё равно не могу понять что вас беспокоит.
да, в интернете все всех сканируют.
в чём проблема ?
AS Яндекса ?
подозреваете, что их поломали?
репортите.
меня ничего не беспокоит, я же вроде чётко описал вопрос - это официальный бот или нет (не обязательно поломали)
мне настраивать систему, внося в whitelist эти адреса или дать ей блочить их дальше, считая, что это левый бот

» подозреваете, что их поломали?  репортите.
может это какая-то vps-подсеть облака или ещё чего...
я подумал возможно кто-то из этой конфы даст намётки куда копать...

судя по всему вы не сможете мне ответить Василий,
меня ничего не беспокоит совсем, мне просто надо знать официальный это бот или нет, я безусловно спрошу у поддержки, но подумал возможно кто-то натолкнёт на мысль раньше...
источник

r

rad1k4l in Чат конференции HighLoad++
Maxim
Доброе утро. Подскажите, пожалуйста, есть магазин на OpenCart 1.5 на довольно неслабом VDS. Сайт периодически ложится, когда партнеры и маркетплейсы начинают качать с него фиды товаров. Как-то можно оптимизировать генерацию фидов, кроме кеширования файла? Какие лучшие практики вообще? Может делать репликацию БД на другой сервер и с него отдавать?
ставьте кеш на редис
источник

M

Maxim in Чат конференции HighLoad++
Спасибо всем, но пагинация здесь вообще ни при чем. При генерации фида туда добавляются все товары. В случае с опенкартом одним запросом не обойдешься, так как нужно выбрать для каждого товара все изображения, высчитать цену с учетом акций, сгенерировать описание из атрибутов, сгенерировать сео урл и т.д. Просто хочется узнать как такие вещи реализованы в крупных магазинах.
источник

AE

Alexey Er in Чат конференции HighLoad++
Vasiliy Romaneev
что такое шелбот ?
я просто не в курсе.

P.S> я всё равно не могу понять что вас беспокоит.
да, в интернете все всех сканируют.
в чём проблема ?
AS Яндекса ?
подозреваете, что их поломали?
репортите.
Почему вас так беспокоит, что у кого-то есть вопрос, на который у вас нет ответа? Здесь могут найтись и более сведущие специалисты (например, из Яндекса).
источник

AE

Alexey Er in Чат конференции HighLoad++
Maxim
Спасибо всем, но пагинация здесь вообще ни при чем. При генерации фида туда добавляются все товары. В случае с опенкартом одним запросом не обойдешься, так как нужно выбрать для каждого товара все изображения, высчитать цену с учетом акций, сгенерировать описание из атрибутов, сгенерировать сео урл и т.д. Просто хочется узнать как такие вещи реализованы в крупных магазинах.
Полагаю, крупные просто не выкладывают фид ;)

Знаю один сервис, которого каждый день сканит пара других крупных сервисов. Выкачивают и парсят с веба десятки миллионов позиций. Оверхед приличный, но всё штатными средствами, по-кусочкам, без транзакций в базе на 2 часа.
источник

N

Nikolay in Чат конференции HighLoad++
Будет ли когда -то отдельная конференция по базам данных ? Или смысла нет и это как часть хайлоад нормально идёт ?
источник

AE

Alexey Er in Чат конференции HighLoad++
Nikolay
Будет ли когда -то отдельная конференция по базам данных ? Или смысла нет и это как часть хайлоад нормально идёт ?
Опасно концентрировать узких спецов из разных сект.
источник

N

Nikolay in Чат конференции HighLoad++
Ну на хайлоад они все дружно ходят .
источник

AE

Alexey Er in Чат конференции HighLoad++
Nikolay
Ну на хайлоад они все дружно ходят .
Потому что грамотно разбавлены.
источник

AE

Alexey Er in Чат конференции HighLoad++
Вот если бы собиралась конфа разработчиков СУБД (т.е. движков), было бы круто. И из разных направлений есть, чему друг у друга поучиться.
Но их, как я понимаю, в отдельно взятой стране не так много.
источник

vk

vladimir kunschikov in Чат конференции HighLoad++
есть у постгресоводов
источник

N

Nikolay in Чат конференции HighLoad++
На ПГ дейс я был в 2017. Народу было много. Вот может есть смысл и для конфы по базам данных . Выступили бы по ПГ , по КХ, тарантул есть.
источник

🔨

🔨🐺 SAV in Чат конференции HighLoad++
по кешу

   proxy_cache_path    /cache/nginx/store3/storage     levels=1:2  keys_zone=fm_store3_storage:32m         max_size=5g;

заполнен на
115M /cache/nginx/store3/storage

count objects
552

       location ~ '^/source/file/(\w{8}-\w{4}-\w{4}-\w{4}-\w+(\w{2})(\w{2}))\.(\w+)(?:/.+)?\.(\w+)$' {
/old/source/file/((\w{8}-\w{4}-\w{4}-\w{4}-\w{12})\.(\w+)(?:/.+)?\.(\w+))
       location ~ '^/cache/(audio|photo|video|any|doc)/(([0-9a-f]{8})(-.+)([0-9a-f]{8}))\.(\w+)\.(\w+)$' {



 1094  0:43  grep -E "[m3u8|ts|msi|apk]" /spool/log/nginx.fonmix.store.content.access.log | grep 'GET ' | grep '" 200 ' | grep -v '?time' | grep 'cs=HIT' | awk -F" " '{print $7}' | less
 1095  0:43  grep -E "[m3u8|ts|msi|apk]" /spool/log/nginx.fonmix.store.content.access.log | grep 'GET ' | grep '" 200 ' | grep -v '?time' | grep 'cs=HIT' | awk -F" " '{print $7}' > ~/store_HIT.log
 1096  0:43  grep -E "[m3u8|ts|msi|apk]" /spool/log/nginx.fonmix.store.content.access.log | grep 'GET ' | grep '" 200 ' | grep -v '?time' | grep 'cs=MISS' | awk -F" " '{print $7";M"}' > ~/store_MISS.log
 1097  0:44  grep -E "[m3u8|ts|msi|apk]" /spool/log/nginx.fonmix.store.content.access.log | grep 'GET ' | grep '" 200 ' | grep -v '?time' | grep 'cs=HIT' | awk -F" " '{print $7";H"}' > ~/store_HIT.log


 1100  0:44  cat ~/store_MISS.log ~/store_HIT.log > ~/store_ALL.log


всего объектов было запрошено
root@proxy01:~ # cat ~/store_ALL.log | awk -F";" '{print $1}' | sort | uniq | wc -l
  14485

один раз запрашивались
root@proxy01:~ # cat ~/store_ALL.log | sort -k 1 -t';' | uniq -c | awk -F" " '{print $1";"$2}' | awk -F";" '{if($1=="1")print }'|wc -l
  14137

из них попало в кеш
root@proxy01:~ # cat ~/store_ALL.log | sort -k 1 -t';' | uniq -c | awk -F" " '{print $1";"$2}' | awk -F";" '{if($1=="1")print }' | grep ";H" | wc -l
42

не попало
root@proxy01:~ # cat ~/store_ALL.log | sort -k 1 -t';' | uniq -c | awk -F" " '{print $1";"$2}' | awk -F";" '{if($1=="1")print }' | grep ";M" | wc -l
  14095

запрашивались более 1 раза
root@proxy01:~ # cat ~/store_ALL.log | sort -k 1 -t';' | uniq -c | awk -F" " '{print $1";"$2}' | awk -F";" '{if($1!="1")print }' | wc -l
    532

из них попало в кеш
root@proxy01:~ # cat ~/store_ALL.log | sort -k 1 -t';' | uniq -c | awk -F" " '{print $1";"$2}' | awk -F";" '{if($1!="1")print }' | grep ";H" | wc -l
    417




  попало повторно (после MISS)
  75
root@proxy01:~ # cat ~/store_ALL.log | sort -k 1 -t';' | uniq -c | awk -F" " '{print $1";"$2}' | awk -F";" '{if($1!="1")print $2}' | sort | uniq -c | sort -n -k 1 | grep "2 "|wc -l
источник

vk

vladimir kunschikov in Чат конференции HighLoad++
uuoc
источник

VK

Venera Kasimova in Чат конференции HighLoad++
Nikolay
На ПГ дейс я был в 2017. Народу было много. Вот может есть смысл и для конфы по базам данных . Выступили бы по ПГ , по КХ, тарантул есть.
Кстати, PGDay в этом году проводится вновь. Уже открыта предварительная продажа билетов - https://pgday.ru/ru/2020.
источник

VK

Venera Kasimova in Чат конференции HighLoad++
Всем поклонникам PostgreSQL будем рады!)
источник

VK

Valeria K. in Чат конференции HighLoad++
Alexey Er
Вот если бы собиралась конфа разработчиков СУБД (т.е. движков), было бы круто. И из разных направлений есть, чему друг у друга поучиться.
Но их, как я понимаю, в отдельно взятой стране не так много.
есть pgcon.org она сугубо для разработчиков постгресса, правда в Канаде, но там действительно собирается весь core team и интересно. На https://pgday.ru/en/2020 в этом году будет очень узкая публика - только постгрес, соотв шанс встретить постгрессового разраборчика будет достаточно высокий.
источник

AE

Alexey Er in Чат конференции HighLoad++
Не знаю, зачем принялись про Постгрес рассказывать. Понятно, что в каждой отдельной тусовке есть свои оффлайн-мероприятия. Но речь шла про то, чтобы свести их всех вместе из разных песочниц, причём не только разработчиков СУБД, но и пользователей (как большинство из нас). Вот этот вариант кажется сомнительным из-за  холиварной составляющей, усиленной узкой выборкой.

Грубо говоря, для тру-сектанта на Хайлоаде есть 5% своих, 10% чужих и 85% непойми-кого. А на узкотематическом сборище будет 20% своих и 80% врагов чужих. Как тут не поубивать друг друга...
источник

N

Nikolay in Чат конференции HighLoad++
Как вы себе представляете , что пользователи кликзауса буду конфликтовать с пользователями ПГ? Часто в организациях зоопарк
источник

N

Nikolay in Чат конференции HighLoad++
Я сам выступал с докладом по ораклу на конференции pg days. И там была отдельная секция для коммерческих баз. Никто на меня не нападал и я тоже )
источник