Size: a a a

pgsql – PostgreSQL

2021 January 21

SB

Sergey Bezrukov in pgsql – PostgreSQL
Oleg Kuzmenko
Это не очень надежный способ, т.к. любой пиксель вправо-влево и хэш будет совсем другой
да, конечно. но это усложнит жизнь хитрецам, как правило простые меры отсеивают довольно хорошо
источник

OK

Oleg Kuzmenko in pgsql – PostgreSQL
Dimitri Grinkevich
я не про капсу, а процепочку капч — на логин, на новое объяаление, создать, на "закончить редактирование" и так далее
Это не решение, я же объясняю, что мне нужно знать наверняка, что точно такое же уже было. Или было очень похожее, чтобы уже легче было его найти и сравнить
источник

OK

Oleg Kuzmenko in pgsql – PostgreSQL
Sergey Bezrukov
да, конечно. но это усложнит жизнь хитрецам, как правило простые меры отсеивают довольно хорошо
Спасибо, это подойдет на первое время, но ищу железобетонный метод на перспективу
источник

JD

Jim Di in pgsql – PostgreSQL
а как в бд хранишь изображения? блобами или ссылки на файлы?
источник

OK

Oleg Kuzmenko in pgsql – PostgreSQL
Jim Di
а как в бд хранишь изображения? блобами или ссылки на файлы?
Ссылки на файлы, но хочу рядом битовую карту
источник

JD

Jim Di in pgsql – PostgreSQL
если сами файлы лежат где-то то проще наверное внешними средствами воспользоваться чтобы всё проанализировать и дубли выявлять. так и с изменёнными пикчами сработает где шумы добавлены и т.п.
источник

JD

Jim Di in pgsql – PostgreSQL
https://github.com/ermig1979/AntiDupl тут можно подсмотреть неплохой алгоритм, ложные срабатывания есть, но в целом всемьа неплохо находит дубликаты с различными изменениями
источник

OK

Oleg Kuzmenko in pgsql – PostgreSQL
Вот нашел на Хабре:
"Вероятнее всего, самый точный способ нахождения дубликатов — сравнение файлов через перцептивный хеш. Проверка на схожесть проводится путем подсчета количества отличающихся позиций между двумя хешами, это расстояние Хэмминга. Чем расстояние меньше — тем больше совпадение."
источник

OK

Oleg Kuzmenko in pgsql – PostgreSQL
Jim Di
https://github.com/ermig1979/AntiDupl тут можно подсмотреть неплохой алгоритм, ложные срабатывания есть, но в целом всемьа неплохо находит дубликаты с различными изменениями
Спасибо, приму во внимание
источник

JD

Jim Di in pgsql – PostgreSQL
умеет отзеркаленные искать, подходит для изображений в которых надпись на разных языках (комиксы, например) и т.п.
источник

OK

Oleg Kuzmenko in pgsql – PostgreSQL
Я почему тут спрашиваю (может показаться, что не по теме вопрос) — я видел в инете пример именно с использованием Постгреса и там прям запросами выметались похожие хеши. Балбес, не сохранил тогда ссылку
источник

OK

Oleg Kuzmenko in pgsql – PostgreSQL
Jim Di
https://github.com/ermig1979/AntiDupl тут можно подсмотреть неплохой алгоритм, ложные срабатывания есть, но в целом всемьа неплохо находит дубликаты с различными изменениями
Жаль, что это десктопная штука
источник

SB

Sergey Bezrukov in pgsql – PostgreSQL
Oleg Kuzmenko
Я почему тут спрашиваю (может показаться, что не по теме вопрос) — я видел в инете пример именно с использованием Постгреса и там прям запросами выметались похожие хеши. Балбес, не сохранил тогда ссылку
источник

JD

Jim Di in pgsql – PostgreSQL
о, круто. надо будет глянуть
источник

SS

Sergii Serogin in pgsql – PostgreSQL
хеш по картинке легко обходится дорисовкой одной точки
источник

SS

Sergii Serogin in pgsql – PostgreSQL
либо,если есть требование текста, пишешь его в разных местах
источник

OK

Oleg Kuzmenko in pgsql – PostgreSQL
Sergii Serogin
хеш по картинке легко обходится дорисовкой одной точки
Если хеш файла, то да
источник

SS

Sergii Serogin in pgsql – PostgreSQL
угу
источник

OK

Oleg Kuzmenko in pgsql – PostgreSQL
Поэтому я этот вариант сразу отбросил
источник

am

a m in pgsql – PostgreSQL
https://github.com/postgrespro/imgsmlr — по ссылке не ходил.
источник