Телеграмм чат группы proalgorithms страница 4009

Не-а. Проверка вхождения в хеш-таблицу выполняется за О(1) в любом случае.

17:25пожаловаться #1

> подразумевает перебор всех email в таблице которую пытаетесь получить.

Естественно нет. В этом и смысл хэш-таблицы, что поиск ключа работает за O(1) (в данном случае за O(длина строки), но длина строки * число строк это как раз размер инпута, так что все ок))

17:25пожаловаться #2

Если это кажется магией, то можно проще сделать.

17:26пожаловаться #3

Составим массив из пар (email, юзер) и отсортируем его.

Теперь если мы видим две идущих подряд пары вида (email, user1) и (email, user2), то добавляем ребро user1 <-> user2.

Итого получили честный O(n log n) (не линия конечно, но гораздо лучше квадрата)

17:27пожаловаться #4

А, судя по первому посту надо именно O(n). Тогда без хэш-таблицы, думаю, не обойтись.

17:31пожаловаться #5

ГР

Геннадий Романов... in pro.algorithms

а можно ссылку?

17:37пожаловаться #6

Реализации хеш-таблиц встроены почти во все языки. На чем вы пишете?

17:43пожаловаться #7

Kelbon in pro.algorithms

просто загугли что такое хэш таблица

17:43пожаловаться #8

ГР

Геннадий Романов... in pro.algorithms

java

17:44пожаловаться #9

Тогда используйте HashMap)

17:44пожаловаться #10

ГР

Геннадий Романов... in pro.algorithms

ну всё правельно сложность вставки в худщем случае составляет O(n)
для 1 элемента! а у нас n вставок

17:49пожаловаться #11

Сложность вставки и поиска в хеш-таблицах - О(1).

17:49пожаловаться #12

Kelbon in pro.algorithms

да откуда ты постоянно придумаешь, что "ну правильно"))))))

17:49пожаловаться #13

В среднем там O(1), и суммарно выйдет O(n)

17:50пожаловаться #14

Да, суммарно, для всех элементов выйдет O(n), то есть алгоритм отработает линейно

17:51пожаловаться #15

В случае с хэш-таблицами есть две причины, по которым запрос может работать долго.

1. Коллизии (несколько ключей с совпадающим или почти-совпадающим (в некотором смысле) хэшем). Вероятность коллизии стремится к 0 при росте n, поэтому асимптотику не портит. Если входные данные не специально подобраны или же параметры хэша выбираются случайно, то и на практике ничего плохого не случится.

2. Рост. Как и у обычного вектора, у таблицы есть некоторая емкость. Когда она заполнена, и снова делается вставка, то эта таблица растягивается в два раза, и все ключи повторно в нее вставляются. Но это вообще никак не портит асимптотику, потому что суммарно это будет стоить 1 + 2 + 4 + ... + n = 2n = O(n) на все n вставок.

17:55пожаловаться #16

Если ты хочешь алгоритм, который работает за линию детерминированно, то это надо уточнить отдельно. Но смысл такого требования сомнителен.

17:56пожаловаться #17

Constantine Drozdov in pro.algorithms

ну там вроде вместо ленивого перестроения активного хватит, чтобы убрать амортизацию

17:57пожаловаться #18

Амортизация тут не мешает вроде, онлайн-то не нужен.

17:57пожаловаться #19

Constantine Drozdov in pro.algorithms

я к тому, что пункт (2) всегда можно убрать, если есть требование