Телеграмм чат группы bigdata

2) эмбеддинги и позициональные вектора просто суммируются, или с какими-то весовыми коэффициентами? как разрешаются коллизии, при которых слово А в позиции X имеет такой же вектор, как слово B в позиции Y?

Просто суммируются

источник

18:48пожаловаться #5

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Я ещё сейчас нашел zettelkasten

источник

18:49пожаловаться #6

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Я не очень вникал. Мне надо было чтоб под мак/винду и айос были приличные полнофункциональные клиенты

источник

18:49пожаловаться #7

I

Ivan in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

А, и приличная веб-версия

источник

18:49пожаловаться #8

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Вот нашёл obsidian md

источник

18:50пожаловаться #9

CT

Cookie Thief in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

toriningen

4) значения на голове трансформера (т.е. предсказанный контекст) являются чистыми эмбеддингами, без позиционального кодирования?

Позиция закладывается в самом начале при суммировании эмбеддинга токена и позишена и все

источник

18:50пожаловаться #10

t

toriningen in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Cookie Thief

Просто суммируются

а как тогда разрешаются коллизии? ведь наверняка сумма позиции и эмбеддинга неуникальна, т.к. той же сумме будет соответствовать другое слово, но в другой позиции

и нужно ли как-то предварительно нормализовать координаты позиционного и эмбеддингового векторов?

источник

18:52пожаловаться #11

CT

Cookie Thief in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

toriningen

а как тогда разрешаются коллизии? ведь наверняка сумма позиции и эмбеддинга неуникальна, т.к. той же сумме будет соответствовать другое слово, но в другой позиции

и нужно ли как-то предварительно нормализовать координаты позиционного и эмбеддингового векторов?

Теоретически возможно, хотя маловероятно. Но а так всем пофиг)

источник

18:53пожаловаться #12

t

toriningen in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

а, типа "нейронка сама выучит"? 🙂

источник

18:53пожаловаться #13

CT

Cookie Thief in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Ну типо да

источник

18:54пожаловаться #14

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

toriningen

а, типа "нейронка сама выучит"? 🙂

Проверяли различные виды эмбедингов, был ещё вариант самообучающихся, разницы особо не заметили

источник

18:54пожаловаться #15

t

toriningen in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Vadim Chashechnikov

Проверяли различные виды эмбедингов, был ещё вариант самообучающихся, разницы особо не заметили

имеются в виду эмбеддинги позиции слова, а не самого слова?

источник

18:55пожаловаться #16

VC

Vadim Chashechnikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

toriningen

имеются в виду эмбеддинги позиции слова, а не самого слова?

Угусь

источник

18:55пожаловаться #17

t

toriningen in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

мне кажется, что выученные даже хуже должны быть из-за того, что выученные не будут так легко обобщаться на неизвестные ранее длины последовательностей, но это чисто догадка

источник

18:57пожаловаться #18

CT

Cookie Thief in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

toriningen

мне кажется, что выученные даже хуже должны быть из-за того, что выученные не будут так легко обобщаться на неизвестные ранее длины последовательностей, но это чисто догадка

Дак трансформер ванильный итак не работает с текстами длиннее 512 токенов

источник

18:58пожаловаться #19

t

toriningen in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

ну вроде в архитектуре самой нет никаких ограничений?

источник

18:58пожаловаться #20