Телеграмм чат группы bigdata

Доброе утро народ.
Простите, я полный новичок в нейросетях,возможно задаю глупый вопрос.
Писал свою библиотеку простой нейросети, и допустим нейронка выдала 0.6 а ожидаемый ответ 0.1 и чтоб найти ошибку я делаю 0.1-0.6
И вся сейросеть превращается в кашу с отрицательными весами.
Подскажите пожалуйста,что я упустил

Ну нейросеть так-то по построению - каша; это её ожидаемое свойство 😄 А в чем проблема отрицательных весов?

источник

13:56пожаловаться #11

o

oles in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

привет! подскажите плз по какому принципу версии кераса меняются, которые с тензорфалоу идут? ставилю tf v2.0 там керас 2.2.4, ставлю 1.14, там такая же версия. устанавливаю через pip

источник

15:59пожаловаться #12

o

oles in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

проверяю через 'from tensorflow import keras print(keras.version)'

источник

16:01пожаловаться #13

X

Xplwfcwef041 in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

David Dale

Ну нейросеть так-то по построению - каша; это её ожидаемое свойство 😄 А в чем проблема отрицательных весов?

Да вроди уже нет проблем)
Он и с отрицательными весами работает отлично.

источник

16:16пожаловаться #14

L

Leonid in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

коллеги, все с Новым Годом!
совет нужен..
есть 7 млн предложений (5-10 слов в каждом, но плюс в том, что все слова несут смысловую нагрузку - нет стоп слов) половина размечена на 10 классов. Проблема в том, что очень много уникальных слов получается. Т.е. тупо запихнуть в какой-нибудь векторайзер не вариант - матрица получается 7 млн х 40.000
Чем лучше подготовить данные для обучения? И вообще какую стратегию тут применить?

источник

16:50пожаловаться #15

DD

David Dale in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Leonid

коллеги, все с Новым Годом!
совет нужен..
есть 7 млн предложений (5-10 слов в каждом, но плюс в том, что все слова несут смысловую нагрузку - нет стоп слов) половина размечена на 10 классов. Проблема в том, что очень много уникальных слов получается. Т.е. тупо запихнуть в какой-нибудь векторайзер не вариант - матрица получается 7 млн х 40.000
Чем лучше подготовить данные для обучения? И вообще какую стратегию тут применить?

Можно опять таки в векторайзер, но батчами, чтобы в память влазило.
Можно слова через готовый fasttext пропустить и потом векторы усреднить в рамках одного текста (или как-то хитрее агрегировать), тогда размерность сильно меньше будет.

источник

17:09пожаловаться #16

I

Ingvar in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Leonid

коллеги, все с Новым Годом!
совет нужен..
есть 7 млн предложений (5-10 слов в каждом, но плюс в том, что все слова несут смысловую нагрузку - нет стоп слов) половина размечена на 10 классов. Проблема в том, что очень много уникальных слов получается. Т.е. тупо запихнуть в какой-нибудь векторайзер не вариант - матрица получается 7 млн х 40.000
Чем лучше подготовить данные для обучения? И вообще какую стратегию тут применить?

Смотря что с ними далее нужно делать. BPE - первое, что в голову идет.

источник

17:13пожаловаться #17

L

Leonid in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

Ingvar

Смотря что с ними далее нужно делать. BPE - первое, что в голову идет.

по тем же 10 классам раскидать..

источник

17:13пожаловаться #18

L

Leonid in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2