Телеграмм чат группы proalgorithms страница 3545

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

pro.algorithms

1767 membersпожаловаться на группу

2020 September 10

V🇺

Vladislav 🇺🇸🚜🇷🇺... in pro.algorithms

Constantine Drozdov

мне кажется, что главный вопрос RL что мы оптимизируем

есть формулировка Actor-Critic, в ней у нас есть две части: Actor - по стейту дает распределение над действиями и Critic - по стейту дает матожидание результата в предположении что мы действуем соответственно Actor'у

источник

21:23пожаловаться #1

CD

Constantine Drozdov in pro.algorithms

Vladislav 🇺🇸🚜🇷🇺

есть формулировка Actor-Critic, в ней у нас есть две части: Actor - по стейту дает распределение над действиями и Critic - по стейту дает матожидание результата в предположении что мы действуем соответственно Actor'у

похоже, что это баззворды про эту же схему

источник

21:24пожаловаться #2

CD

Constantine Drozdov in pro.algorithms

вопрос - она работает, когда ожидаемое расстояние в графе от старта до финиша так эдак 20?

источник

21:25пожаловаться #3

CD

Constantine Drozdov in pro.algorithms

и при этом граф очень широкий сам по себе

источник

21:25пожаловаться #4

V🇺

Vladislav 🇺🇸🚜🇷🇺... in pro.algorithms

зависит

источник

21:26пожаловаться #5

V🇺

Vladislav 🇺🇸🚜🇷🇺... in pro.algorithms

в нардах работает, например

источник

21:26пожаловаться #6

CD

Constantine Drozdov in pro.algorithms

Vladislav 🇺🇸🚜🇷🇺

зависит

условно граф подмножеств, старт в маске 0, финиш в маске -1, быстро придумает биткаунт?

источник

21:26пожаловаться #7

V🇺

Vladislav 🇺🇸🚜🇷🇺... in pro.algorithms

Vladislav 🇺🇸🚜🇷🇺

в нардах работает, например

классическая работа по теме https://en.wikipedia.org/wiki/TD-Gammon

TD-Gammon is a computer backgammon program developed in 1992 by Gerald Tesauro at IBM's Thomas J. Watson Research Center. Its name comes from the fact that it is an artificial neural net trained by a form of temporal-difference learning, specifically TD-lambda.

источник

21:26пожаловаться #8

CD

Constantine Drozdov in pro.algorithms

Vladislav 🇺🇸🚜🇷🇺

классическая работа по теме https://en.wikipedia.org/wiki/TD-Gammon

TD-Gammon is a computer backgammon program developed in 1992 by Gerald Tesauro at IBM's Thomas J. Watson Research Center. Its name comes from the fact that it is an artificial neural net trained by a form of temporal-difference learning, specifically TD-lambda.

это буквально то, что я описываю, для нард?

источник

21:27пожаловаться #9

V🇺

Vladislav 🇺🇸🚜🇷🇺... in pro.algorithms

Constantine Drozdov

это буквально то, что я описываю, для нард?

да

источник

21:27пожаловаться #10

CD

Constantine Drozdov in pro.algorithms

Vladislav 🇺🇸🚜🇷🇺

да

легчайший велосипед в моей жизни, хех

источник

21:28пожаловаться #11

V🇺

Vladislav 🇺🇸🚜🇷🇺... in pro.algorithms

ну может не совсем буквально, но близко

источник

21:28пожаловаться #12

CD

Constantine Drozdov in pro.algorithms

это будет работать, если я сам нахерачу рандомной фигни вместо нейронки?

источник

21:28пожаловаться #13

CD

Constantine Drozdov in pro.algorithms

как примерно контролировать что все идет по плану?

источник

21:28пожаловаться #14

CD

Constantine Drozdov in pro.algorithms

по a * log t + b модели для невязки?

источник

21:29пожаловаться #15

V🇺

Vladislav 🇺🇸🚜🇷🇺... in pro.algorithms

Constantine Drozdov

это будет работать, если я сам нахерачу рандомной фигни вместо нейронки?

смотря насколько твоя рандомная фигня способна приблизить истинную функцию

источник

21:30пожаловаться #16

CD

Constantine Drozdov in pro.algorithms

Vladislav 🇺🇸🚜🇷🇺

смотря насколько твоя рандомная фигня способна приблизить истинную функцию

наверное, качество приближения я увижу в ожидании невязки
кроме того, в моей рандомной фигне должно быть достаточно много параметров, чтобы не свалиться в локальный оптимум, очевидно

источник

21:30пожаловаться #17

CD

Constantine Drozdov in pro.algorithms

Vladislav 🇺🇸🚜🇷🇺

смотря насколько твоя рандомная фигня способна приблизить истинную функцию

и да, по-моему Alpha* использует другую схему, почему?

источник

21:39пожаловаться #18

V🇺

Vladislav 🇺🇸🚜🇷🇺... in pro.algorithms

Constantine Drozdov

и да, по-моему Alpha* использует другую схему, почему?

alpha* вообще не про это же?

источник

22:33пожаловаться #19

CD

Constantine Drozdov in pro.algorithms

Vladislav 🇺🇸🚜🇷🇺

alpha* вообще не про это же?

ну я про AlphaGo etc

источник

22:34пожаловаться #20