【強化学習】n-step TD 法 - 一番使われる基礎的手法だよ【強化学習の基礎アルゴリズム】RL vol. 17 #182 #VRアカデミア #ReinforcementLearning Скачать
【LIVE】Discovering Preference Optimization Algorithms with and for Large Language Models #VRアカデミア Скачать
【強化学習】On-policy と Off-policy - 実は定義が曖昧な概念【強化学習の基礎概念】RL vol. 16 #180 #VRアカデミア #ReinforcementLearning Скачать
【強化学習】SARSA - こいつもデータを用いて最適方策を学習!【強化学習の基礎アルゴリズム】RL vol. 15 #178 #VRアカデミア #ReinforcementLearning Скачать
【強化学習】TD法 - 期待と不安が交じるベルマン作用素のデータ近似【強化学習の基礎アルゴリズム】RL vol. 13 #174 #VRアカデミア #ReinforcementLearning Скачать
【強化学習】方策反復法 - 方策評価と方策更新の繰り返しで最適方策を見つけよう!【GPIの元ネタ】RL vol. 11 #170 #VRアカデミア #ReinforcementLearning Скачать
【強化学習】GPIと構造図 - 4つの対象の関係を図示して混乱と決別する!【強化学習は、探索と学習のループ】RL vol. 8 #164 #VRアカデミア #ReinforcementLearning Скачать
【強化学習】マルコフ決定過程 - 強化学習の問題設定を決めてくれるやつ【5つのうち大事なのは2つ!】RL vol. 4 #155 #VRアカデミア #ReinforcementLearning Скачать
【LIVE】Toolformer: Language Models Can Teach Themselves to Use Tools 論文配信【Toolformer】 #VRアカデミア Скачать
【LIVE】Training language models to follow instructions with human feedback 論文配信【InstructGPT】 #VRアカデミア Скачать
【LIVE】"SGD Converges to Global Minimum ... via Star-convex Path" - 論文を読んでみる配信【学習の理論も知りたい】 #VRアカデミア Скачать
【LIVE】"Identifying and attacking the saddle point problem..." - 論文を読んでみる配信【学習の理論も知りたい】 #VRアカデミア Скачать
【深層学習】ALBERT - BERT の軽量版!Multi-Head Attention の新たな可能性【ディープラーニングの世界vol.36】#119 #VRアカデミア #DeepLearning Скачать
【深層学習】GPT-2 - 大規模言語モデルの可能性を見せ、社会もざわつかせたモデルの仕組み【ディープラーニングの世界vol.33】#113 #VRアカデミア #DeepLearning Скачать
【深層学習】忙しい人のための Transformer と Multi-Head Attention【ディープラーニングの世界 vol.29 】#107 #VRアカデミア #DeepLearning Скачать
【深層学習】Transformer - Multi-Head Attentionを理解してやろうじゃないの【ディープラーニングの世界vol.28】#106 #VRアカデミア #DeepLearning Скачать
【深層学習】 CNN 紹介 "ResNet" 言わずとしれた CNN の標準技術が登場!【ディープラーニングの世界 vol. 17】#080 #VRアカデミア #DeepLearning Скачать
【深層学習】CNN紹介 "GoogLeNet" ILSVRC2014をInceptionで制したモデル【ディープラーニングの世界 vol. 15】#078 #VRアカデミア #DeepLearning Скачать
【深層学習】CNN紹介 "AlexNet" 2012年に登場し、画像処理に革命を起こしたモデル【ディープラーニングの世界 vol. 14 】 #077 #VRアカデミア #DeepLearning Скачать
【深層学習】bi-LSTM - 前後の文脈を利用する Recurrent layer【ディープラーニングの世界 vol. 12 】 #070 #VRアカデミア #DeepLearning Скачать