0
本文作者: AI研習社 | 2020-07-16 09:58 |
內容簡介 · · · · · ·
強化學習是一種重要的機器學習方法,在智能體及分析預測等領域有許多應用。
《Python強化學習實戰(zhàn):應用OpenAI Gym和TensorFlow精通強化學習和深度強化學習》共13章,主要包括強化學習的各種要素,即智能體、環(huán)境、策略和模型以及相應平臺和庫;Anaconda、Docker、OpenAIGym、Universe和TensorFlow等安裝配置;馬爾可夫鏈和馬爾可夫過程及其與強化學習問題建模之間的關系,動態(tài)規(guī)劃的基本概念;蒙特卡羅方法以及不同類型的蒙特卡羅預測和控制方法;時間差分學習、預測、離線/在線策略控制等;多臂賭博機問題以及相關的各種探索策略方法;深度學習的各種基本概念和RNN、LSTM、CNN等神經網(wǎng)絡;深度強化學習算法DQN,以及雙DQN和對抗網(wǎng)絡體系結構等改進架構;DRQN以及DARQN;A3C網(wǎng)絡的基本工作原理及架構;策略梯度和優(yōu)化問題;最后介紹了強化學習的全新進展以及未來發(fā)展。
作者簡介 · · · · · ·
Sudharsan Ravichandiran 是一位數(shù)據(jù)科學家、研究員、人工智能愛好者以及 YouTuber(搜索 Sudharsan reinforcement learning),獲得了 Anna 大學信息技術學士學位。他的研究領域包括深度學習和強化學習的實現(xiàn),其中包括自然語言處理和計算機視覺。他曾是一名自由職業(yè)的網(wǎng)頁開發(fā)人員和設計師,所設計開發(fā)的網(wǎng)站屢獲殊榮,同時也熱衷于開源,擅長解答堆棧溢出問題。
原書審稿人簡介 Sujit Pal 是 Elsevier 實驗室的技術研究總監(jiān), Elsevier 實驗室是 Reed-Elservier 集團公司下的一個先進技術團隊,研究領域包括語義檢索、自然語言處理、機器學習和深度學習。他在 Elsevier 實驗室主要從事搜索質量檢測與改進、圖像分類和重復率檢測、醫(yī)學和科學語料庫的標注與本體開發(fā)。他曾與 Antonio Gulli 合作撰寫了一本關于深度學習的著作,并在博客 Slamon Run 上撰寫了一些科技文章。
Suriyadeepan Ramamoorthy 是一名來自印度 Puducherry 的 AI 研究人員和工程師,主要研究領域是自然語言理解和推理,同時積極撰寫有關深度學習的博客文章。在 SAAMA 技術中,他將先進的深度學習技術應用于生物醫(yī)學文本分析,同時也是一名積極推動 FSFTN領域發(fā)展的免費軟件宣傳者,另外對社交網(wǎng)絡、數(shù)據(jù)可視化和創(chuàng)造性編程也非常感興趣。
補充說明 · · · · · ·
本站所有資源版權均屬于原作者所有,這里所提供資源均只能用于參考學習用,請勿直接商用。如需刪除,請聯(lián)系 kefu@yanxishe.com
AI 研習社已經和阿里大文娛、曠視、搜狗搜索、小米等知名公司達成聯(lián)系,幫助大家更好地求職找工作,一鍵投遞簡歷至 HR 后臺,準備了一些內推渠道群。
歡迎大家添加研習社小學妹微信(aiyanxishe),小學妹拉你加入(備注求職)。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
相關文章:
資料 | 1800頁33章數(shù)學方法精要筆記 —深入數(shù)學建模, 機器學習和深度學習的數(shù)學基礎
資料 | 算法(第4版)【圖靈程序設計叢書】算法領域的經典參考書
資料 |世界著名計算機教材精選:數(shù)據(jù)挖掘十大算法(中文版)
資料 | 《人工智能編程范式:通用Lisp中的案例研究》1048頁PDF免費下載
資料 | Yann LeCun「人工智能發(fā)展的挑戰(zhàn)在于無監(jiān)督學習」原版演講PPT
資料 | 【復旦大學邱錫鵬老師】面向自然語言處理的深度學習基礎,199頁ppt
資料 | 科技之巔:《麻省理工科技評論》50大全球突破性技術深度剖析
資料 | 解析深度學習:卷積神經網(wǎng)絡原理與視覺實踐
資料 | 深度學習之美:AI時代的數(shù)據(jù)處理與最佳實踐
雷峰網(wǎng)版權文章,未經授權禁止轉載。詳情見轉載須知。