欧美精品v日韩精品v国产精品_全免费a级毛片免费看不卡_91精品国产91热久久久久福利_成人毛片免费观看视频在线

DeepMind打造加強版AlphaGo 助力突破認知及推理挑戰

來源:智東西

谷歌母公司 Alphabet 旗下頂尖 AI 實驗室 DeepMind 曾因其 AI 系統 AlphaGo 擊敗頂尖人類圍棋選手、AlphaStar 贏得星際爭霸 2 而爆紅全球。本周,它又披露新的游戲 AI 系統。

與此前開發的游戲系統不同,DeepMind 的 AI 新作 Player of Games 是第一個在完全信息游戲以及不完全信息游戲中都能實現強大性能的 AI 算法。完全信息游戲如中國圍棋、象棋等棋盤游戲,不完全信息游戲如撲克等。

這是向能夠在任意環境中學習的真正通用 AI 算法邁出的重要一步。

Player of Game 在象棋、圍棋這兩種完全信息游戲和德州撲克、蘇格蘭場這兩種不完全信息游戲中與頂尖 AI 智能體對戰。

從實驗結果來看,DeepMind 稱 Player of Games 在完全信息游戲中的表現已經達到了“人類頂級業余選手”水平,但如果給予相同資源,該算法的表現可能會明顯弱于 AlphaZero 等專用游戲算法。

在兩類不完全信息游戲中,Player of Games 均擊敗了最先進的 AI 智能體。

深藍、AlphaGo 等 AI 系統僅擅長玩一種游戲

計算機程序挑戰人類游戲選手由來已久。

20 世紀 50 年代,IBM 科學家亞瑟?塞繆爾(Arthur L. Samuel)開發了一個跳棋程序,通過自對弈來持續改進其功能,這項研究給很多人帶來啟發,并普及了“機器學習”這個術語。

此后游戲 AI 系統一路發展。1992 年,IBM 開發的 TD-Gammon 通過自對弈在西洋雙陸棋中實現大師級水平;1997 年,IBM 深藍 DeepBlue 在國際象棋競賽中戰勝當時的世界棋王卡斯帕羅夫;2016 年,DeepMind 研發的 AI 系統 AlphaGo 在圍棋比賽中擊敗世界圍棋冠軍李世石……

這些 AI 系統有一個共同之處,都是專注于一款游戲。比如塞繆爾的程序、AlphaGo 不會下國際象棋,IBM 的深藍也不會下圍棋。

隨后,AlphaGo 的繼任者 AlphaZero 做到了舉一反三。它證明了通過簡化 AlphaGo 的方法,用最少的人類知識,一個單一的算法可以掌握三種不同的完全信息游戲。不過 AlphaZero 還是不會玩撲克,也不清楚能否玩好不完全信息游戲。

實現超級撲克 AI 的方法有很大的不同,撲克游戲依賴于博弈論的推理,來保證個人信息的有效隱藏。其他許多大型游戲 AI 的訓練都受到了博弈論推理和搜索的啟發,包括 Hanabi 紙牌游戲 AI、The Resistance 棋盤游戲 AI、Bridge 橋牌游戲 AI、AlphaStar 星際爭霸 II 游戲 AI 等。

這里的每個進展仍然是基于一款游戲,并使用了一些特定領域的知識和結構來實現強大的性能。

DeepMind 研發的 AlphaZero 等系統擅長國際象棋等完全信息游戲,而加拿大阿爾伯特大學研發的 DeepStack、卡耐基梅隆大學研發的 Libratus 等算法在撲克等不完全信息游戲中表現出色。

對此,DeepMind 研發了一種新的算法 Player of Games(PoG),它使用了較少的領域知識,通過用自對弈(self-play)、搜索和博弈論推理來實現強大的性能。

更通用的算法 PoG:棋盤、撲克游戲都擅長

無論是解決交通擁堵問題的道路規劃,還是合同談判、與顧客溝通等互動任務,都要考慮和平衡人們的偏好,這與游戲策略非常相似。AI 系統可能通過協調、合作和群體或組織之間的互動而獲益。像 Player of Games 這樣的系統,能推斷其他人的目標和動機,使其與他人成功合作。

要玩好完全的信息游戲,需要相當多的預見性和計劃。玩家必須處理他們在棋盤上看到的東西,并決定他們的對手可能會做什么,同時努力實現最終的勝利目標。不完全信息游戲則要求玩家考慮隱藏的信息,并思考下一步應該如何行動才能獲勝,包括可能的虛張聲勢或組隊對抗對手。

DeepMind 稱,Player of Games 是首個“通用且健全的搜索算法”,在完全和不完全的信息游戲中都實現了強大的性能。

Player of Games(PoG)主要由兩部分組成:

一種新的生長樹反事實遺憾最小化(GT-CFR)

一種通過游戲結果和遞歸子搜索來訓練價值-策略網絡的合理自對弈。

在完全信息游戲中,AlphaZero 比 Player of Games 更強大,但在不完全的信息游戲中,AlphaZero 就沒那么游刃有余了。

Player of Games 有很強通用性,不過不是什么游戲都能玩。參與研究的 DeepMind 高級研究科學家馬丁?施密德(Martin Schmid)說,AI 系統需考慮每個玩家在游戲情境中的所有可能視角。

雖然在完全信息游戲中只有一個視角,但在不完全信息游戲中可能有許多這樣的視角,比如在撲克游戲中,視角大約有 2000 個。

此外,與 DeepMind 繼 AlphaZero 之后研發的更高階 MuZero 算法不同,Player of Games 也需要了解游戲規則,而 MuZero 無需被告知規則即可飛速掌握完全信息游戲的規則。

在其研究中,DeepMind 評估了 Player of Games 使用谷歌 TPUv4 加速芯片組進行訓練,在國際象棋、圍棋、德州撲克和策略推理桌游《蘇格蘭場》(Scotland Yard)上的表現。

在圍棋比賽中,AlphaZero 和 Player of Games 進行了 200 場比賽,各執黑棋 100 次、白棋 100 次。在國際象棋比賽中,DeepMind 讓 Player of Games 和 GnuGo、Pachi、Stockfish 以及 AlphaZero 等頂級系統進行了對決。

在國際象棋和圍棋中,Player of Games 被證明在部分配置中比 Stockfish 和 Pachi 更強,它在與最強的 AlphaZero 的比賽中贏得了 0.5% 的勝利。

盡管在與 AlphaZero 的比賽中慘敗,但 DeepMind 相信 Player of Games 的表現已經達到了“人類頂級業余選手”的水平,甚至可能達到了專業水平。

Player of Games 在德州撲克比賽中與公開可用的 Slumbot 對戰。該算法還與 Joseph Antonius Maria Nijssen 開發的 PimBot 進行了蘇格蘭場的比賽。

結果顯示,Player of Games 是一個更好的德州撲克和蘇格蘭場玩家。與 Slumbot 對戰時,該算法平均每 hand 贏得 700 萬個大盲注(mbb / hand),mbb / hand 是每 1000 hand 贏得大盲注的平均數量。

同時在蘇格蘭場,DeepMind 稱,盡管 PimBot 有更多機會搜索獲勝的招數,但 Player of Games 還是“顯著”擊敗了它。

研究關鍵挑戰:訓練成本太高

施密德相信 Player of Games 是向真正通用的游戲系統邁出的一大步。

實驗的總體趨勢是,隨著計算資源增加,Player of Games 算法以保證產生更好的最小化-最優策略的逼近,施密德預計這種方法在可預見的未來將擴大規模。

“人們會認為,受益于 AlphaZero 的應用程序可能也會受益于游戲玩家。”他談道,“讓這些算法更加通用是一項令人興奮的研究。”

當然,傾向于大量計算的方法會讓擁有較少資源的初創公司、學術機構等組織處于劣勢。在語言領域尤其如此,像 OpenAI 的 GPT-3 這樣的大型模型已取得領先性能,但其通常需要數百萬美元的資源需求,這遠超大多數研究小組的預算。

即便是在 DeepMind 這樣財力雄厚的公司,成本有時也會超過人們所能接受的水平。

對于 AlphaStar,公司的研究人員有意沒有嘗試多種構建關鍵組件的方法,因為高管們認為訓練成本太高。根據 DeepMind 披露的業績文件,它在去年才首次盈利,年收入達到 8.26 億英鎊(折合約 69 億人民幣),獲得 4380 萬英鎊(折合約 3.67 億人民幣)的利潤。從 2016 年~2019 年,DeepMind 共計虧損 13.55 億英鎊(折合約 113 億人民幣)。

據估計,AlphaZero 的訓練成本高達數千萬美元。DeepMind 沒有透露 Player of Games 的研究預算,但考慮到每個游戲的訓練步驟從數十萬到數百萬不等,這個預算不太可能低。

結語:游戲 AI 正助力突破認知及推理挑戰

目前游戲 AI 還缺乏明顯的商業應用,而 DeepMind 的一貫理念是借其去探索突破認知和推理能力所面臨的獨特挑戰。近幾十年來,游戲催生了自主學習的 AI,這為計算機視覺、自動駕駛汽車和自然語言處理提供了動力。

隨著研究從游戲轉向其他更商業化的領域,如應用推薦、數據中心冷卻優化、天氣預報、材料建模、數學、醫療保健和原子能計算等等,游戲 AI 研究對搜索、學習和博弈推理的價值愈發凸顯。

“一個有趣的問題是,這種水平的游戲是否可以用較少的計算資源實現。”這個在 Player of Games 論文最后中被提及的問題,還沒有明確的答案。

關鍵詞: DeepMind 加強版 AlphaGo 助力 突破認知及

推薦

直播更多》

關閉

資訊更多》

焦點

欧美精品v日韩精品v国产精品_全免费a级毛片免费看不卡_91精品国产91热久久久久福利_成人毛片免费观看视频在线

欧美精品777| 国产精品一级片| 天天做天天摸天天爽国产一区| 国产精品丝袜一区| 日本一区二区成人| 亚洲chinese男男1069| 亚洲成av人片一区二区梦乃 | 亚洲欧美日韩小说| 99热在这里有精品免费| 热久久国产精品| 91蜜桃网址入口| 三级在线观看一区二区| 一区二区三区在线免费观看| 久久夜色精品一区| 成人av网站在线| 久久精品国产久精国产| 亚洲人成网站色在线观看| 国产婷婷色一区二区三区在线| 国产乱子伦视频一区二区三区| 国产一区 二区| 麻豆一区二区在线| 久久奇米777| 久久五月婷婷丁香社区| 8x8x8国产精品| 亚洲制服欧美中文字幕中文字幕| 久久综合久久综合久久综合| 亚洲精品免费在线| 日韩毛片精品高清免费| 国产精品色婷婷久久58| 精品国产91乱码一区二区三区 | 91精品国产综合久久久久久久 | 美女性感视频久久| 视频在线观看91| 一区二区视频在线看| 国产三区在线成人av| 欧美xxxxx牲另类人与| 91精品黄色片免费大全| 欧美亚日韩国产aⅴ精品中极品| 欧美不卡在线视频| 亚洲女同女同女同女同女同69| 爽好多水快深点欧美视频| 日韩1区2区日韩1区2区| 国产成人午夜高潮毛片| 99免费精品视频| 亚洲成人资源在线| 亚洲国产日产av| 欧美日韩电影一区| 精品久久久久久最新网址| 国产精品入口麻豆九色| 亚洲激情自拍视频| 国产精品亚洲人在线观看| 成人性视频免费网站| 亚洲影院在线观看| 欧美日韩综合不卡| 欧美国产日韩一二三区| 亚洲日本成人在线观看| 国产精品家庭影院| 婷婷综合在线观看| 狠狠色狠狠色综合| 26uuu亚洲| 欧美一区二区三区不卡| 中日韩av电影| 欧美久久久久久蜜桃| 亚洲黄一区二区三区| 成人免费观看男女羞羞视频| 亚洲第一福利一区| 欧美一区二区精品在线| 有坂深雪av一区二区精品| 亚洲激情成人在线| thepron国产精品| 久久蜜臀中文字幕| 亚洲综合成人在线视频| 亚洲国产精品精华液网站| 国产女人18水真多18精品一级做 | 中文字幕一区二区三区四区不卡| 欧美精品v日韩精品v韩国精品v| 91精品国产色综合久久不卡蜜臀| 国产精品久久二区二区| 国产清纯美女被跳蛋高潮一区二区久久w | 91在线免费播放| 五月开心婷婷久久| 国产精品久久久久久久午夜片| 国产精品毛片久久久久久| 欧美国产欧美综合| 国产精品沙发午睡系列990531| 欧美日韩一区小说| 精品日产卡一卡二卡麻豆| 亚洲男女一区二区三区| 久久99精品久久久久婷婷| 久久精品无码一区二区三区| 欧美日韩成人综合| 久久久久久一级片| 国产精品99久久久久久有的能看| 久久久精品日韩欧美| 在线一区二区观看| 久久久亚洲精华液精华液精华液| 日本不卡一区二区| 国产.精品.日韩.另类.中文.在线.播放| 一区二区三区欧美激情| 日韩欧美一二三区| 国产乱理伦片在线观看夜一区| 一区二区三区四区av| 精品国产伦一区二区三区观看体验| 五月天网站亚洲| 国产精品久久久久久亚洲伦| 国产亚洲va综合人人澡精品| av亚洲精华国产精华精华 | 91年精品国产| 91精品国产麻豆国产自产在线| 日韩影院免费视频| 一区二区视频在线| 亚洲欧美日本在线| 中文字幕精品三区| 中文字幕久久午夜不卡| 国产麻豆视频一区二区| 在线精品视频免费观看| 亚洲欧洲无码一区二区三区| 国产精品一区2区| 色激情天天射综合网| 丝袜美腿一区二区三区| 亚洲一区二区欧美日韩| 一区二区三区欧美视频| 国产精品久久久久国产精品日日| 国产日韩精品一区二区浪潮av| 成人黄色av电影| 欧美人体做爰大胆视频| 樱花影视一区二区| 99re8在线精品视频免费播放| 欧美日韩一区不卡| 久久99久久精品| 欧美四级电影在线观看| 久久99久久99| 欧美日韩久久一区| 激情五月婷婷综合| 欧美裸体bbwbbwbbw| 国产一区二区三区| 欧美日韩aaaaaa| 激情久久五月天| 欧美日韩国产三级| 国产老女人精品毛片久久| 舔着乳尖日韩一区| 日韩国产高清影视| 亚洲啪啪综合av一区二区三区| 亚洲欧洲日韩av| 亚洲欧美日韩一区二区| 在线播放91灌醉迷j高跟美女| 亚洲综合久久av| 久久久精品中文字幕麻豆发布| 国产三级精品三级| 国产精品素人一区二区| 亚洲欧美日韩成人高清在线一区| 日韩一区欧美小说| 中文字幕欧美三区| 一区精品在线播放| 精品国产乱码久久久久久夜甘婷婷| 久久综合色播五月| 中文字幕免费在线观看视频一区| 日本一区二区久久| 亚洲欧美日本韩国| 亚洲午夜三级在线| 毛片av中文字幕一区二区| 在线观看视频一区二区欧美日韩| 极品少妇xxxx精品少妇| 欧美一区二区三区视频免费 | 国产欧美日韩卡一| 国产亚洲综合色| 亚洲曰韩产成在线| 国产99久久久国产精品| 亚洲视频一区在线| 欧美日韩免费一区二区三区视频| 91麻豆国产在线观看| 亚洲综合在线电影| 日韩亚洲欧美中文三级| 中文字幕日韩一区二区| 国产精品自拍三区| 日韩久久一区二区| 欧美日韩视频在线一区二区| 日本一区二区三区高清不卡| 日本不卡高清视频| 日本一区二区三区高清不卡| 色综合久久综合网97色综合| 91在线播放网址| 日日骚欧美日韩| 久久婷婷国产综合国色天香 | 亚洲免费高清视频在线| 欧美日本精品一区二区三区| 国产精品欧美极品| 老司机免费视频一区二区| 国产精品久久久一区麻豆最新章节| 日本乱人伦aⅴ精品| 久久网站最新地址| 美女视频黄频大全不卡视频在线播放| 亚洲国产精品成人久久综合一区| 在线一区二区三区四区五区| 亚洲国产成人私人影院tom| 韩日av一区二区| 亚洲女人****多毛耸耸8| 欧美蜜桃一区二区三区| 亚洲嫩草精品久久| eeuss鲁片一区二区三区在线看|