小廣告

搜尋

登入區塊

棋戰

棋戰預定

主選單

誰在線上
線上目前共17
(6人在瀏覽討論區 3.0)

會員: 0
訪客: 17

尚有...

 

正在流覽:   1 名訪客



« 1 2 3 (4) 5 6 7 ... 26 »


回覆: 回覆: 回覆: 回覆: Google人工智能大突破(電腦圍棋程式) 完勝歐洲圍棋冠軍(人類職業二段)
一品•入神
註冊日期:
2005/12/2 15:46
文章: 868
離線
剛看了一位韓國電子工程教授落落長的文章,結論說,「李世乭也不需要特別的作戰策略,只要照平常下網棋的下法就可以輕鬆 5-0 獲勝。若要說有什麼特別的希望,那就是希望他能在 3-0 取得勝利後,剩下的兩盤,用全新的序盤,搭配引征、棄子作戰等手法,讓人工智慧知道,光靠演算法和強大計算力就想要來挑戰圍棋,是有其明顯的界限的。」

這大概是這幾天看到最極端的看法之一。不過也因此要修正一下自己上面提到的第ゝ點:

引文:
ゝAI 1-4或2-3:雖然輸了,但至少非完敗,且證明的確有能力打敗頂尖職棋,這是我希望至少要有的結果。個人猜測若之前打敗樊麾是低標,這第ゝ點應該是 AlphaGo 目前的高標。

若結果是這種比分,那前3局AI至少要有1勝。否則若是AI前3局三連敗,即使後兩局拿下1勝或2勝,可能也會被說是因為李世乭在嘗試各種下法試探AI,這樣的話,基本上跟ヾ的完敗也就差別不大了。也就是說,雖然是五盤大戰,但其實三盤結束後就可以說是勝負分曉了。

發佈時間:2016/2/4 20:10
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 回覆: 回覆: 回覆: Google人工智能大突破(電腦圍棋程式) 完勝歐洲圍棋冠軍(人類職業二段)

註冊日期:
2003/1/5 21:42
文章: 3705
離線
aja兄,你努力備戰吧。
相信這裡的棋友絕大多數都跟ago一樣可以等到三月,看到AlphaGo榮耀的拔起石中劍的那一刻。

發佈時間:2016/2/5 0:05
傳輸文章到其他應用程式 傳輸


回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo
一品•入神
註冊日期:
2003/9/15 10:30
來自 Taiwan
文章: 1253
離線
還有一個有趣的問題,
理論上應該比拔出石中劍更早發生才對,
那就是在九路或十一路棋盤上, 電腦是否已經無敵於人類?

發佈時間:2016/2/5 13:18
_________________
-- 數學為科學之母 ---

-- 月移花影動, 疑是故人來...
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo
副站長兼資料室室長
註冊日期:
2002/10/28 18:23
來自 地球
文章: 31309
離線
比賽確定在3月9、10、12、13、15日舉行。

已經出現了下注的盤口 : https://bitbet.us/bet/1249/alphago-wil ... e-sedol-overall-in-march/

有興趣的朋友,可以觀察到比賽日前的形勢消長!

發佈時間:2016/2/16 13:24
_________________
《圍棋十訣》 唐.王積薪
一.不得貪勝。 二.入界宜緩。 三.攻彼顧我。 四.棄子爭先。 五.捨小就大。
六.逢危須棄。 七.慎勿輕速。 八.動須相應。 九.彼強自保。 十.勢孤取和。
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo
副站長兼資料室室長
註冊日期:
2002/10/28 18:23
來自 地球
文章: 31309
離線
引文:

李世石:AlphaGo和我約差2子 想贏我還早了點
2016年02月16日09:34 新浪體育

Open in new window

李世石絲毫不懼AlphaGo

  3月9日起,李世石將與穀歌人工智能程序AlphaGO展開懸賞100萬美元的舉世矚目的圍棋人機大戰,這是1997年IBM“深藍”計算機在國際象棋項目上向人類發起挑戰並獲得成功之後,人工智能程序向人類發出的又一重大挑戰。圍棋是唯一沒有被計算機攻克的博弈遊戲項目,2014年10月,谷歌Deep Mind團隊開發的AlphaGO程序分先5比0戰勝了歐洲圍棋冠軍樊麾二段,標誌著計算機程序已具備了分先與圍棋職業棋手對抗的實力。

  之前日本的ZEN、法國的“瘋石”等著名計算機圍棋程序受讓四子戰勝過老一輩超一流九段棋手,而在去年11月於北京進行的美林谷杯世界計算機大賽,冠軍程序“石子旋風”受讓四子和五子皆不敵中國圍棋名人連笑七段,但是受讓六子獲得了勝利。在大賽期間舉行的“計算機圍棋研討沙龍”,開發者們普遍認為計算機圍棋程序尚須十年以上時間才能向人類發起挑戰,而基於蒙特卡洛算法的計算機圍棋程序已遇到瓶頸,很難逾越職業棋手“四子關”,亟需算法和理念上的新突破,當時開發者們最看好的就是神經網絡“深度學習”算法。不曾想谷歌團隊秘密開發的基於“深度學習”的AlphaGO,10月間就已突破了職業棋手的分先關。

  2月15日,谷歌宣布說2月22日在韓國棋院舉行第二次新聞發布會,公佈3月人機大戰的比賽場所、對局時間等詳細的比賽規則。2月14日,李世石接受了韓《朝鮮日報》資深圍棋記者李洪烈的電話採訪。

  -你已經充分分析了AlphaGO的實力了吧。

  “除了去年末和樊麾二段較量的棋譜,我在網上又找了3、4盤AlphaGO的棋譜進行了分析。可以說AlphaGO的確是得到飛躍性突破的計算機圍棋程序,但是實力還不足以向人類的高手發起挑戰。”

  -AlphaGO分先五戰全勝職業棋手樊麾二段。

  “我還聽說韓國棋院下游排名的職業棋手也輸給了AlphaGO,這說明AlphaGO的實力的確不容小覷。但是看AlphaGO和樊麾的棋譜,我首先覺得樊麾的實力和我差兩子。AlphaGO和我,棋份應該在讓先和二子間吧。讓兩子AlphaGO佔優,讓先我的勝算更高吧。”

  -你分析的AlphaGO優劣點是什麼?

  “AlphaGO的水平的確很高,但還看不出有什麼值得一提的特別的長處。怎麼說呢。。過分側重於某些方面,欠缺整體的完善感,而且經常出現失誤。”

  -這次人機大戰,你有五戰全勝的信心嗎?

  “只要輸一盤,就會成為人類輸給機器的信號彈,而且無論主辦方還是大部分棋迷,都會認為輸的是我。除非出現不可理喻的低級失誤,我絕不會輸。”

  -你有和機器(計算機)下過的經驗嗎?除了AlphaGO,還有很多計算機圍棋程序。需不需要練習對局?

  “我還沒和機器下過,我覺得沒什麼不同,也不想刻意練習。”

  -和計算機對局,就看不到對方的視線和表情。這種生疏的對局氛圍,應該對人不利吧?

  “這倒不用擔心,只是輸一盤人所受到的心理衝擊會更大,而且會影響下一盤。”

  -你對比賽時間有什麼看法?

  “最早主辦方向我提議每方1小時。我覺得用時會成為變數,就向主辦方提出了每方2小時。但是,用時越短,未必計算機就無條件有利。我覺得每方2小時很充分。 ”

  -和兩年前與古力下十番棋相比,哪個更緊張?

  “這次比賽沒有任何緊張感。”

  -最後談一下臨戰感想。

  “人工智能向人類發起挑戰,還屬起步的試驗階段。我想下一次的人機大戰才會撞出火花,但這一次不是。我想,真正的時機早則是兩年內會出現吧?我的任務是既不緊張、也不懈怠,認真下好比賽,把時機交給下一個階段。”

  (聯眾藍烈編譯)

原文位置:新浪棋牌新聞

發佈時間:2016/2/16 13:28
_________________
《圍棋十訣》 唐.王積薪
一.不得貪勝。 二.入界宜緩。 三.攻彼顧我。 四.棄子爭先。 五.捨小就大。
六.逢危須棄。 七.慎勿輕速。 八.動須相應。 九.彼強自保。 十.勢孤取和。
傳輸文章到其他應用程式 傳輸


回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo
一品•入神
註冊日期:
2003/9/15 10:30
來自 Taiwan
文章: 1253
離線
http://www.leiphone.com/news/201602/6P7N3M3ACmEgqa4l.html

最近, Google 人工智慧軟體 AlphaGo 將於 3 月挑戰韓國 9 段圍棋棋手李世石一事引起極大注目,大家都對這場特殊的比賽抱著強烈的好奇心。無論誰贏,都將成為一大盛事。

考量到有這麼多人關心這場比賽, Google 安排了旗下的影片網站 YouTube 屆時進行現場直播。

DeepMind 實驗室負責人 Demis Hassabis 透露,此次比賽將在韓國首爾進行,比賽日為3月9日、10日、12日、13日和15日,屆時YouTube將進行直播。

發佈時間:2016/2/16 16:59
_________________
-- 數學為科學之母 ---

-- 月移花影動, 疑是故人來...
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo
三品•具體
註冊日期:
2003/5/4 10:39
文章: 281
離線
距離比賽還有3週,我有百分百的信心,AlphaGo與李世石的五番棋大戰將會非常精彩,請大家拭目以待。

發佈時間:2016/2/16 22:09
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo
一品•入神
註冊日期:
2005/12/2 15:46
文章: 868
離線
下週一(22日)韓國時間下午5點會舉行記者會公佈對局細節。我個人比較在意的是,是直接用電腦對局,還是像樊麾時一樣由人(aja兄或其他人)代下。若由人代下,時間怎麼算?以及萬一落錯子、甚至過幾手後才發現時怎麼辦?(印象中之前Remi等人都曾發生過)

日本將棋現在都是用機械手臂代下,機械手臂的移動時間則暫停計時。用機械手臂,一來噱頭十足,二來基本上也不會下錯。

發佈時間:2016/2/16 23:18

編輯者 tadc 於 2016-02-16 23:29:44
傳輸文章到其他應用程式 傳輸


回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo
副站長兼資料室室長
註冊日期:
2002/10/28 18:23
來自 地球
文章: 31309
離線
引文:

SmartGo創始人:AlphaGo三月將變成另一隻猛獸
2016年02月16日15:03 新浪體育

Open in new window

SmartGo網站博文截圖

  新浪體育訊近日,谷歌圍棋人工智能AlphaGo約戰韓國圍棋天王李世石的事情成為各大圍棋網站關注的焦點,美國圍棋網站SmartGo刊登出一篇該網站創始人Anders Kierulf的博客文章,Anders Kierulf認為,3月份的AlphaGo將修復很多自身不足,將變成另外一隻猛獸。

  以下為該篇博文內容翻譯:

  2015年10月,谷歌的AlphaGo擊敗了歐洲圍棋冠軍樊麾二段。谷歌已經向韓國傳奇李世石九段發起了挑戰。谷歌人工智能圍棋AlphaGo有可能贏嗎?

  分析10月版的AlphaGo

  我作為一個業餘3段,基本可以看明白AlphaGo和樊麾的這五盤棋大概都發生了什麼,但職業棋手的分析,揭示了微妙之處和深層次的問題:

  金明完九段:美國圍棋協會Youtube頻道

  安永吉八段:5局棋譜和第二局視頻分析

  同樣,英國圍棋協會的材料包括智能圍棋的歷史,人機對戰的背景和國際圍棋聯合會秘書長Hajin Lee三段的分析言論。

  我從中提取了上述素材的一些結論:

  1、樊麾出現了一定數量的失誤,但李世石這種頂級棋手應該不會發生。

  2、儘管AlphaGo下的很好,但在這五盤棋裡還是出現了一些明顯的失誤。

  3、AlphaGo的計算能力(局部會推算很多變化來判斷這一手棋是否可行)非常強。

  4、AlphaGo有時會模仿職業選手的走法和遵循標準的模式,但在特殊情況下不一定是最優的。職業棋手的落子更具創造性,除了局部的價值以外,全局其他部分也會發揮微妙的作用。

  5、AlphaGo沒有深刻理解為什麼這麼下,以及這手棋對全局更深遠的影響。

  所以我堅信10月版的AlphaGo比李世石差得多。並且這五局棋只給了我們一個有限的視角來了解AlphaGo。或許他還有很多弱點我們沒發現。真正的劫爭較量只出現了一次;AlphaGo做的不錯,但是我們不知道當出現一個更複雜更激烈的打劫場面時,AlphaGo的表現將會如何。我們也不知道當出現多個脫先局面時,AlphaGo將會如何處理。

  三月版的AlphaGo令人期待

  谷歌有五個月的時間來強化AlphaGo,那他們能做些什麼呢?

  當深藍大戰時,工程師可以在比賽時調整程序,比如第一局後修復Bug。對AlphaGo來說,這或許並不容易。舉例來說,第二局第31手(如下圖)是AlphaGo的一個失誤(可去觀看金明完九段的分析)。黑31確實是正確一手,但AlphaGo對這個局面沒有足夠的理解。谷歌怎麼去解決這類問題?事實上目前對此沒有快速有效的解決辦法。

Open in new window

AlphaGo VS 樊麾第二局

  避免特定具體的錯誤是比較容易的,AlphaGo在10月時還沒有使用“開放的圖書館”(這里大概是指定式大全),但谷歌可以在今年3月前加上。以至於AlphaGo在三月對決李世石時,至少不會因定式上多次出現這類問題。

  這裡還有一些其他的措施:

  1、谷歌可以改進AlphaGo的神經網絡。他們使用3千萬位去訓練價值網絡對抗樊麾,但他們可以使用1億位的去對抗李世石。

  2、他們可以添加一個額外的落子方案訓練,隨後將這種訓練加入到價值網絡裡。

  3、他們可以微調落子和價值網絡的權重。

  4、他們可以投入更多的計算力在比賽之中,就像增加了自身的可用時間,這樣AlphaGo就可以在對方思考時做更多的計算。

  5、還有,谷歌有一個強大的團隊,他們渴望勝利。他們自會有改善的辦法拂袖而出。

  谷歌展現出了他們的信心,他們選擇了對手和時間。我期待3月版的AlphaGo能比去年對抗樊麾的10月版有顯著提升。希望它的計算能力更強,也希望它能有更好的大局觀。

  最主要的問題是這些增強措施是否足夠,或至少平衡10月版AlphaGo的弱項。谷歌的AlphaGo是一個巨大的飛躍,很難預測5個月後的AlphaGo會比10月版強多少,我非常期待。

  總結:

  從去年10月公佈的五局棋譜來看,谷歌圍棋AlphaGo非常強大,但尚未強大到可以擊敗李世石。五個月的進步,我認為AlphaGo在三月時將變成另一隻猛獸,並且與李世石的對決令人期待。如果讓我來壓勝負的話?李世石或許會輸一兩場,但將贏下本次五番棋對決。

  (作者Anders Kierulf 文森特編譯)

原文位置:新浪棋牌新聞

發佈時間:2016/2/17 9:04
_________________
《圍棋十訣》 唐.王積薪
一.不得貪勝。 二.入界宜緩。 三.攻彼顧我。 四.棄子爭先。 五.捨小就大。
六.逢危須棄。 七.慎勿輕速。 八.動須相應。 九.彼強自保。 十.勢孤取和。
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo
副站長兼資料室室長
註冊日期:
2002/10/28 18:23
來自 地球
文章: 31309
離線
引文:

《衛報》專訪哈薩比斯:讓AI尋找“元解法”
2016年02月18日13:03 新浪體育

Open in new window

尋找未來:Demis Hassabis 攝影:David Ellis

  來自theguardian
  作者:Clemency Burton-Hill
  機器之心編譯出品
  編譯:Chenxiaoqing、吳攀、柒柒、孟婷、趙巍、趙雲峰

  引言:該篇文章是《衛報》對DeepMind創始人Demis Hassabis的深度專訪,全面且深刻的還原了這位天才的性格、生活,以及對人工智能的熱情和野心。他有著近乎傳奇的早期經歷,在國際象棋、遊戲設計、計算機科學和神經科學等多個領域取得的成就形成了他從事人工智能偉大研究的完整拼圖,他稱自己為科學與創造力的結合體。Hassabis帶領DeepMind進行開創性的人工智能研究,破解圍棋這一歷史難題,研究成果在極短的時間內兩次登上《Nature》封面。而更加重要的是,DeepMind開創了一種科學研究與創業團隊完美結合的機制。DeepMind在積極探索人工智能研究和應用的同時,在人工智能倫理研究方面也走在了全世界前列。Hassabis更是通過一次長談說服了霍金,讓他不再對人工智能大放厥詞。Hassabis就像DeepMind的AlphaGo一樣,像個超人一樣保持高強度的工作和學習節奏,他把人工智能當成為之畢生奮鬥的事業,也是他生活中的一部分。而Hassabis將和他的DeepMind繼續朝著'創造解決世界上一切問題的通用人工智能'這一目標前進。

  Demis Hassabis舉止溫和,面容謙遜,而當他告訴我他正在為'破解智能難題,然後用其來解決一切問題'的使命而奮鬥時又格外認真。其他任何人說出這句話,聽起來都十分可笑,但這句話從他的口中說出就另當別論了。39歲的Hassabis是一位前國際象棋大師、遊戲設計員,他的人工智能研究創業公司DeepMind在2014年被谷歌以6.25億美元收購。

  他是移民後代,在倫敦芬奇利一所公立綜合學院上學,分別取得了劍橋大學和倫敦大學學院(UCL)的計算機科學和認知神經科學學位。與他一起工作過的人們認為他是一個'有遠見'的管理者。Hassabis認為他發現了一種'讓科學研究更有效率'的方法,並提到他正在領導一個'21世紀的阿波羅項目'。他長相如此平凡,是那種你在街上不會看第二眼的人,但Tim Berners-Lee曾經向我這麼形容他:他是這個星球上最聰明的人之一。

  每次我們打開Siri或者收到Android的推送時,都會感到人工智能已經在我們身邊。從短期來說,谷歌的產品將毫無疑問的從Hassabis的研究中獲利,儘管這些技術所帶來的個性化、搜索、YouTube、語音和人臉識別等產品的提升都沒有被定義為真正'人工智能'(Hassabis對此笑稱到:'它只是軟件,對吧?它只是一個能運行的東西。')。但從長期來說,Hassabis正在開發的技術並不僅僅局限於情感機器人和更加智能的手機,也不僅僅圍繞著谷歌。Facebook、微軟、蘋果和許多其他科技巨頭們都在如飢似渴的招攬人工智能博士生,在這場最新的科技競賽中砸入數十億美元。人工智能關注所有的事情,包括我們能想像到的,以及那些我們想像不到的。

  它確實聽起來太過野心勃勃。大部分人工智能係統應用範圍都很'窄',訓練預設程序的機器去執行特定任務,除此之外再沒什麼了。因此,IBM的深藍能在國際象棋比賽中擊敗Gary Kasparov,但卻在井字遊戲中輸給三歲孩童。而Hassabis正在把他從人腦中得到的啟髮用於構建首個'通用學習機器':一套能像生物系統一樣學習的靈活、自適應的算法,僅使用原始數據就能從頭開始掌握任何任務。

  它就是通用人工智能(artificial general intelligence ,簡稱AGI),它的重點落於'通用'上。在Hassabis眼中,未來超級智能機器將與人類專家合作解決一切問題。'癌症、氣候變遷、能源、基因組學、宏觀經濟學、金融系統、物理學等,太多我們想掌握的系統知識正變得極其複雜。'Hassabis指出:'如此巨大的信息量讓最聰明的人窮其一生也無法完全掌握。那麼,我們如何才能從如此龐大的數據量中篩選出正確的見解呢?而一種通用人工智能思維的方式則是自動將非結構化信息轉換為可使用知識的過程。我們所研究的東西可能是針對任何問題的元解決方法(meta-solution)。'

  雖然尋找'元解決方法'也許要花費數十年時間,但它看起來正在迫近。2015年2月,世界頂級科學期刊《自然》將像素遊戲《Space Invaders》作為其封面,右下角是'自我教學軟件在玩遊戲上達到了人類般的表現'。在這一期,DeepMind的論文描述了首個成功的通用'端對端'學習系統,他們的人工代理——一個針對於圖像處理單元的Deep-Q網絡算法——能夠學習如何處理屏幕的輸入值並理解其含義,並採取能實現所需結果的決策(在這種情況下,系統成為眾多雅達利2600經典遊戲,如太空侵略者、拳擊、打磚塊中的超級玩家)。這是一項讓整個科技界都為之震撼的突破。

  接著,在上個月,DeepMind又佔領了《自然》封面——在短期內獲得如此成就非常驚人。這一次,它變本加厲的挑戰上世紀70和80年代的複古遊戲。圍棋在中國有著超過2500年的歷史,曾經出現在孔夫子筆下。圍棋的分支係數非常大:每一顆棋子可能的走法數量超過了整個宇宙的原子數量,而且不像國際象棋,它無法用蠻力計算來得出結果。更加困難的是,想要寫出圍棋的評估函數是一件不可能的事,例如能夠體現出誰處於優勢位置以及優勢多少的一套規則。反而,它取決於棋手的一些類似於'直覺'的東西:當被問到為何這樣落子的時候,大師們通常的回答是'感覺如此'。

  很顯然,計算機在做出這方面的判斷時會表現很糟,圍棋也因此被認為是人工智能領域'懸而未決的重大挑戰'之一,大部分研究者預期還需要十年機器才能有希望破解它。

  DeepMind的新算法有著嚴格的同行評審證據,AlphaGo在去年秋季秘密的一場對決中以5:0擊敗了曾三次獲得歐洲冠軍的樊麾,並將在今年三月與世界冠軍李世石對決。'令人瞠目結舌的進步',帝國理工學院認知機器人學教授Murray Shanahan如此形容。'一個了不起的里程碑',超人類主義哲學家Nick Bostrom也表示同意,後者寫出的《 Superintelligence: Paths, Dangers, Strategies 》指出:如果通用人工智能可以出現,這將是一個無法比肩的事件— —借用下谷歌工程主管Ray Kurzweil的話:這將是一次撕裂歷史的斷層。Bostrom告訴我在他牛津人類未來研究所的辦公室中,AlphaGo的成就被認為'將過去幾年間機器學習所取得的進步生動的表現了出來'。

  '這非常酷。'Hassabis很平淡的說到,我們在他的辦公室討論著最新的勝利。像平常一樣,他穿著沒有任何特點的黑色上衣、褲子和鞋子:實在難以想像這實習生裝扮的傢伙拿到了谷歌的8000萬英鎊。'圍棋是一個終極目標:它是一個遊戲的巔峰,有著最豐富的智力深度。它如此迷人與美麗,令我們感到興奮不僅在於我們掌握了這個遊戲,還在於我們還用漂亮的算法完成了它。'圍棋遊戲更像是藝術而非科學,他認為:'AlphaGo以十分人類的方式下圍棋,因為它是以人類的方式進行學習,通過不停地遊戲變得更加聰明,就像你我一樣。'Hassabis也許看起來像個學生,但他更像一個驕傲的家長,AlphaGo是他職業生涯中所達到的最令人激動的成就。'比任何人所想像的都高了一個數量級,'他有些激動,'但對於我們來說,最好的在於這不是一個使用人工規則的專家系統。它藉助於通用機器學習技術教會了自己如何掌握遊戲。最終,我們想將這些技術用於重要的真實世界的問題,例如氣候模型或者復雜的疾病分析,對吧?想想它下一步能夠解決的問題真的非常令人激動!'

  我與Hasssabis的首次相遇是在2014年夏天,那是DeepMind被收購的幾個月後。自那以後,我觀察過他在各種不同壞境中工作,過去八個月中我也為這篇文章在三個不同場合正式採訪過他。那段時間我看著他從一位谷歌的人工智能天才成長為了一位引人注目的傳播者,他找到了一種高效的向類似於我這樣的非科學家描述他非常複雜的工作的方法— —對此他有極富感染力的熱情——以及為什麼這很重要。謙遜和日具風度,他非常擅長打破DeepMind的方法;也就是說他們結合新老人工智能技術的方式——比如說,在圍棋中結合使用傳統分析走子的'樹搜索'方法與現代近似於大腦神經元網絡的'深度神經網絡'——而且他們還和人工智能研究的不同領域有條理清晰的'聯姻'。

  在DeepQ中,他們將深度神經網絡與所有動物都有的通過大腦多巴胺驅動獎勵機制的'強化學習'結合了起來。而在AlphaGo中,他們更進一步又增加了另一種更深度水平的強化學習以處理長期計劃。接下來,他們將整合例如記憶功能等等——直到理論上達成每一個智能的里程牌。Hassabis說:'我們在存在多少這些能力的路線圖上有一個想法。將所有這些不同領域結合起來是其中關鍵,因為我們對那些可以在一個領域內學習又能將知識應用到新領域的算法很感興趣。'

  這聽起來有一點他的個性。乍一看他的簡歷,可以發現他頗為業餘的好奇心包含了從棋盤遊戲到視頻遊戲到計算機編程到認知神經科學等一切,更別提人工智能了。事實上,他今日成就的取得是聚焦的結果:將自己在同代人少見的強大智力與他一生專研過的學科等各方面有意識地合成在一起。(簡單點出他人生的亮點:8歲寫出自己的電腦遊戲;13歲收穫國際象棋大師地位;17歲創造了第一款包含人工智能的視頻遊戲《主題公園》;20歲以兩科優等成績獲得劍橋大學計算機科學學位;不久之後就成立了開創性的視頻遊戲公司Elixir;之後他在海馬體和情景記憶上的開創性學術研究成為了他的'最後一塊拼圖';2011年成立DeepMind。 )

  他承認:'我非常容易感到無聊,而世界又如此有趣,有太多炫酷的事情可做。'(他還保持著五次獲得智力奧林匹克運動會(Mind Sports Olympiad)精英賽Pentamind冠軍的世界紀錄,在該比賽中,挑戰者需要在多個項目中互相挑戰。)'如果我是一個體育運動員,我就會一直想成為一個十項全能選手。'

  不過體育的榮耀再也沒有希望了。Hassabis是一位忠實的利物浦球迷,喜歡觀看各種體育賽事,四歲那年他開始下國際象棋,不到一年就開始了全國比賽,不久之後又開始角逐於國際賽場。現在可以很明顯地推測出,他的一生都將與心智有關。

  1976年,他出生於倫敦北部,他有一位希臘-塞浦路斯混血的父親和一位新加坡-中國混血的母親,他是三個兄弟姐妹中最大的一個。他的父母都是教師,曾經還擁有過一家玩具店。他的妹妹是一位作曲家和鋼琴家;他的弟弟研究創意寫作。他的家庭並沒有太多的科技色彩。'顯然我是家裡另類的害群之馬,'他開著玩笑,回憶起當他還是一個小男孩時將自己的下棋獎金花在了一台ZX Spectrum 48K計算機上,然後又買了Commodore Amiga,他立即拆開了它並搞清楚了怎麼編程。'我父母有點技術恐懼。他們真的不喜歡計算機。他們是那種隨性的人。我的妹妹和弟弟也都走了藝術路線。他們沒人真正深入學習過數學或科學。'他聳聳肩表示抱歉,'所以,是的,這很怪異,我也不知道這一切都由何而來。'

  他的公司在被谷歌收購時有50多人,現在的員工人數快到接近200,他們來自45個國家,佔據了一整棟位於國王十字路的六層建築。儘管有讓他將公司搬往別處(可以推測肯定包括矽谷的山景城)的壓力,但Hassabis決心他的公司應該保持在離他的根很近的地方。

  '我是在北倫敦出生長大,'他提醒我,'我當然愛這座城市。這就是我要堅持留在這裡的原因:我覺得沒有任何理由說倫敦不能擁有一個世界級的人工智能研究所。而我也對我們現處的位置感到自豪。'這棟建築所有房間都是以知識巨人:特斯拉、拉馬努金、柏拉圖、費曼、亞里士多德、瑪麗·雪萊(他是她的粉絲?'當然,'他再次向我確認,'我讀過好幾遍《弗蘭肯斯坦》。把這些東西銘記心中很重要。')。

  建築的第一層是一間咖啡廳,裝配著裸露的磚牆和裝有客用椰子水的冰箱,還能見到在世界上大部分雄心勃勃的科技公司裡都能看到的桌上足球機和沙包。樓上則對原來的建築進行過裝修,是一個現代的開放式結構,樓上辦公室帶有一個陽台,在上面能夠欣賞到倫敦屋頂的壯麗景色。

  DeepMinder會在星期五晚上聚會暢飲。一位員工熱情洋溢地將這個活動描述為'用HIGH來結束一周'的方式。社交是生活中不可或缺的一部分:我被告知DeepMind有俱樂部、足球隊、棋類游戲俱樂部。('這一個相當有競爭力。')一張可更換照片的掛圖表明這裡每一個人每一天都是辦公桌輪用的。這是極其開放式的。我經過走道時看到這裡的工程師——男性居多——打破了人們認為的這一類人在角落裡書呆子式工作的刻板印象:這些傢伙看起來健康、快樂又很酷。不得不說這裡有一種智力的魅力在空氣中迴盪。這不奇怪。這個星球上最聰明的人正排著隊想來這里工作;而到目前為止,這裡的員工留存率是驚人的100%,儘管谷歌的最大競爭對手們對人工智能的關注正在加速,更不要說同樣求賢如渴的世界各地的一流大學了。

  '我們實在是很幸運,'Hassabis說,他將他的公司比作阿波羅計劃與曼哈頓計劃,因為該公司的雄心壯志以及其所招募的人員的水平都在以前所未有的速度攀升。'每年我們能從每個國家獲得最好的科學家。例如,我們將擁有贏得波蘭物理奧林匹克競賽的人,獲得今年法國年度最佳數學博士的人。我們得到的想法比我們獲得的研究人員還多,但與此同時,還有更多優秀人才前來,我們已應接不暇。所以我們正處在一個非常幸運的位置。唯一的限制是在不破壞這種文化氛圍的基礎上我們能吸納多少人。'

  這種公司文化要比豆沙袋(用來踢的那種)、免費午餐、天台上的啤酒等表面上的公司活動要更加深入。Hassabis堅信,谷歌的收購完全沒有讓其偏離自己的研究路徑,他說他花在DeepMind公司運作效率方面的時間一點也不比花在算法上的時間少,他認為他的公司'完美結合了最好的學術和最令人激動的創業,因此,公司充滿著驚人的能量,催生了無數創造力與進步。'他屢次提到'創造力',雖然他接受都是正規的科學訓練,但他是'天生就富有創造力和敏銳直覺'的天才。他斬釘截鐵地說:'從某種意義上來說,我不是一個標準的科學家。'DeepMind組織架構中至關重要的是被他稱之為'粘合思維(glue minds)'的東西:充分掌握各個科學領域知識的學者們能'以別出心裁的方式快速找出有前途的跨學科交叉點。'應用正確的基準,這些粘合者能以小組的形式每幾週就碰一次面,快速、靈活的將各種資源和工程師匹配到需要的地方。'因此,你將擁有一個令人難以置信的天才研究者,而且3-4名其他領域的研究者可以直接接過同一任務,基於自己的專業進行補充,這與學術界十分不同,'他描述道,'這樣所帶來的結果就是能很快地產生一些驚人的結果。'僅僅啟動了18個月的AlphaGo項目就是這一理念的完美例證。

  每天晚上,Hassabis都會乘坐北線巴士準時回家,與家人共進晚餐。他們居住在倫敦北部的海格特,距離他長大的地方不遠。他的妻子是一名意大利分子生物學家,研究阿爾茨海默症。他們有兩個兒子,一個7歲,一個9歲。Hassabis會和他們一起看書玩遊戲,或者輔導他們的家庭作業。('他們都很優秀,但他們在科學和創新方面更像是我的對立面。')

  像每個父親一樣,他會哄他們睡覺。然後在11點左右,大多數人都上床睡覺時,Hassabis會開始他稱之為的'第二天'。每天和美國團隊的電話會一般會持續到凌晨1點,之後就進入他一直持續到凌晨3、4點的'純粹思考時間':他會考慮公司的研究工作和接下來的挑戰,或者寫一份算法設計文檔。

  他承認,實際上沒有太多人工智能編程工作。'因為我現在的數學太生疏了。更多的是直覺式的思考。或者是關於公司戰略的思考:如何將其規模化,如何管理,等等。或者是想一些當天在文章和新聞中看到的東西,思考我們的研究如何和那些東西結合起來。'

  這讓我想到了AlphaGo,,它就在令人很難想像的擁有龐大計算能力的谷歌云端不停的練習、練習、再練習,每一秒、每一天都在進步,因為它學習的唯一方法就是永不停歇。

  '它會休息嗎?'我問到。

  '不,它不會休息。即便在聖誕節期間也沒有。'

  我有些猶豫:'它真的永遠不需要休息嗎?'

  '可能它就喜歡這樣(永不停歇)',他回復道,眼睛閃閃發亮。

  他說的沒錯。但Hassabis自己呢?'他絕對是個超人,'他的一名同事評價道。他休息嗎?'很難,我從來沒有將工作與生活對立起來,它們本來就是一體的。我喜歡閱讀,看電影,聽音樂,但這些東西都和我所做的工作有關。'(比如說,他是一個超級影迷,他提到了他的朋友Alex Garland,近期人工智能電影《機械姬》的導演;也提到他剛剛與美國電影製片人Brian Grazer一起開會,他認為Grazer是一個很酷的人,他們討論的話題是什麼?估計你已經猜到了——是人工智能。)'我的大腦已經完全被人工智能佔據了。'

  那他的其他方面呢?孩子、朋友和正常生活?'毫無疑問,我會盡力去平衡生活,不然確實有些瘋狂。'關於孩子們,最酷的地方是他們幾乎成為能以相同方式佔用你時間的唯一事情。

  他和朋友們保持密切聯繫:他和DeepMind的另一位聯合創始人Shane Legg相識於倫敦大學學院,他們都是PhD,對彼此比較了解,Mustafa Suleyman是他的發小。他還講了一個在劍橋和同事Dave Silver相識的過程,在業餘時間他會教Silver玩棋類游戲——包括特別古老的中國棋類。我注意到,David Silver是DeepMind AlphaGo團隊的主要程序員,也是最近Nature論文的第一作者。'是的,Dave和我認識很久了,我們曾夢想在我們的有生之年做這件事(用人工智能解決圍棋),所以(既然我們現在已經在做),當年19歲的我們應該很欣慰,我們已經走到了這一步。'

  他主動補充到:'事實確實如此,我沒有太多的正常生活。每一個醒著的時刻,我都在思考問題,或許在夢中也是如此。因為這太令人興奮了,它如此重要,這就是我最令我充滿熱情的事情。'

  從他眼裡我看到了像孩子般天真無邪的對夢想的執著。'我感覺自己很幸運,我無法想像還有什麼問題能比我研究的更加有趣,因此我會每天都在思考它們。每個時刻我都在做自己真正信仰的事情。不然我為什麼要做這些呢?人生如此短暫。'

  如果對人工智能的憂慮真的像史蒂夫·霍金、比爾·蓋茨、埃隆·馬斯克、Jaan Tallinn 和Nick Bostrom 等偉大的科學人物所說的那樣,那生命會變得更加短暫。從無節制的AGI武器到對技術奇點恐懼的擔憂都會導致一場'智能爆炸(intelligence explosion)',即機器將有能力進行無限循環的自我進化,它們將能超過人類大腦的智力,也超出我們的控制力。當超級智能災難開始顯現,歷史就不再是一個可靠指標,我們將無法預見到應該何時從人工智能軍備競賽中全身而退,直到這一切開始發生。羅伯特·奧本海默(原子彈之父)有句名言:'當你在某項技術上嚐到甜頭時,你會繼續前行,只有當你獲得技術上的成功後才會去考慮應該如何對待它。'幾十年之後,Bostrom也提到:'如果有一種方法可以保證高級人工智能永遠不會傷害人類,那這種智能就已經被創造出來了。如果沒有任何辦法去做出這種保證,那它們也有可能被創造出來。'霍金近期總結到:'在創造人工智能方面取得的成功將會是人類歷史上最重要的事情。不幸的是,這也可能是最後一件。'

  '這麼說吧,我希望不會。'Hassabis不動聲色的說到。在他看來,公眾對於通用人工智能的危言聳聽阻礙了極具潛力的近期收益,並且本質上就錯了,至少時間尺度上有問題。'我們距離那種能夠達到人類級別的通用智能還得好幾十年,'他提醒我,'我們才爬到梯子的第一級,只是在玩遊戲。'他認可有一些'合理風險需要我們現在去思考',但顯然這些並不是科幻小說裡的那些反烏托邦式的場景,在那些小說裡,超級智能機器總是會無情的除掉它們的人類造物主。

  另外,他堅信,當涉及減少通用人工智能的潛在危險時,DeepMind同樣走在了前列。雖然不像那種類似政府領導的阿波羅或曼哈頓之類的項目需要接受官方審查,但這家公司的操作相當透明。它更傾向於發布它的代碼,而和谷歌的此次交易的協議中還附帶一個條款:禁止將該技術應用於軍事或情報用途。Hassabis和他的同事們在推動2015波多黎各人工智能大會召開方面發揮了重要作用,並在呼籲將此項技術應用於'善舉'並在'避免潛在危害'的公開信上公開簽字。他們最近聯合組織了另一場在紐約的同類會議,而他們公司內部的道德董事會和諮詢委員會目前也召集完畢(儘管是秘密進行的)。Murray Shanahan表示:'Hassabis完全了解人工智能的安全係數,他當然不是天真無知,更不是把頭埋進沙子裡的鴕鳥。'

  'DeepMind在鼓勵討論這些事情方面是行業的領先者,'Bostrom對此表示了贊同,'在參與一些需要應對長期挑戰的研究方面亦是如此。'

  我讓Hassabis列出他認為的最主要的長期挑戰有哪些。'由於這些系統變得越來越複雜,我們需要思考如何充分利用它們,以及它們又能將什麼東西進行優化,如何進行優化,'他回復道:'技術本身是中立的,但它是一個學習系統,所以不可避免的,它們會承擔一些價值體系的印記和設計者的文化,所以我們需要非常小心翼翼地思考這些價值觀。'

  關於超級智能的問題,他說到:'我們需要確保目標精確詳細,並且沒有什麼模糊的地方,不會隨著時間的流逝而發生變化。但在所有的系統中,最頂層目標仍然由它的設計者確定。這可能需要係統自己想辦法達成目標,但它不能自行創造目標。'

  他的語氣讓人放心。'看吧,這些是有趣又有難度的挑戰。因為這些全新的強大技術需要符合倫理和有責任感地使用,而這就是我們積極呼籲討論和研究這一事宜的原因,所以當那個時間窗口到來時,我們能夠已經做好了準備。'

  這到底是個怎樣的時刻?當機器變成超級智能?還是機器超越了人類?他笑了,'不不不,我是說,在那之前。'(我知道他在開玩笑,儘管他的同事Shane Legg曾經在2011年明確表示:'我認為人類滅絕可能會發生,而技術可能會是罪魁禍首之一。')Hassabis聲明:'我的意思是,當這些系統更加強大,而不僅僅是玩遊戲,我們會將它們應用在更加具體、實際和重要的事情上,比如說醫療健康領域。然後,我們需要確保我們知道它們的能力能夠發展到什麼地步。'他沖我咧嘴一笑,'這將阻止機器掌管世界這一場景的發生。'

  Hassabis很愛笑。他非常友好,又極具說服力。他說的每件事都似乎都很有道理,而且並不自負,但誰知道呢:也許通用人工智能會在我們的掌控之下。但很多人持懷疑態度。'顯然,如果出現了一種在各方面都超過人類的數字智能,那“助理”這個詞就不再是個正確的描述了。'埃隆·馬斯克爭辯道,他最近將人工智能技術方面的進步描繪成人類在'召喚惡魔'。這位SpaceX創始人、特斯拉和PayPal聯合創始人也是DeepMind的早期投資者之一,但並非為了賺錢。'我不在乎為了投資而投資,'他告訴我,'我把錢投給DeepMind的唯一原因就是想要更加了解人工智能的進展和危害。如果我們不認真對待人工智能,一旦發生了什麼不好的事情,銀行存款也會變得毫無意義。'

  '埃隆是最聰明的人之一,和他交談很令人享受,'Hassabis不偏不倚的回應說,'我真的認為像他這樣的人喜歡人工智能是件非常酷的事,因為這足以說明這是件大事。'他表現的成熟老練,但其他領域的科學家對人工智能公開的隨意評論顯然激怒了他:畢竟你從來不會聽到他對粒子物理大放厥詞。

  '通常,我發現那些沒有真正研究人工智能的人們並不完全理解這些。他們通常沒有跟很多人工智能專家深入交談,他們的思想實驗就隨著他們的想法跑偏了,因為他們都是基於那些我認為並不正確的設想。'他再一次提到,他成立的內部倫理委員會和諮詢董事會——由不同科學和哲學學科方面的領袖組成——將會管控通用人工智能技術的未來使用。他堅決維護他現階段保持繼續探索的決定。'之前從未有人走到過這一步,所以在接受大眾監督之前,我們必須篩選做一些探索性工作。'他表示,這一初始階段是關於'讓所有人都跟上進度,然後在下一階段我們就能夠討論真正的算法和應用了。對很多涉及其中的人來說,這並不是他們的核心區域。我們需要他們的專業知識,但他們需要更好的了解究竟發生了什麼。'

  斯蒂芬·霍金被當作一個'跟上進度'的鼓舞人心的例子被提及,他們最近在劍橋進行了私人談話。'顯然能夠跟他見面就已經是非常不可思議的榮譽了,'他表示,並拿出他的手機給我看他的自拍。'我們只安排了一個小時,但他有那麼多問題以致於我們最後交流了四個小時。這導致他錯過了午餐,所以他的看護對我不太高興。'

  Hassabis指出,在那次會面之後,霍金就不在媒體面前提及'任何人工智能煽動性言論'了。最驚奇的是,在他上月的BBC Reith講座中,他推斷的人類威脅清單中並沒有包括人工智能。'可能真的會有些用吧,聽到更多實用的東西,更多我們可能創造出的真正系統,以及我們對這些系統的檢查和控制,'Hassabis表示。'一旦你理解了這項工程,這一切看起來就更容易理解了,也更加合理。'

  當然,在我身上還看不到任何希望,但他真的相信霍金變了嗎?'我認為最終會的,他會非常放心的。他有著非常風趣的干幽默,就在我離開前,我問他,“那麼你認為如何?”他打出了“我祝你好運。”之後,調皮地沖我眨眨眼,又補充道,“但不要太好運。”'Demise Hassabis向我露出會心一笑。'我認為,“我可以認為我贏了。”'

原文位置:新浪棋牌新聞

引文:

AlphaGo背後的英雄:計算機專家Chris Maddison
2016年02月18日13:13 新浪體育

Open in new window

Chris Maddison說:神經網絡能夠「學習原則與戰術」,它們不僅只會記憶,它們還能理解。

  來自Uof T News
  作者:Nina Haikara
  機器之心編譯出品
  編譯:chenxiaoqing

  圍棋是世界上最古老的遊戲,起源於2500年前的中國。現今最新的人工智能——谷歌DeepMind的AlphaGo——則創造了一個里程碑,在此之前, 人們相信計算機不可能學會這個遊戲,更別提以5:0的成績打敗歐洲冠軍樊麾。'圍棋的規則非常簡單,'梅西大學研究員、計算機科學博士的Chris Massison說道,'但正是這種簡單增強了它的複雜性。'在谷歌研究室於1月27日《自然》上所發表的一篇新的論文中,Maddison是第三作者, 這篇文章詳細解釋了AlphaGo在遊戲中的成功,並在遊戲中(甚至各擁有相同的棋子)以99.8%的比例擊敗了之前的高科技Go機器人。

  圍棋從基本上說是一個征服領地的故事。這個遊戲需要兩個棋手,在19乘以19的網格上執白子或黑子佔領土地。最終目標是利用棋子佔領最多的領地以獲勝。

  '你也許認為直接最大化覆蓋整個棋盤就可以,'Maddison解釋道,'但是當你的棋子包圍對方的時候,對方的棋子就成了你的獵物。因此,大師級棋手會巧妙地用自己的格局來掌控並連接自己的佈局。'

  人工智能研究利用遊戲來作為微觀測試已經有了很長的歷史。遊戲能夠精確地定義並允許研究員來估測自己的成功。去年,谷歌的DeepMind教導機器學習並贏得了所有49個經典Atari計算機遊戲。而圍棋則一直以來都被人們視為人類能夠勝於程序的最後一個經典遊戲。

  圍棋之所以困難的部分原因是其結果的無限性。每一局的比賽都非常難於復制並重現。AlphaGo就在它從未見過的比賽中擊敗了樊麾。

  '最明顯要做的事情就是去檢索所有可能的結果,但是這對於類似國際象棋特別是圍棋這類的遊戲並沒有效果。'

  AlphaGo與之前的Go機器人所不同的一點在於對於神經網絡、分層計算和知識庫的應用,而這一領域的領軍人物則是Maddison的PhD導師,多倫多大學名譽教授、谷歌傑出研究員Emeritus Geoffrey Hinton所推進的領域。

  '神經網絡讓我們減少了要調查的結果數量。但是它們同時也擅長通用化其並未見過的狀態。因此這些神經網絡學習規則與戰術。它們並不僅僅只會記憶——它們還能夠理解。'

  AlphaGo僅靠自己是無法做到這麼多的。但就像已在圖像和語音識別上被驗證的其他神經網絡一樣,最新的測試證明了這些系統的可靠性,而且它也可以用於從預防疾病到智能手機科技等諸多領域。'就像一個馬達能移動非常巨大且非常重的東西——現在你能將其應用於更大、更複雜的事情上。'

  在所有的作者中,還有來自多倫多大學的認知科學碩士、谷歌DeepMind團隊的成員Timothy Lillicrap,計算機科學碩士校友、OpenAI(耗資10億美元用於人工智能研究的非營利機構)的研究主管Ilya Sutskever。

  去年,Maddison離開學校,到總部位於倫敦的谷歌DeepMind實習,他提到能成為這個團隊中的一員非常激動,DeepMind在兩年前還僅僅是一個小型項目,到今天已經擁有了許多研究員與工程師,成為了一個工業規模的項目,並且成果十分令人滿意。

  AlphaGo會在今年三月在此進行比賽,當它去挑戰Lee Sedol——過去十年間最強大也是最天才的圍棋棋手。'我並不怎麼會下圍棋,'Maddison承認,'我們所利用的科技需要下棋,而我並不需要。但是它告訴我這應該是我要更多去學習的興趣所在。'

原文位置:新浪棋牌新聞

發佈時間:2016/2/18 22:02

編輯者 流浪狗之歌 於 2016-02-18 22:03:54
_________________
《圍棋十訣》 唐.王積薪
一.不得貪勝。 二.入界宜緩。 三.攻彼顧我。 四.棄子爭先。 五.捨小就大。
六.逢危須棄。 七.慎勿輕速。 八.動須相應。 九.彼強自保。 十.勢孤取和。
傳輸文章到其他應用程式 傳輸


回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo
副站長兼資料室室長
註冊日期:
2002/10/28 18:23
來自 地球
文章: 31309
離線
引文:

深扒谷歌圍棋“大腦” 超豪華團隊Facebook難媲美
2016年02月22日09:39 新浪體育

Open in new window

deepmind團隊陣容豪華,facebook無法與其競速。

  在像棋和國際象棋中,電腦軟件都非常厲害,只有圍棋是唯一“電腦下不過人類”的項目。而今年1月份有個爆炸性新聞:谷歌DeepMind開發的人工智能圍棋程序AlphaGo以5:0的壓倒性優勢擊敗了歐洲圍棋冠軍、專業二段棋手。那麼3月份AlphaGo會和韓國九段、世界冠軍李世石進行對弈。如果此役AlphaGo獲勝,這意味著人工智能真正里程碑式的勝利。

  這也引起了筆者好奇心,在春節期間,跟Facebook的田淵棟()交流,他做的也是計算機圍棋AI--黑暗森林(),今年1月份他的文章被機器學習頂級會議ICLR 2016接受() 。

  他聊天中談到自從谷歌收購了DeepMind,投入大量資源去做好人工智能項目,不為別的,就是要向世界證明谷歌智能的強大。發表在頂級期刊《Nature》的論文光看作者就20個,明顯是下了血本,前兩位都是計算機圍棋界的大牛,一作David Silver是計算機圍棋和強化學習的頂級專家,整個博士論文就是做的圍棋; 二作Aja Huang以前寫過多年圍棋軟件,自己又是AGA 6D的水平。

  還是不多說廢話,下面是SpinPunch CTO 對AlphaGo的工作原理解讀:

  谷歌DeepMind宣布他們研發的神經網絡圍棋AI,AlphaGo,戰勝了人類職業選手。這篇論文由David Silver等完成。裡面的技術是出於意料的簡單卻又強大。為了方便不熟悉技術的小白理解,這裡是我對系統工作原理的解讀。

  深度學習

  “深度學習”是指多層的人工神經網絡和訓練它的方法。一層神經網絡會把大量矩陣數字作為輸入,通過非線性激活方法取權重,再產生另一個數據集合作為輸出。這就像生物神經大腦的工作機理一樣,通過合適的矩陣數量,多層組織鏈接一起,形成神經網絡“大腦”進行精準複雜的處理,就像人們識別物體標註圖片一樣。

  雖然神經網絡在幾十年前就有了,直到最近才形勢明朗。這是因為他們需要大量的“訓練”去發現矩陣中的數字價值。對早期研究者來說,想要獲得不錯效果的最小量訓練都遠遠超過計算能力和能提供的數據的大小。但最近幾年,一些能獲取海量資源的團隊重現挖掘神經網絡,就是通過“大數據”技術來高效訓練。

  兩個大腦

  AlphaGo是通過兩個不同神經網絡“大腦”合作來改進下棋。這些大腦是多層神經網絡跟那些Google圖片搜索引擎識別圖片在結構上是相似的。它們從多層啟發式二維過濾器開始,去處理圍棋棋盤的定位,就像圖片分類器網絡處理圖片一樣。經過過濾,13 個完全連接的神經網絡層產生對它們看到的局面判斷。這些層能夠做分類和邏輯推理。

  這些網絡通過反複訓練來檢查結果,再去校對調整參數,去讓下次執行更好。這個處理器有大量的隨機性元素,所以我們是不可能精確知道網絡是如何“思考”的,但更多的訓練後能讓它進化到更好。

  第一大腦:落子選擇器(Move Picker)

  AlphaGo的第一個神經網絡大腦是“監督學習的策略網絡(Policy Network)” ,觀察棋盤佈局企圖找到最佳的下一步。事實上,它預測每一個合法下一步的最佳概率,那麼最前面猜測的就是那個概率最高的。你可以理解成“落子選擇器”。

  落子選擇器是怎麼看到棋盤的?數字表示最強人類選手會下在哪些地方的可能。

  團隊通過在KGS()上最強人類對手,百萬級的對弈落子去訓練大腦。這就是AlphaGo最像人的地方,目標是去學習那些頂尖高手的妙手。這個不是為了去下贏,而是去找一個跟人類高手同樣的下一步落子。AlphaGo落子選擇器能正確符合57%的人類高手。

  更強的落子選擇器

  AlphaGo系統事實上需要兩個額外落子選擇器的大腦。一個是“強化學習的策略網絡(Policy Network)”,通過百萬級額外的模擬局來完成。你可以稱之為更強的。比起基本的訓練,只是教網絡去模仿單一人類的落子,高級的訓練會與每一個模擬棋局下到底,教網絡最可能贏的下一手。Sliver團隊通過更強的落子選擇器總結了百萬級訓練棋局,比他們之前版本又迭代了不少。

  單單用這種落子選擇器就已經是強大的對手了,可以到業餘棋手的水平,或者說跟之前最強的圍棋AI媲美。這裡重點是這種落子選擇器不會去“讀”。它就是簡單審視從單一棋盤位置,再提出從那個位置分析出來的落子。它不會去模擬任何未來的走法。這展示了簡單的深度神經網絡學習的力量。

  更快的落子選擇器

  AlphaGo當然團隊沒有在這裡止步。下面我會闡述是如何將閱讀能力賦予AI的。為了做到這一點,他們需要更快版本的落子選擇器大腦。越強的版本在耗時上越久-為了產生一個不錯的落子也足夠快了,但“閱讀結構”需要去檢查幾千種落子可能性才能做決定。

  Silver團隊建立簡單的落子選擇器去做出“快速閱讀”的版本,他們稱之為“滾動網絡”。簡單版本是不會看整個19*19的棋盤,但會在對手之前下的和新下的棋子中考慮,觀察一個更小的窗口。去掉部分落子選擇器大腦會損失一些實力,但輕量級版本能夠比之前快1000倍,這讓“閱讀結構”成了可能。

  第二大腦:棋局評估器(Position Evaluator)

  AlphaGo的第二個大腦相對於落子選擇器是回答另一個問題。不是去猜測具體下一步,它預測每一個棋手贏棋的可能,在給定棋子位置情況下。這“局面評估器”就是論文中提到的“價值網絡(Value Network)”,通過整體局面判斷來輔助落子選擇器。這個判斷僅僅是大概的,但對於閱讀速度提高很有幫助。通過分類潛在的未來局面的“好”與“壞”,AlphaGo能夠決定是否通過特殊變種去深入閱讀。如果局面評估器說這個特殊變種不行,那麼AI就跳過閱讀在這一條線上的任何更多落子。

  局面評估器是怎麼看這個棋盤的。深藍色表示下一步有利於贏棋的位置。

  局面評估器也通過百萬級別的棋局做訓練。Silver團隊通過複製兩個AlphaGo的最強落子選擇器,精心挑選隨機樣本創造了這些局面。這裡AI 落子選擇器在高效創建大規模數據集去訓練局面評估器是非常有價值的。這種落子選擇器讓大家去模擬繼續往下走的很多可能,從任意給定棋盤局面去猜測大致的雙方贏棋概率。而人類的棋局還不夠多恐怕難以完成這種訓練。

  增加閱讀

  這裡做了三個版本的落子選擇大腦,加上局面評估大腦,AlphaGo可以有效去閱讀未來走法和步驟了。閱讀跟大多數圍棋AI一樣,通過蒙特卡洛樹搜索(MCTS)算法來完成。但AlphaGo 比其他AI都要聰明,能夠更加智能的猜測哪個變種去探測,需要多深去探測。

  蒙特卡洛樹搜索算法

  如果擁有無限的計算能力,MCTS可以理論上去計算最佳落子通過探索每一局的可能步驟。但未來走法的搜索空間對於圍棋來說太大了,實際上AI沒有辦法探索每一個可能的變種。MCTS做法比其他AI有多好的原因是在識別有利的變種,這樣可以跳過一些不利的。

  Silver團隊讓AlphaGo裝上MCTS系統的模塊,這種框架讓設計者去嵌入不同的功能去評估變種。最後馬力全開的AlphaGo系統按如下方式使用了所有這些大腦。

  1、從當前的棋盤佈局,選擇哪些下一步的可能性。他們用基礎的落子選擇器大腦。它集中在“明顯最好”的落子而不是閱讀很多,而不是再去選擇也許對後來有利的下法。

  2、 對於每一個可能的落子,評估質量有兩種方式:要么用棋盤上局面評估器在落子後,要么運行更深入蒙特卡羅模擬器(滾動)去思考未來的落子,使用快速閱讀的落子選擇器去提高搜索速度。AlphaGo使用簡單參數,“混合相關係數”,將每一個猜測取權重。最大馬力的AlphaGo使用50/50的混合比,使用局面評估器和模擬化滾動去做平衡判斷。

  這篇論文包含一個隨著他們使用插件的不同,AlphaGo的能力變化和上述步驟的模擬。僅使用獨立大腦,AlphaGo跟最好的計算機圍棋AI差不多強,但當使用這些綜合手段,就可能到達職業人類選手水平。

  AlphaGo的能力變化與MCTS的插件是否使用有關。

  這篇論文還詳細講了一些工程優化:分佈式計算,網絡計算機去提升MCTS速度,但這些都沒有改變基礎算法。這些算法部中分精確,部分近似。在特別情況下,AlphaGo通過更強的計算能力變的更強,但計算單元的提升率隨著性能變強而減緩。

  優勢和劣勢

  我認為AlphaGo在小規模戰術上會非常厲害。它知道通過很多位置和類型找到人類最好的下法,所以不會在給定小範圍的戰術條件下犯明顯錯誤。

  但是,AlphaGo有個弱點在全局判斷上。它看到棋盤式通過5*5金字塔似的過濾,這樣對於集成戰術小塊變成戰略整體上帶來麻煩,同樣道理,圖片分類神經網絡往往對包含一個東西和另一個的搞不清。比如說圍棋在角落上一個定式造成一個牆或者引徵,這會劇烈改變另一個角上的位置估值。

  就像其他的基於MCTS的AI, AlphaGo對於需要很深入閱讀才能解決的大勢判斷上,還是麻煩重重的,比如說大龍生死劫。AlphaGo 對一些故意看起來正常的局也會失去判斷,天元開盤或者少見的定式,因為很多訓練是基於人類的棋局庫。

  我還是很期待看到AlphaGo和李世石9段的對決!我預測是:如果李使用直(straight)式,就像跟其他職業棋手的對決,他可能會輸,但如果他讓AlphaGo陷入到不熟悉的戰略情形下,他可能就贏。

  結語

  這裡我還想到另一個人,中國最強大腦選手鮑橒,當時看了他走出蜂巢迷宮,被他的超強的空間記憶和想像能力深深震撼了,而他的職業就是圍棋選手,並且是盲棋。他能完成1對5的圍棋盲棋,實在是很不可思議的事情。在圍棋圈內,幾乎沒有棋手能完成盲棋,因為確實太難了。筆者也向他詢問了對這個事情看法,他說,歐洲冠軍沒能摸到程序的底,但從棋譜來說,對谷歌程序我也難以取勝,確實下的不錯。雖然圍棋圈一致看好李世石,不過我不敢確定谷歌的程序3月份進展到什麼地步。

  再說到Facebook田博士,跟谷歌DeepMind超豪華團隊長期投入不同,他就在半年多前從立項到實現,直到最近才有一個實習生加入幫他,而背後是他付出的心血,為了搶時間,在聖誕新年都是加班加點,按他所說,每日工作10+小時,自己搭機器,寫代碼,調參數,單槍匹馬做出成績。

  談到跟谷歌團隊的較量,田博士說:“這是一場必敗的戰鬥”,但我還是很佩服他,他讓我想到三國時代趙子龍,單槍匹馬大戰曹軍,力拔山兮氣蓋世!因為他是真正的勇士。正是有了這些英勇無畏的科學家,一次次打破常規,挑戰極限,我們才知道人類如此大的潛力。最近短短幾年的發展,從大數據,深度學習人工智能到虛擬現實,從發現了類地球行星,證實引力波,從Hyperloop,無人駕駛,量子計算,這些魅力無窮的科技讓我們對世界的認識上升到新的高度。面對這個激動人心的時代,我想說,天空是我們的極限,宇宙是我們的極限,未來才是我們的極限!

  最後允許我拿田博士的話來結束。

  我有時候會問自己:“我是不是背棄了夢想?”我想除了我自己,任何人都不會給我答案,任何評論也不具效力。我記得有人問過,如果夢想從踐行的一開始,就在不自覺地向現實妥協,那樣的夢想還是最初的夢想麼?其實,這樣的問題沒什麼可糾結的,因為世界從來就不是二元的,夢想和現實,如同高懸的日月,日月之間,有一條灰色的路,在自己腳下蜿蜒曲折,繞過各種險阻,一直向前。

  “而我能做的,只是要在奔跑時,不停提醒自己,還記得“夢想”這個詞的含義。”

原文位置:新浪棋牌新聞

發佈時間:2016/2/22 13:04
_________________
《圍棋十訣》 唐.王積薪
一.不得貪勝。 二.入界宜緩。 三.攻彼顧我。 四.棄子爭先。 五.捨小就大。
六.逢危須棄。 七.慎勿輕速。 八.動須相應。 九.彼強自保。 十.勢孤取和。
傳輸文章到其他應用程式 傳輸


回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo
副站長兼資料室室長
註冊日期:
2002/10/28 18:23
來自 地球
文章: 31309
離線
引文:

人機大戰細則出爐李世石最多拿到125萬美元
2016年02月22日19:41 新浪體育

Open in new window

李世石在人機對抗第2次發布會上發言

  2月22日,“李世石-Alpha GO人機對戰”在韓國棋院舉行了“谷歌Deep Mind挑戰賽”第二次新聞發布會,發表了舉世矚目的3月人機對戰的詳細規則。新聞發布會有李世石和韓國棋院副總裁樸治文出席,Deep Mind公司的CEO兼谷歌副總裁戴密斯-哈薩比斯(Demis Hassabis)從倫敦視頻連到了新聞發布會現場。

  戴密斯-哈薩比斯(Demis Hassabis)說:“圍棋優美的複雜性是緣於極簡、優雅的圍棋原理。而且圍棋主要靠的是直觀和直覺,所以計算機很難模仿和學習。'谷歌Deep Mind挑戰賽'是與圍棋的傳奇棋手李世石展開人機對戰,希望這場對決能喚起全世界對圍棋的關心。”

  李世石則說:“分析10個月前Alpha GO和樊麾二段對弈的棋譜,我認為Alpha GO的水準還沒有到可以和我爭勝負的階段。這次比賽不會是3比2這種層面的勝負,應該是4比1或者5比0這種性質的比賽。”

  總規則

  1、比賽分先進行,共下5盤,對局日起為:首局:3月9日、第二局:3月10日、第三局:3月12日、第四局:3月13日、第五局:3月15日。

  2、五盤對局取三勝以上為優勝,獲得獎金100萬美元(固定匯率:11億韓元)。

  3、若Alpha GO獲勝,獎金捐獻給聯合國兒童基金和STEM教育(科學、技術、工程、藝術以及數學)及圍棋相關公益團體。

  4、比賽即使3:0、3比1分出勝負,與比分無關將下滿五盤棋,以便Alpha GO擁有更多學習機會。

  5、以下滿五盤為條件,李世石可獲得15萬美元(約1億6500萬韓元)出場費,同時每勝一局獲得2萬美元勝局獎金。如果五盤全勝,勝局獎金為10萬美元(1億1000萬韓元)。即李世石五戰全勝獲得優勝,最多可以獲得125萬美元(13億7500萬韓元)。

  6、比賽用時每方2小時,1分鐘讀秒三次。比賽採用中國規則,黑貼3又3/4子(黑貼7目半)。採用中國規則的原因,是因Alpha GO以中國規則為基礎開發。

  7、比賽開局時間為韓國當地時間下午1點(北京時間中午12點),比賽不設中間休息。

  8、比賽時李世石在棋盤上落子,助手將手數輸入電腦傳送給Alpha GO。Alpha GO的手數由助手擺到李世石落子的棋盤上。

  9、比賽地點為首爾鈡路區fourseasons酒店。

  10、所有對局通過Deep Mind公司youtube頻道向全世界實況直播,此外通過韓國棋院圍棋TV和因特網圍棋網站直播。

  11、3月8日當地時間上午10點(北京時間上午9點)將舉行新聞發布會,同時每局賽后都將接受記者採訪。

  (聯眾藍烈編譯)

原文位置:新浪棋牌新聞

引文:

李世石:對決AlphaGO我有信心 谷歌:非常期待
2016年02月22日16:58 新浪體育

Open in new window

谷歌副總裁戴密斯-哈薩比斯(Demis Hassabis)和李世石

  新浪體育訊2月22日下午,李世石-谷歌圍棋AlphaGO人機大戰五番棋第二次新聞發布會在韓國棋院舉行。比賽將採用中國圍棋規則。谷歌DeepMind公司CEO哈薩比斯從倫敦連線現場,稱非常期待此次比賽。李世石表示,雖然谷歌圍棋實力仍在提高,但至少這次對決我有信心。

  上百名記者擠爆現場,創下韓國棋院史上最多采訪紀錄。由於人數過多受到管制,不少記者被攔在現場外,有些人甚至不知圍棋為何物,提前4個小時趕到卻委屈的擠在門外。谷歌旗下DeepMind公司CEO兼谷歌副總裁戴密斯-哈薩比斯(Demis Hassabis)從倫敦視頻連線韓國棋院現場,公佈了比賽的諸多細節。

  谷李五番棋用時為每方2小時3次1分鐘讀秒,採用中國規則貼7目半,3月9,10,12,13,15日北京時間12時在首爾鐘路區四季酒店進行。無論比分如何將下滿五局,獲得三勝者將奪得100萬美元獎金(約11億韓元)。AlphaGo如獲勝,獎金將捐贈給聯合國兒童基金會(unicef)、STEM(科學、技術、工程、數學)教育及圍棋等相關慈善團體。

  出席記者會的李世石九段表示:能夠參加此次人工智能向職業棋手發起的挑戰賽,意義深遠,非常高興。無論結果如何,都是歷史上非常有意義的對決。谷歌人工智能已經頗具實力,並仍在持續提高,但至少這次比賽我有信心。

  DeepMind公司CEO哈薩比斯表示:圍棋是人類發明的所有遊戲中最深奧的。圍棋簡單的原理產生出複雜而優美的深度,根據直覺和相對隨機的計算,使得電腦很難掌控。這次圍棋傳奇李世石九段能夠接受谷歌圍棋挑戰,深感光榮,非常期待比賽的到來。無論李世石九段勝利或失敗,希望引發全世界對圍棋的更多關注。

  與電腦擊敗國象、象棋等棋類的職業高手不同,圍棋一直被認為是人類智慧王國最後的“堡壘”。谷歌圍棋AlphaGo此前在正式對決5比0戰勝歐洲冠軍樊麾二段,論文發表在《自然》雜誌封面,在全球掀起熱潮。

  (李新舟)

原文位置:新浪棋牌新聞

引文:

李世石言行暴露緊張 為備戰人機戰放棄春蘭杯
2016年02月22日17:34 新浪體育

Open in new window

資料圖:李世石

  據中國體育報消息,儘管李世石非常自信地聲稱谷歌圍棋軟件還不足以向人類高手發起挑戰,但是從李世石最近的實際言行不難看出,這位新上任的“人類代表”最近還是很緊張的。

  上週韓國圍棋隊進行了第11屆春蘭杯的國內選拔賽,雖然李世石作為韓國國內冠軍頭銜的擁有者俱有參賽資格,但是“人類代表”最終做出了放棄參加選拔賽的決定。

  下個月李世石作為新任“人類代表”將在韓國首爾與穀歌的圍棋軟件進行五番棋的人機對抗賽,獎金高達100萬美元。在此之前,李世石作為韓國隊的主將還將代表韓國參加在上海舉行的農心杯第三階段的比賽。目前韓國隊僅剩李世石一人,而日本隊還剩井山裕太和村川大介兩人,中國隊奪冠前景最好,目前還有古力、連笑和柯潔三員大將。由於近期李世石在柯潔面前連續栽跟頭,這次農心杯中國隊又有柯潔把守關口,李世石的臨戰壓力可想而知。在農心杯和人機大戰的雙重重壓之下,李世石做出放棄春蘭杯選拔賽的決定,實屬無奈之舉,也情有可原。

  去年10月谷歌圍棋軟件曾經在五番棋的人機大戰中5比0戰勝歐洲圍棋冠軍、職業棋手樊麾二段。李世石曾經表示,他看了當時的棋譜之後覺得樊麾的實力與自己差了兩子。除非出現不可理喻的低級失誤,自己在接下來的人機大戰中是絕不會輸的。

  然而就是被李世石認為在實力上差了兩子的樊麾,最近在歐洲圍棋職業冠軍杯上卻有著非常出色的表現,他力壓各路歐洲圍棋高手,奪得冠軍,並獲得了代表歐洲參加今年舉行的第八屆應氏杯世界職業圍棋錦標賽的資格。這位前任“人類代表”直言,經過人機大戰的磨練之後,自己的實力境界有所提升,所以這次冠軍杯賽贏得比較輕鬆。而且在3月9日開始的谷歌圍棋軟件與李世石的人機對抗賽上,樊麾將擔任裁判工作。

  雖然李世石現在已經不在職業生涯的巔峰期,但是在至關重要的番棋賽中,除中國棋手柯潔之外,其他現役棋手還都難以取得明顯上風,李世石的超凡實力依然是舉世公認的,這也是谷歌選中他的一個重要原因。不過李世石的一個明顯劣勢在於,在短短幾個月的時間內,他的實力已經不可能取得大踏步的前進,屆時能夠正常發揮水平就已經實屬不易。而且在對手分析上,李世石主要的參考依據就是幾個月前樊麾與穀歌圍棋軟件的對局,其他可供借鑒的數據資料比較有限。

  俗話說,知己知彼百戰不殆。現在的問題在於,李世石基本上處於明處,而谷歌圍棋軟件實際上處於暗處。因為谷歌圍棋軟件不僅可以輕易獲得李世石職業生涯中的絕大多數對局資料,而且對他最近的競技水平也可以有一個比較準確的評估,反觀李世石卻難以把握對手的真實水平,畢竟對於計算機軟件來說,在幾個月的時間內完全有可能取得大幅度的躍升。

  鑑於此,李世石心存焦慮,無心戀戰春蘭杯預選賽,也就不難理解了。

  (葛會忠)

原文位置:新浪棋牌新聞

單以獎金論,已是應氏盃(40萬元美金)的2.5倍。轟動程度,今年所有的世界賽,應當都會相形失色吧! (包含井山裕太可能的七冠制霸)

發佈時間:2016/2/22 22:34
_________________
《圍棋十訣》 唐.王積薪
一.不得貪勝。 二.入界宜緩。 三.攻彼顧我。 四.棄子爭先。 五.捨小就大。
六.逢危須棄。 七.慎勿輕速。 八.動須相應。 九.彼強自保。 十.勢孤取和。
傳輸文章到其他應用程式 傳輸


回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo
二級
註冊日期:
2004/11/6 14:51
文章: 54
離線
我想aja那麼有信心,是不是在高手(可能有9D水準)陪練的過程中
,alphaGo能擊敗這些高手們?

發佈時間:2016/2/23 11:03
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo
一品•入神
註冊日期:
2005/12/2 15:46
文章: 868
離線
我的猜測有兩種,一是如mimi所說,甚至搞不好有職棋陪練只是不能公佈,若是這種情況的話,AlphaGo勝算就頗高。另一種是純粹elo比較,可能elo已達到和李世石相當的程度,甚至超過,若是這種情形,則看好李世石,因為純粹自我練習應該會有很多盲點(弱點)沒有辦法突破的。

昨天的記者會果然沒有公布我之前提到的問題,只有提到似乎依然由aja代打,大概是因為太細節的東西一般記者沒什麼興趣吧。不過畢竟是全球矚目的比賽,過程中的任何狀況,包括點錯下錯位置、人為超時、網路問題、機械問題等等,如何處理應對也同樣會被放大檢視。希望只是沒有公佈,實際上已跟韓國棋院做好通盤的溝通演練,才不會讓難得的宣傳機會大打折扣。

另外媒體報導李世石為備戰而放棄春蘭杯,除非本人親口承認,否則很難相信。春蘭杯本戰在三月底,五番棋早已結束,若說國內預選,則是上禮拜就結束,且只下兩局,若說下這兩局就會影響對戰AlphaGo,未免太示弱了。更何況下週還有農心杯。我倒是在猜會不會棋院覺得他賺太多,要他把機會讓給其他人?呵呵,這也沒有什麼根據就是了。不過他百靈杯也沒有參加(不在種子名單、預選賽跟AlphaGo衝突),因此說是為參加五番棋而放棄百靈杯倒是說得過去。

發佈時間:2016/2/23 12:45
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo
六級
註冊日期:
2016/2/23 10:48
文章: 16
離線
https://www.zhihu.com/question/40105314

这个页面的底部,有一个匿名用户说:“AlphaGo最新版本对战赢樊辉的版本的胜率已经是100%了。棋力还在不断进步。”

不知道是不是内部人员泄露出来的?若是真的,也难怪aja自信了。

發佈時間:2016/2/23 13:40
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 回覆: 回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo

註冊日期:
2003/1/5 21:42
文章: 3705
離線
就算現在的版本對去年十月的版本勝率100%,當差這麼多的時候,確實棋力的落點很難正確判斷。只能說底線絕對不會差小李太多。

ago現在的直覺是(也就是沒有根據),小李獎金拿不到20萬美元。如果有更多可靠情報,當然會再做修正。

發佈時間:2016/2/23 18:25
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 回覆: 回覆: 回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo
三品•具體
註冊日期:
2003/5/4 10:39
文章: 281
離線
引文:

ago 寫道:
就算現在的版本對去年十月的版本勝率100%,當差這麼多的時候,確實棋力的落點很難正確判斷。只能說底線絕對不會差小李太多。

ago現在的直覺是(也就是沒有根據),小李獎金拿不到20萬美元。如果有更多可靠情報,當然會再做修正。


AlphaGo的確是一直在變強,至於AlphaGo目前到底多強,跟李世石比賽時大家就知道了。我個人也希望AlphaGo與李世石的五番棋大戰,能引起更多人對圍棋與AI的興趣與關注。

發佈時間:2016/2/23 20:57
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo
八品•若愚
註冊日期:
2004/5/10 20:24
文章: 99
離線
以下是我不負責任+假裝專業的評論及猜測:

在拜讀這篇 Nature 大作之後, 覺得 AlphaGo 就是從極大量專業棋士棋譜中學習找尋每一步最佳的著手, 類似局面越是常在棋譜中出現, 越是可能找到最佳著手. 合理判斷強項就是布局和收官, 缺點會是許多專家提到的打劫判斷和中盤的大型攻殺及轉換, 像是一個不會失誤的日本本格派高手. 除非 AlphaGo 有未透露的密招, 不然我猜 AlphaGo 再怎麼訓練變強, 最多就像是狀況好的高尾紳路. 李世石如果一開始布局不夠好或狀況不佳, 很可能就像張栩2005年本因坊戰一樣 1:4 輸掉. 如果李世石正常發揮中盤功力, 預測將是 4:1 或 3:2 獲勝.

發佈時間:2016/2/24 5:51
傳輸文章到其他應用程式 傳輸


回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo
副站長兼資料室室長
註冊日期:
2002/10/28 18:23
來自 地球
文章: 31309
離線
引文:

“李世石-Alpha GO人機對戰”第二次新聞發布會實錄
發佈時間:2016/2/23 11:46:32
聯眾藍烈編譯

Open in new window

▲ 2月22日,“李世石-Alpha GO人機對戰”在韓國棋院舉行第二次新聞發布會,李世石答記者問。

2月22日,“李世石-Alpha GO人機對戰”在韓國棋院舉行第二次新聞發布會,Deep Mind公司的CEO兼谷歌副總裁戴密斯-哈薩比斯(Demis Hassabis)從倫敦視頻連到了新聞發布會現場。他說:“無論勝負如何,谷歌Deep Mind團隊都會藉此開發出更加智能化的系統。為了開發人工智能,我們採用遊戲為測試工具,但終究來說我們的目的並不是研究遊戲,而是把我們掌握的技術適用於現實的世界。”

Open in new window

▲ 戴密斯-哈薩比斯在視頻中說:為了籌備3月的“李世石-Alpha GO人機對戰”,無法來到發布會現場,只能通過視頻致意。

李世石答話說:“我很榮幸能共同站到超越圍棋、超越人工智能學界,向更偉大的未來出發的這一歷史時刻。” 戴密斯-哈薩比斯還說:“這次比賽會更加強調人類的獨創性和智能,也有利於向西方介紹圍棋。我期待3月在首爾相會。”

Open in new window

▲ 工作人員向媒體記者介紹發布會次序。

Open in new window

▲ 發布會現場雲集200餘名記者。

Open in new window

▲ 答記者問前,李世石與韓國棋院副總裁朴治文並肩坐在一起。

Open in new window

▲ 韓國棋院副總裁闡述“李世石-Alpha GO人機對戰”的意義。

-你是怎麼備戰這次比賽的?李世石: “其實很難針對性地備戰,也就提高自己的狀態吧。Alpha GO在時間上還不夠充分,大概5個月的時間,也就是更新提高了4個多月吧,也就是Alpha GO的實力還沒有得到充分的提高,我想還需要1年或者1年以上的時間,才能夠形成真正的勝負吧。這次比賽的難點在於,不是和人下。我是按我的方式做準備,也就是假想對局。入睡前花一兩個小時,用腦子假想對局。”

-你是怎麼判斷Alpha GO的實力?李世石: “(除了樊麾二段的對局外)我又找幾盤Alpha GO的對局看了,也就是我可以讓先的左右?去年10月和樊麾二段較量的Alpha GO的實力,還不足以和我爭勝負。現在時間也過去了,Alpha GO的實力肯定得到提高,但這次比賽不是3比2這種比分的勝負,而是看我會不會輸一盤。 ”

-李世石九段是在首爾打比賽。那麼比賽所需的計算機硬件是設置在什麼地方了?戴密斯-哈薩比斯: “我們是通過谷歌云服務連接到酒店的對局室。Alpha GO的服務器是在美國中西部。在首爾可以通過監視器看到服務器。我們的研究員aja huang(黃士傑)會坐到棋盤前,擺Alpha GO的手數,同時輸入手數。aja huang(黃士傑)是我們開發團隊的成員,對Alpha GO的系統環境很熟悉,圍棋也有業餘6段的實力。

-為什麼指定李世石為Alpha GO的挑戰對象?戴密斯-哈薩比斯: “既然是會載入史冊的比賽,就需要挑戰傳奇棋手。我們認為十年以上稱霸世界棋壇的李世石九段是最適合的對手。”

-在韓國比賽,為什麼採用中國規則?像讀秒等規則是怎麼決定的?戴密斯-哈薩比斯: “過去十八個月,Alpha GO都是按中國規則開發和訓練。所以短期內很難讓Alpha GO適應韓國規則並提高實力。比賽用時是我們和李世石九段商談後決定的。”

Open in new window

▲ 1月28日的第一次新聞發布會,只有韓國媒體的記者與會。但是第二次新聞發布會吸引了全世界的媒體記者。

-Alpha GO有什麼弱點?訓練中有沒有出現過出現失誤等問題?戴密斯-哈薩比斯: “的確出現過一些失誤,但是比賽前不好具體透露。比賽都結束後,我們再談吧。需要說明的是,就是因為這類失誤,我們也需要促進與李世石九段的比賽。按我們團隊的分析,其實Alpha GO迄今沒有遇到過具有挑戰性的對手。如果想真正評價Alpha GO的實力,必須和最強的棋手較量。”

-據說Alpha GO的學習能力非常強,能不能給普通人淺顯易懂地說明人工智能的核心技術?戴密斯-哈薩比斯: “我就試著簡單說明吧。圍棋的變化非常龐大,靠窮舉的計算是很難取得勝利。哪怕是世界最強的超級計算機,也難以辦到。就是以後出現更先進的計算機,恐怕也是做不到。

圍棋可下的變化,可以說接近無限,Alpha GO靠兩層神經網縮減變化的數量。第一層神經網是'政策網',會提出可行的下一手,那麼無限蔓延的搜索樹立刻會縮小範圍。接著第二層神經網'價值網'會提示黑白哪一方更好,而且好多少,並提示和限制算路的範圍。舉例說國際象棋每下一步會搜索約2億個變化,Alpha GO是只須考量10萬個變化。雖然10萬個變化依然比1000個變化要多,但是為計算機減去了很多負但,這就是神經網的作用。”

Open in new window

▲ 雲集倫敦現場的記者,也向李世石和Deep Mind團隊提問。

-和人工智能比賽,有可能給李世石九段的職業生涯帶來不利影響。對這一部分,怎麼做說服工作的?(倫敦記者提問)李世石: “坦率說我對人工智能Alpha GO非常好奇,所以下決定並不需要太多時間。所以,我也沒有給Deep Mind團隊說服我的機會^^”(戴密斯-哈薩比斯聽到後,也微笑起來)

-我想,比賽環境也是很重要的因素吧?如果人工智能得到進一步的發展,比賽氛圍等等的問題也會變得重要,即環境也會影響結果?(倫敦記者提問)李世石: “你說的很對。只是這一次我很有自信,所以這方面我考慮得併不多。以後如果覺得的確是好勝負,我會相應提要求。”

戴密斯-哈薩比斯: “比賽環境方面,以後我們會花更多的心思。這次我們是追求絕對安靜的對局環境。”

原文位置:聯眾圍棋新聞

這篇新聞正式介紹了aja兄。期待aja兄能成為電腦圍棋的許峰雄(電腦西洋棋"深藍"的開發者)吧!

aja兄的碩士論文-(2003)電腦圍棋打劫的策略,博士論文-(2012)New Heuristics for Monte-Carlo Tree Search Applied to the Game of Go。

發佈時間:2016/2/24 9:16
_________________
《圍棋十訣》 唐.王積薪
一.不得貪勝。 二.入界宜緩。 三.攻彼顧我。 四.棄子爭先。 五.捨小就大。
六.逢危須棄。 七.慎勿輕速。 八.動須相應。 九.彼強自保。 十.勢孤取和。
傳輸文章到其他應用程式 傳輸


回覆: 電腦圍棋程式人工智能大突破-Google AlphaGo
一品•入神
註冊日期:
2003/9/15 10:30
來自 Taiwan
文章: 1253
離線
所以, 直播時 aja 兄會露出真面目嗎 ........ ??

Aja 兄 結婚了嗎 ??

發佈時間:2016/2/24 14:41
_________________
-- 數學為科學之母 ---

-- 月移花影動, 疑是故人來...
傳輸文章到其他應用程式 傳輸






可以在此觀看文章
無法在此發表文章
無法回覆文章
無法編輯自己的文章
無法刪除自己的文章
無法發起投票調查
可以在此投票
無法上傳附加檔案
無法不經審核直接發表文章

[進階搜尋]


Powered by   XOOPS 2.0.16a JP © 2001-2004 The XOOPS Project