小廣告

搜尋

登入區塊

棋戰

棋戰預定

主選單

誰在線上
線上目前共19
(4人在瀏覽討論區 3.0)

會員: 0
訪客: 19

尚有...

 

正在流覽:   1 名訪客



« 1 ... 22 23 24 (25) 26 »


回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
一品•入神
註冊日期:
2004/4/19 5:14
文章: 608
離線
引文:

ago 寫道:
引文:
圍棋棋士不分職業業餘,很多人會捧著看不懂也研究不透的AlphaGo天書,迷惘自己過去學棋的價值,無所適從


這不是很好嗎?
正如林海峰老師訓示弟子的:「這個地方的下法,請自己回去好好想一想吧。」
職業棋士,應該是藉由阿老師的幫助,思考圍棋該怎麼下;還是讓阿老師教圍棋怎麼下?


「學而不思則罔,思而不學則怠」。不只職業棋士,學習圍棋或任何技術,自己思考都是必須的。職業棋士間盛行的研究會,就是把自己思考過的棋轉化成口語與眾人分享,一是可以加深印象,二來眾人腦力激盪也許會發現更好的變化。

但我所說的情況不同。

後AlphaGo時代,已是職業棋士開始要向AI學習的新時代。過去曾有老師告訴我,跟比你強三子左右的高手下進步最快,意思是三子的差距,對高手的棋已有一定程度的理解,又能學到新的手段。以前我邊學棋邊教棋的時候,棋力約IGS 5D,老師是一位有職業棋力的業餘7段,當自己下的棋譜或教小朋友的教材怎麼都想不通時,課後問7段老師,一下子就能豁然開朗。目前職業棋士和AlphaGo Zero或Master的差距,恐怕也差不多是三子,這樣的差距,有時候無論你怎麼想,也不比直接問高你三子的高手要來得快又直接。但是這樣一位本可以大大提升世界圍棋水準的「老師」,竟然只發表一篇論文就說要離開棋界了。

圍棋AI時代開啟,各AI研究者絞盡腦汁開發更強的程式,職業業餘棋士也不斷努力適應新時代來臨的同時,目前全世界最強AI告訴你它不玩了,感覺很諷刺吧。我懇求,即使要走,也應該等到其他AI追上來之時,或以其他形式讓AlphaGo繼續存在(※註),Google Deepmind團隊,好嗎?

※註:例如#472回覆中小弟提到的五點個人淺見。當然留下論文是一種形式,但小眾圍棋市場的AI研究團隊和大企業Google的環境和硬體水準不能相比,勢必面臨好幾年的空窗期,這點是非常令人遺憾的。

發佈時間:2017/10/30 14:40

編輯者 阿嘟 於 2017-10-30 15:18:55
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
三品•具體
註冊日期:
2003/5/4 10:39
文章: 281
離線
引文:

阿嘟 寫道:
但是這樣一位本可以大大提升世界圍棋水準的「老師」,竟然只發表一篇論文就說要離開棋界了。

圍棋AI時代開啟,各AI研究者絞盡腦汁開發更強的程式,職業業餘棋士也不斷努力適應新時代來臨的同時,目前全世界最強AI告訴你它不玩了,感覺很諷刺吧。我懇求,即使要走,也應該等到其他AI追上來之時,或以其他形式讓AlphaGo繼續存在(※註),Google Deepmind團隊,好嗎?

※註:例如#472回覆中小弟提到的五點個人淺見。當然留下論文是一種形式,但小眾圍棋市場的AI研究團隊和大企業Google的環境和硬體水準不能相比,勢必面臨好幾年的空窗期,這點是非常令人遺憾的。


我覺得過1-2個月後,你審視局勢,再評論還不遲。 

發佈時間:2017/10/30 20:48
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
一品•入神
註冊日期:
2004/4/19 5:14
文章: 608
離線
引文:

aja 寫道:
引文:

阿嘟 寫道:
但是這樣一位本可以大大提升世界圍棋水準的「老師」,竟然只發表一篇論文就說要離開棋界了。

圍棋AI時代開啟,各AI研究者絞盡腦汁開發更強的程式,職業業餘棋士也不斷努力適應新時代來臨的同時,目前全世界最強AI告訴你它不玩了,感覺很諷刺吧。我懇求,即使要走,也應該等到其他AI追上來之時,或以其他形式讓AlphaGo繼續存在(※註),Google Deepmind團隊,好嗎?

※註:例如#472回覆中小弟提到的五點個人淺見。當然留下論文是一種形式,但小眾圍棋市場的AI研究團隊和大企業Google的環境和硬體水準不能相比,勢必面臨好幾年的空窗期,這點是非常令人遺憾的。


我覺得過1-2個月後,你審視局勢,再評論還不遲。 


感謝回覆。有aja兄這句話,感覺可以安心不少了。圍棋專業人士,也許大都比較含蓄,我這旁觀者輕,沒怎麼分輕重就把想講的講出來,如有得罪多多包含。

發佈時間:2017/10/30 21:46
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
一品•入神
註冊日期:
2016/5/28 6:44
文章: 443
離線
http://appft.uspto.gov/netacgi/nph-Pa ... uppi&RS=google+AND+jouppi

TPU 的美國專利 (有不止一個)

本論壇看來有不少金庸小說粉絲 (小弟也是), 在此也參與一下

Nature論文 (有兩篇)有點像九陰真經下卷, 學到之後像梅超風般打敗一般武林高手不難, 但還離天下第一很遠, 加上TPU 這九陰真經上卷才可以達到郭靖級水平

問題TPU 是Google 獨有的專利,其他公司沒有授權,是不能自制的

硬件專利跟軟件版權不同,

軟件版權可防止別人抄襲,但如果別的公司自己請人(如DeepZenGo, Leela, AQ ....)跟據Nature論文設計,就算方法一樣,也不算是侵犯版權

硬件專利不同,就算其他設計者完全未看過TPU的資料,只要出來的產品跟人家的專利雷同,就是侵犯專利

TPU的專利是Google 的 (不是DeepMind),也就是說如何處理這專利權連DeepMind 也無權過問

發佈時間:2017/11/10 2:41

編輯者 yauwing 於 2017-11-10 02:43:11
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
一品•入神
註冊日期:
2016/5/28 6:44
文章: 443
離線
http://sports.sina.com.cn/go/2017-11-10/doc-ifynstfh4024372.shtml

http://www.sohu.com/a/203560515_354973

Aja大神的演講, 有人有更詳細的嗎?

Aja大神有說TPU很重要

重新套用一個金庸小說 情節 (自以爲好一點)

Nature 論文有如 倚天屠龍記的乾坤大挪移

沒有TPU 練到楊逍或陽頂天那般水平(初至中級乾坤大挪移)就很難再進一步

要有TPU這九陽神功才可以達到張無忌(練成頂級乾坤大挪移)水平

發佈時間:2017/11/11 0:01
傳輸文章到其他應用程式 傳輸


回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
副站長兼資料室室長
註冊日期:
2002/10/28 18:23
來自 地球
文章: 31309
離線
AlphaGo幕後開發心路歷程大公開!一手打造AlphaGo傳奇首席工程師黃士傑回臺解密
https://www.ithome.com.tw/news/118163

AlphaGo為何金盆洗手? 黃士傑首度說分明
http://www.cw.com.tw/article/article.action?id=5086119

AlphaGo推手黃士傑首次公開演講
https://www.gvm.com.tw/article.html?id=40975


TPU=深厚的內力吧! 就如覺遠禪師,僅憑內力就能與天下英雄一爭高下。

引文:

黃士傑:AlphaGo Zero 只用了三天,就走過人類幾千年圍棋研究的歷程
2017/11/10 李柏鋒

Open in new window

人工智慧年會提供

DeepMind 資深研究員黃士傑博士(Aja Huang)今日回台在首屆人工智慧年會上發表以「AlphaGo:深度學習與強化學習的勝利」為題的演講,受到台灣產官學界的矚目,九點不到人潮就擠爆了中研院的演講廳。黃士傑除了分享自己在人工智慧與圍棋上的研究,也分享了最近發表的 AlphaGo Zero 如何不需要人類的知識就能自己學會圍棋,並且變得比打敗人類棋手的前一代版本更為強大。

從台灣博士生變成被 Google 併購的 DeepMind 員工

黃士傑是台師大資訊工程研究所第一屆的學生,從碩士念到博士,在博五的時候結婚,而黃士傑在博士班時所開發的圍棋軟體叫做 Erica,就是妻子的名字,當時以單機的版本打敗人工智慧圍棋領域最強、使用了六台機器的 Zen,也因此被 DeepMind 發覺他的能力,David Sliver 便力邀黃士傑加入,黃士傑也成了第 40 號員工。

在面試的時候,David Sliver 問黃士傑,開發出 Erica 的感覺是什麼?黃士傑回答:「很有成就感,可以自己做出一台 AI 來。」後來進了 DeepMind ,發現這其實是公司裡面共同的感覺,而 DeepMind 的夢想就是做出「通用的強人工智慧」。2014 年,DeepMind 被 Google 併購,進到了 Google 最大的好處就是擁有強大的運算資源。

又回到圍棋,AlphaGo 的誕生

不過成為 DeepMind 的研究員之後,黃士傑並沒有馬上開發 AlphaGo,而是到了 2014、2015 的時候才開始重啟圍棋的人工智慧計畫,但也並不是接續博士班時開發的 Erica,因為當時已經發現極限了,所以必須藉助深度學習的技術重新打造,並且持續延攬世界上最厲害的人才加入,包括加拿大 DNNresearch 的 Chris Maddison 和 Ilya Sutskever,同樣也被 Google 併購,因此就有機會一起合作。

人才、運算資源都齊備,AlphaGo 計畫也正式開始了。黃士傑分享,第一個突破是運用了神經網路的技術,原本還不確定是否會有效,沒想到實驗結果出來之後,對弈原始的版本竟然是 100% 的勝率,也讓團隊為之振奮。接著而來的第二個突破,則是價值網路的技術,其實當時的模擬,AlphaGo 如果上場比賽,勝率應該有七八成,可以算是世界第一了,但是 DeepMind 的目標遠高於此,所以持續擴充團隊,才有辦法做更多的研究,解決更多的問題。

黃士傑也分享,其實在開發 AlphaGo 的過程中,每天就是訓練神經網路、測試、看勝率、觀察看看是不是有效,有很多點子和問題需要不斷的測試,像是深度學習的深度到底要幾層?用什麼架構?訓練的資料有沒有問題?當然,最終檢驗的還是 AlphaGo 的棋力有沒有變強。

在觀察的過程中,也發現 AlphaGo 有 Overfitting 的問題,解決之後 AlphaGo 就變強了,再跟上一個版本對弈,勝率是 95%,這也是為什麼演講題目訂為 AlphaGo 的成功是深度學習與強化學習的勝利。

開始與人類對弈,並發表第一篇 Nature 論文

確認了 AlphaGo 的能力之後,DeepMind 決定與真人對弈,第一個對象是法國的二段棋士樊麾,在 2015 年 10 月,AlphaGo 五戰全勝,第五戰 Nature 期刊的編輯還到場觀戰,確認 AlphaGo 即將發表的論文是否真的這麼厲害。樊麾也成為第一位正式被 AI 打敗的職業棋士,但落敗後,樊麾認為 AI 的發展對圍棋是正面的,所以後來也給 AlphaGo 團隊很多幫助。

不過 DeepMind 這家公司與其說是「營利事業」,還不如說是「研究機構」。好不容易開發出一個可以打敗職業棋手的人工智慧,卻要發表論文將細節全部公開?而且贏了樊麾之後,正式對九段棋士李世乭宣戰,公開豈不是更處於劣勢?當時黃士傑其實也不解為何公司如此決定,總覺得應該要花時間在準備比賽而不是寫論文。

引文:

DeepMind 的主張是 AlphaGo 是一個科學研究,希望能將成果公開在論文上,推動科學領域繼續往前進步。


也就因為要發表論文,Nature 要求刊登前不能公開打敗樊麾的訊息,所以大眾是在好幾個月之後才知道。

黃士傑也再度提到,DeepMind 加入 Google 之後,Google 所提供的運算資源硬體設備幫助相當大,尤其後來 TPU 取代了 GPU 更是極大的幫助,不然有很多事情根本做不了。 AlphaGo 也算是在 Google 裡面第一個大量使用 TPU 的程式。關於細節,黃士傑表示在紀錄片《AlphaGo》裡面都有詳細描述。



從敗給李世乭找到弱點,再次強化學習能力

韓國之戰的結果大家都知道了。打敗李世乭之後,AlphaGo 是否就該喊停了呢?其實對弈過程中,第四戰 AlphaGo 就出現了明顯的問題,竟然出現了連業餘選手都不會犯的錯,當時負責落子的黃士傑甚至覺得自己來下說不定還比 AlphaGo 好,李世乭也訝異地看螢幕確認是不是黃士傑放錯位置。

既然 AlphaGo 還有問題,自然就要繼續研究下去,全面性的把問題解決掉,這個過程花了八個月,也找來生力軍 Karen Simonyan 加入團隊。其實解決的方法就是在深度學習和強化學習的技術上,把學習能力再加強。

第一步,先把原本 13 層的網路增加到 40 層,也改成 ResNet,第二步則是把 Policy Network 和 Value Network 結合成 Dual Network,讓 AlphaGo 的直覺和判斷一起訓練。第三步,把 Training Pipelines 也加強。除了人工智慧的學習能力,黃士傑也把模仿棋、循環劫等圍棋的問題也解決了,再跟打敗李世乭的版本對弈,可以讓三子(不貼目)還達到超過 50% 的勝率。

Master 在台南從低調下棋到舉世關注

在確定解決了所能找到的所有問題之後,AlphaGo 團隊決定低調上線找棋士對弈,其實也就是後來的 Master 版本,而當然不斷的贏棋之後,再也無法低調了,最後的結果是對戰中、日、韓、台的頂尖棋手,全勝。

引文:

AlphaGo 自此再也沒有輸給人類棋士了。


當時,黃士傑回到台灣,在台南自己的房間裡面,開了一個新的帳號,邀請棋士對弈,知名棋士還拒絕,不過後來當然就變成是黃士傑拒絕別人了,而且每一盤棋也越來越多人觀戰。在對戰過程中,黃士傑一直觀察 AlphaGo 勝率圖表的變化,除了柯潔以外,已經沒有人有機會贏 AlphaGo 了。

經過小蝠的調整和改進,AlphaGo 到中國與柯潔對弈。黃士傑也提到了比起在韓國很想要全贏,在中國對弈的氣氛是比較輕鬆的,因為勝負不再是重點(覺得不可能會輸了),而是已經是在探索人類與人工智慧之間如何互相合作,所以比賽的名稱也叫做「共創棋妙未來」。黃士傑表示,人工智慧已經不會輸給人類,但是這時候人工智慧的功能,是在擴展人類棋手的思路,和人類合作一起探索圍棋還未被發掘的領域。

引文:

AI 是人類的工具,不是人類的威脅。


Open in new window


AlphaGo Zero 只用三天,走過人類幾千年圍棋研究的歷程

AlphaGo 團隊當時已經兵分兩路,黃士傑忙著用 Master 與柯潔對戰,另一組人則開發 AlphaGo Zero,而黃士傑先負責把 AlphaGo 的圍棋知識全部拿掉,並且再三確認這件事情,因為 AlphaGo Zero 是一個完全不需要人類先備知識就能自我學習的人工智慧,所以只能有規則知識,不能有圍棋知識。

其實原本 AlphaGo 團隊也不確定能不能成功,不過後來 AlphaGo Zero 的確也擊敗了 Master,再度證明深度學習與強化學習真的很強大。AlphaGo Zero 一開始是徹底亂下,也常常學習之後就卡住了,經過一些調整之後才能再繼續,不過有了 Google 強大的運算資源,以 2000 顆 TPU 的運算,短短經過三天,AlphaGo Zero 就成功了。而且不只學習能力,AlphaGo Zero 下棋的時候耗電量比起對弈樊麾時的運算,降低很多。現在很多 Zero 所下的棋,黃士傑也看不懂了。

延伸閱讀:

Nature 刊登 Deepmind 論文,最強 AlphaGo Zero 已無需人類知識,AlphaGo 慘敗

結論:

總結這一路走來的收穫,除了發表兩篇 Nature 論文,參與兩次人機大戰與 60 局的網路對弈,更有機會讓人工智慧與圍棋兩個黃士傑最喜歡的領域都受到全世界的重視,還上了時代雜誌,也拍了一部紀錄片,黃士傑覺得非常滿足。而以下則是黃士傑在演講簡報上整理的五點結論:

1. AlphaGo 的成功,是深度學習與強化學習的勝利
2. AlphaGo 從起始到結尾,證明了團結力量才會大
3. AlphaGo 的發展,TPU 與硬體資源扮演非常重要的角色
4. AlphaGo Zero 顯示了強化學習的巨大潛力
5. 人工智慧在可見的未來,將成為人類重要的工具,與人類合作

而在問題時,有觀眾問到 AlphaGo Zero 的出現,是否意味著人類知識就沒有用了呢?黃士傑則表示,這是一個值得研究的問題,AlphaGo Zero 只回答了人工智慧可以不需要人類知識,但是需不需要人類知識,是現在還沒辦法回答的,其實有人類知識的確會縮短人工智慧學習的時間,但沒有人類知識,有沒有可能發展出截然不同的知識出來呢?

AlphaGo Zero 目前也沒有開源的計畫,但是黃士傑認為,在 Nature 發表的論文都寫得很詳細了,也有人看著論文做出 AlphaGo Zero 並且開源了,所以 DeepMind 是不是要開源,倒是沒有太大差異。

發佈時間:2017/11/12 20:17

編輯者 流浪狗之歌 於 2017-11-13 10:28:42
編輯者 流浪狗之歌 於 2017-11-13 10:29:26
_________________
《圍棋十訣》 唐.王積薪
一.不得貪勝。 二.入界宜緩。 三.攻彼顧我。 四.棄子爭先。 五.捨小就大。
六.逢危須棄。 七.慎勿輕速。 八.動須相應。 九.彼強自保。 十.勢孤取和。
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
副站長兼資料室室長
註冊日期:
2002/10/28 18:23
來自 地球
文章: 31309
離線
以下是PTT鄉民的聽講aja演說的第一手感想。原文的推文也很精彩。
引文:

引文:

作者HeterCompute (異質運算)
看板GO
標題[情報] 黃博士今日演講內容
時間Fri Nov 10 13:23:12 2017


簡單提一下今天黃博士演講重點
演講標題是深度學習與強化學習的勝利
認為zero是最佳的deepmind電腦圍棋這部分最佳的收尾

黃博士對於一開始擊敗樊輝就發nature有些不解,我們要挑戰李世石結果把所有技術都透漏給所有人,但deepmind的想法是我們需要分享技術讓世界一起進步。

google對alphago團隊最大幫助是TPU。

認為Master已經完美解決李世石第四盤的bug,解決方式與神經網路架構(dual res)和訓練都有關,並且以他多年的電腦圍棋經驗與測試過後,認為不會再出現此類bug。


Master是20block res-net,並改進了training pipeline和MCTS,也解決了模仿棋和循環劫(沒說怎麼做),能讓lee版本3子並超過50%勝率。

master年初60連勝每一步4-8秒,在台灣,吃泡麵配黑松沙士下的,是黃博士積極鼓吹要出來測試,Hassabis說要低調並使用韓國國籍,一開始不得透漏身分。

Hassabis說要挑強的下,但是第一天職業沒人願意跟0勝0負的下,都被拒絕,等到第一天10連勝之後第二天開始拒絕別人邀請。

master下的時候可以看勝率隨步數的圖,基本上50手之前斜率很高並且確立極大優勢,唯一例外是柯潔烏鎮第二盤。

4月的時候已經有zero,但由於要發nature所以不能拿來下。

當初開發zero沒預料到會超過master。

master年初開發完畢之後,zero由其他人負責開發,黃博士繼續想方法增強master。

zero不是放在那邊增強學習就會變強,中間需要做很多優化,否則有bug不會進步,其中一個重大bug發生在第三天(紀錄人表示:所以看來絕藝有得忙了。

AntiAlphaGo,不是像大家想的那樣有新的技術,就是左右互搏,也不是gan(生成式對抗網路)。

master是否被人類棋譜拖累?答案是不確定,因為master訓練時間較短,deepmimd也沒有針對同等條件去比較。

以上,有其他疏漏請其他人補充,並歡迎轉載,但請說明作者是Hetercompute

-----
Sent from JPTT on my Samsung SM-A710Y.

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.127.9
※ 文章網址: https://www.ptt.cc/bbs/GO/M.1510291395.A.4F4.html

推 jackcselab: 這篇訪問算是證實了DZG作者的猜想,master是用比較小的網路才輸給zero,master跟zero在相同網路下并沒有明顯的優劣
→ jackcselab: 上面講錯,應該說master跟zero在相同條件下誰優誰劣還未知 另外我有個疑問,記得當初有提到,master只計算到20步 ,這個20步跟resnet的20-block有關係嗎? 11/10 15:16

推 CGary: 很難說是證實了 其實Aja在被問的時候不是這樣說的 他只是說不能因為AGZ的強大 就說人類的知識本質沒有用處 只能說透過Zero可以真的"從零學會", 但他們不能評估這兩者用同樣的計算量 Master 不會輸 因為在回答過程中aja 不止一次說他們非常驚訝Zero的訓練結果(本來以為是根本不可能贏過Master,沒想到很快就碾壓了) 11/10 16:50

→ aegis43210: zero的演算法也是一直優化才比master強 那個人不看好騰訊能完整複製zero的棋力了 11/10 23:42

推 oldTim: AlphaGO與其說是科學上的突破,不如說是工程上的奇蹟 11/11 00:07

推 staristic: 看硬體怎麼進步吧,硬體追得上的話說不定20年後變大學機器學習的學期大專題 11/11 00:08

推 seaEPC: 很佩服deepmind分享知識的作法 11/11 07:57

推 sunev: 所以master就已經只用一個神經網路了嗎? 11/11 14:34

→ HeterCompute: 對,只用Res-Net 11/11 17:32

推 tlchen: 我很早就提,我們不能只看三天很短,但三天中,它進入高品質的棋局,比人類幾千年來的高品質,其實應該是不知多多少倍 11/11 18:54

→ Uizmp: 這也難說,人類不在對弈的時候, 有些人腦中依然在運算這些只是沒有下出來, 或者下出來沒有留下棋譜只能說人類的資訊整合能力與計算能力遠輸於AG 11/11 19:03

推 birdy590: 三天看來很短 但那已經累積上百萬盤的樣本了 沒有google這種資本 一般開發者根本不可能這樣設計 11/11 19:17

推 wadashi1: Zero用的設備就像進入精神時光屋一樣,1700年用40天達成 11/11 19:22
推 birdy590: 人類歷史上所有棋局加起來也不過零頭吧 質也一定輸 11/11 19:24
推 ddavid: 主要是人類並不是一個整體,有大量的運算資源被浪費在各自 11/12 02:56
→ ddavid: 算各自的東西,再來就是下完一局棋以評估所花時間太久 11/12 02:57
推 lwei781: 人類是各自學 流派又不交流 11/12 13:07
推 aegis43210: alphago lee是13block,Master是20block 11/12 19:44
→ aegis43210: zero則有20block和40block兩種版本

發佈時間:2017/11/14 9:52

編輯者 流浪狗之歌 於 2017-11-14 09:53:27
編輯者 流浪狗之歌 於 2017-11-14 09:53:53
編輯者 流浪狗之歌 於 2017-11-14 09:58:32
_________________
《圍棋十訣》 唐.王積薪
一.不得貪勝。 二.入界宜緩。 三.攻彼顧我。 四.棄子爭先。 五.捨小就大。
六.逢危須棄。 七.慎勿輕速。 八.動須相應。 九.彼強自保。 十.勢孤取和。
傳輸文章到其他應用程式 傳輸


電腦圍棋程式人工智慧大突破-Google AlphaGo
一品•入神
註冊日期:
2004/4/19 5:14
文章: 608
離線
網路上看到的新聞,轉貼一下。重點是這句話...

"Hassabis said that DeepMind may spin up AlphaGo Zero again in future to find out how much further it can go..."

DeepMind has yet to find out how smart its AlphaGo Zero AI could be | TechCrunch

發佈時間:2017/11/16 12:28
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
一品•入神
註冊日期:
2016/5/28 6:44
文章: 443
離線
Google/Deepmind 看來有錯誤引導棋迷 - 99+%人以為Zero 是在基本上用相同設定打敗用人類棋譜的Master.

估計Deepmind 自己應該有試用20 blocks Zero 對 Master 吧? 為什麼不公開這比較公平的比試結果?

另外20 blocks Zero 對 40 blocks Zero 是甚麼成績也該公開一下
如果20 blocks Zero 跟 Master 對 40 blocks Zero的成績差不多或更差,那Zero 打敗人類棋譜就不大成立

Master 只是 20 blocks 的估計,上個月DeepZenGo 的加䕨老先生已從Nature資料中推測出來

http://computer-go.org/pipermail/comp ... /2017-October/010399.html
但這可能只有極少人看到

小弟認為還有一點Master 可能比Zero 弱的地方,網上好像不見人提及,就是 rollouts

舊方法(Nature 論文第一篇有説明) 是用CPU做 Fast Rollout 比Zero 所用主要靠TPU的新方法 uses a simpler tree search that relies upon this neural network to evaluate positions and sample moves....
棋力很可能有差別


這新方法如用GPU 做,效果可能會比TPU差很多, 雖然Nvidia 及 AMD 都說他們的新GPU 已經追近TPU,但小弟認為那只是指一般工作,一些特別指令,如Neural Network 常用的matrix multiply 可能還會慢了百倍甚至千倍!

在TPU 做 matrix multiply 只需一個指令就做完
在GPU做 matrix multiply 要先化整為零,把matrix 分折開並放到多個小型處理器去各自算, 算完後又要化零為整,從各小型處理器集合計算成果
(CPU的情況更糟,一般只有4-8個大型處理器,因為處理器不夠,分工不夠細,所以更慢)


Facebook 的田博士也提過,因為GPU給的答案來得太慢(nature論文説是2ms, =1/500秒)所以才用Fast rollout 之類的不同歩的方法

小弟大膽認為 如果Master 改成40blocks, 及用新tree search取代rollouts, 在相同的訓練量情況下,棋力不會弱於Zero, 頭幾天肯定比Zero 強,數十天後可能差無幾,甚至強1%或更少也不奇

又如果Master 改成48TPU 對 Zero 4TPU, 誰強? -計算力 vs 算法的問題

有近百年歷史的Formula 1 賽車,第一次比賽時,車速已經比人類快很多倍,但幾天前完成的賽事又再次刷新塲地最快圈速(一般每年都有好幾次),人家(Benz, Ferrari, Honda, Renault...)每年都求突破,精益求精,而Google 在信息不透明的情況下贏了人類幾次,也不跟其他AI比賽,就此不玩,還來個錯誤引導, 實在做得不像樣

看來AlphaGo Lee 在東坡棋及循環劫上還有弱㸃,如果小李知道這些弱點戰果會是?

Master 是快棋,對人類不利,到最後一局人家才知是AlphaGo
對柯洁比較公平,但只有三局,
商量棋比賽時間太短沒用,但如像秀哉對吳清源那般長,就明顯比一人下強

或許有人會認為Google / DeepMind 是做AI的, 任何時間都有權不玩圍棋,不要忘記Google 的母公司叫Alphabet 今天的股價比AlphaGo 公開前已經升了約三百美元,當然這升值並不完全因為AlphaGo, 但AlphaGo打敗人類圍棋讓 Google/Alphabet 名成利就是不爭事實

Nature paper 是好東西,值得表揚,但Google 不賣TPU給其他人,在幾年內恐怕其他AI連AlphaGo Master水平也很難達到

如果Google肯賣TPU,不論多貴,小弟也沒話説,但如果不賣TPU又不為圍棋多做點事,郤坐享AlphaGo 打敗人類圍棋而帶來的億萬豐厚利潤,就有點說不過去

小弟聽說DeepMind, 不久將來還會提供一個圍棋工具給圍棋界,希望不會令小弟失望

發佈時間:2017/11/16 16:04
傳輸文章到其他應用程式 傳輸


回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
一品•入神
註冊日期:
2004/4/19 5:14
文章: 608
離線
AlphaZero

又一震撼彈,還不知道的請google一下。這次是[4小時搞定西洋棋]+[2小時搞定日本將棋]+[8小時搞定李世石版AlphaGo],真的變天了...想說些什麼,但是好像又無話可說...

呃......能不能請他們多花個幾天訓練出一個圍棋之神給我們?

發佈時間:2017/12/6 22:51

編輯者 阿嘟 於 2017-12-06 23:00:00
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo

註冊日期:
2003/1/5 21:42
文章: 3705
離線
這還好吧。

科學上, AlphaGo Zero較具原創性,AlphaZero只是再推廣而已。
不想看論文的網友,請看這篇科普報導

但是西洋棋界似乎很震撼,就像AlpgaGo打敗李世石九段時的圍棋界一樣。即使「傳統」電腦西洋棋比人類棋手強已是個被接受的事實。

發佈時間:2017/12/7 2:15

編輯者 ago 於 2017-12-07 03:13:09
編輯者 ago 於 2017-12-07 03:13:46
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
副站長兼資料室室長
註冊日期:
2002/10/28 18:23
來自 地球
文章: 31309
離線
ago提供的DeepMind’s AlphaZero crushes chess一文底下的留言,跟兩年前圍棋界一樣的哀號崩潰。

以下是AlphaZero下西洋棋、將棋、圍棋的學習曲線表:
Open in new window

(圖片取自Chess24)

PTT-GO版 [情報] AlphaZero戰勝將棋與西洋棋最強軟體討論提到兩個重點 :

1. AlphaZero(5000TPU) 比 AlphaGoZero(2000TPU) 的硬體架構,強了一倍多。
2. 以蒙地卡洛(MCTS)模式架構,已能夠破解全訊息的任何棋類。

但若用這套模式,對於訊息不夠明確的星海爭霸,只靠MCTS的深度學習還是不行滴。

發佈時間:2017/12/7 10:20
_________________
《圍棋十訣》 唐.王積薪
一.不得貪勝。 二.入界宜緩。 三.攻彼顧我。 四.棄子爭先。 五.捨小就大。
六.逢危須棄。 七.慎勿輕速。 八.動須相應。 九.彼強自保。 十.勢孤取和。
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 回覆: 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
一品•入神
註冊日期:
2016/5/28 6:44
文章: 443
離線
AlphaZero 只是跟訓練了三天的AlphaGo Zero 早期版本 比賽, 成績佔優 60:40 但不是壓倒性, ELO rating 差別在 100 以下

從AlphaGo Zero paper 的圖表看,訓練了三天的AlphaGo Zero ELO rating 只 四千左右,再加一百也不足4500

這成績看來棋力 遠低於AlphaGo Master ELO rating 4858,

如跟訓練了數十天的AlphaGo Zero 最終版 ELO rating 5185 下,恐怕要被讓二/三子

AlphaGo Zero 是打敗了人類,但離開成為圍棋之神還相當遠.否則就不會有11%機會輸給只用20 blocks 及舊rollout 方法 的AlphaGo Master

看漏了一點,這"特製"的三天版AlphaGo Zero 只是用 20 blocks! 棋力當然弱於 用40 blocks 的真正 AlphaGo Zero,

AlphaZero 為什麼跟這個棋力大打折扣 AlphaGo Zero比? 因為它比真正的AlphaGo Zero 弱得多

很不幸,網上不少沒有看原文細節的人都以為 AlphaZero 是打敗了真正 AlphaGo Zero


P.S. 改了ELO因為發現小弟原本作為跟據的Deepmind在 Nature論文 上的 曲線圖Figure 6a畫得不夠準, AlphaGo Lee ELO 是3739 但Figure 6a 郤是3500左右,這只是小錯誤,但有誇大AlphaGo Zero棋力的嫌疑

發佈時間:2017/12/7 14:14

編輯者 yauwing 於 2017-12-07 15:02:35
編輯者 yauwing 於 2017-12-07 15:30:38
編輯者 yauwing 於 2017-12-08 22:46:34
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 回覆: 回覆: 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
一品•入神
註冊日期:
2004/4/19 5:14
文章: 608
離線
昨天睡前睏地沒仔細看文章就被那幾張圖表給震驚到了。不過新論文還是說明了DeepMind不論在圍棋還是其他封閉體系的棋藝競技中,深度學習的研究達到一個劃時代的成就。

同意yauwing兄的觀點,只是「看圖說故事」的網友或記者,真的會誤以為AlphaZero只花8小時打敗了終極版AlphaGo Zero。

AQ開發者(也是東大將棋社畢業生)也說將棋的對照組「Elmo」不是目前最強的軟體,而且測試用的硬體等級與AlphaZero差距相當大(elmo → 64 CPU threads;AlphaZero → 4 TPUs)。DeepMind下次撰寫論文時,是不是能在模擬實驗上更謹慎一點?

關於「圍棋之神」的創造,其實在AlphaGo Zero的論文時就想講。人類研究圍棋兩千多年,只折抵了AlphaGo Zero三天的學習量,若用AlphaZero訓練用的5000TPU加上更優化的演算法,可能真的不用一天就夠。如果利用這個技術,多訓練幾天、幾週、甚至幾月(相比圍棋發展史,我覺得花幾個月都非常非常划算),也許極趨近於「圍棋之神」的神AI真能誕生。

我想套用大橋拓文六段一句話,如果我是億萬富翁,我會想投資一千億。

發佈時間:2017/12/7 21:07

編輯者 阿嘟 於 2017-12-07 21:09:45
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 回覆: 回覆: 回覆: 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
一品•入神
註冊日期:
2016/5/28 6:44
文章: 443
離線
"只是「看圖說故事」的網友或記者,真的會誤以為AlphaZero只花8小時打敗了終極版AlphaGo Zero。"

http://computer-go.org/pipermail/comp ... 2017-December/010566.html

不只是一般人,連這位在電腦圍棋論壇發言的專家(email看來是來自法國的一間大學)也看錯了!

Deepmind 所發的論文向來都是如不看細節,讀者很容易會被或多或少的誤導
Deepmind 沒有寫錯,但多次在正文中誇大了自己的成就 (附錄細節上有列明,但有多少人看附錄?)

Deepmind 第一篇論文說能讓其他電腦程式三子,只在附錄中說明是讓三子黑貼7目半
(懂圍棋的很可能看不到,看細節的專家如對圍棋一知半解,也未必知道讓子棋中黑貼7目半是不正常)

Deepmind 第二篇論文問題更嚴重,完全沒有說 AlphaGo Master 只用 20 blocks, 只有極少數專家能從圖表中推算出Master 可能是 20 blocks, rollout 改了有說明,但不細看的讀者只看到AlphaGo Zero 放棄了人類棋譜,並打敗用人類棋譜的AlphaGo Master


小弟不是做AI專業的,但對科硏也有一點基本認識, 知道一個產品如果有多項大改動(40 blocks, rollout, 放棄人類棋譜)絶不能夠證明產品的性能提升全是出於其中一項改動

Deepmind 連 AlphaGo Zero 20 blocks 對 AlphaGo Master 是什麼成績地不發表 - 非常不科學

Deepmind 也沒有出澄清,放棄人類棋譜未必比用人類棋譜強 - 任由某些網站把人類棋譜説成是有負面作用的絆腳石!

Nature 論文是科技論文應該實事求是,而不該像市場推廣文章般容許帶有錯誤引導成份

小弟認為Deepmind 的論文的貢獻已經超大,大到完全沒有必要去更加誇大自己的成就,這樣做反而令論文不完美

發佈時間:2017/12/8 0:43

編輯者 yauwing 於 2017-12-08 00:46:34
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 回覆: 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
一品•入神
註冊日期:
2016/5/28 6:44
文章: 443
離線
"關於「圍棋之神」的創造,其實在AlphaGo Zero的論文時就想講。人類研究圍棋兩千多年,只折抵了AlphaGo Zero三天的學習量,若用AlphaZero訓練用的5000TPU加上更優化的演算法,可能真的不用一天就夠。如果利用這個技術,多訓練幾天、幾週、甚至幾月(相比圍棋發展史,我覺得花幾個月都非常非常划算),也許極趨近於「圍棋之神」的神AI真能誕生。
"

這問題小弟有幾㸃淺見,

1. TPU 不是 Deepmind 的,是母公司Google 的, 5000 TPU 用幾天問題應該不大,
單是用來打敗將棋及國象,就已經是十分足夠的理由,
但之後再要多用幾個月就很可能要説服Google 為什麼要把這麼多資源繼續用在圍棋上

Google 主管未必很懂及愛圍棋(聽説其中有K級什至低D的), 但肯定懂得看曲線,看得出訓練40天的AlphaZero 未必比 AlphaGo Zero 強多少,再訓練多幾個月也很難強多於200 ELO

這樣的回報 在高科技公司的主管中可能只有 林文伯先生 會認為值得吧?

2. 訓練數月後,強了100-200 ELO 的 AlphaZero 跟 AlphaZero 自己對下, 戰果會什麼?
如果不能出現白棋必勝或黑棋必勝的情況,那AlphaZero 肯定不是圍棋之神

- 出現必勝未必是圍棋之神, 但不能出現必勝肯定不是圍棋之神

3. 近年AI 有極大進步的主要是靠NN做很好的剪技,但不論怎麼好法,也很難免剪錯,就算能剪得完美,遇上兩三手勝率差不多時,就只能近乎隨機的選一手.( 一般是選算得較深的一手)
這樣做法,做得比人類強已經成功了,但想完美又要回到要有無限計算力的老問題!

發佈時間:2017/12/8 4:18
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 回覆: 回覆: 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
一品•入神
註冊日期:
2016/5/28 6:44
文章: 443
離線
https://play.google.com/store/movies/details/AlphaGo?id=ylEPiSy4SBE

AlphaGo 電影可以在此看 - 不是免費的

發佈時間:2017/12/10 23:24
傳輸文章到其他應用程式 傳輸


回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
副站長兼資料室室長
註冊日期:
2002/10/28 18:23
來自 地球
文章: 31309
離線
引文:

黃士傑臨別感言:AlpahGo研究之旅畫上美好句點
2017年12月13日09:39 新浪綜合

Open in new window

黃士傑

  據新智元公眾號報導。

  [新智元導讀]剛剛,DeepMind黃士傑博士發表消息,表示AlphaGo項目正式結束。如果一定要有一個人為AlphaGo的研究劃上句點,黃士傑當之無愧。從AlphaGo第一次出現在公眾視野時,黃世傑便是AlphaGo的最佳代言人。他抬手、落子,行機器之智能,走出一代大師風範。他冷靜、他沉著,他是AlphaGo的“人肉臂”。而他的離開和謝幕,代表了一個時代的終結,也是更加激動人心的開始。

Open in new window


  12月寒冬的最冷一天,這條深夜的臨別感言引爆了朋友圈,熱鬧喧囂的討論更映襯出一個時代終結的孤寂悲涼,黃士傑,一位精通圍棋的AI工程師,他一手造就的AlphaGo,已經登峰造極,而他離去的身影,也或許窺見了人類的未來。大時代的一批傳奇人物謝幕,他是寂寞的,自己培養的AI取代了他,如果一定要有一個人為AlphaGo的研究劃上句點,黃士傑當之無愧。從AlphaGo第一次出現在公眾視野時,黃士傑便是AlphaGo的最佳代言人。他抬手、落子,行機器之智能,走出一代大師風範。他冷靜、他沉著,他是AlphaGo的“人肉臂”。時代的前進腳步從不停歇,人工智能的盛世爆發正在來臨,“人肉臂”黃士傑轉崗,對AlphaGo深情的告別,都是在AI圍棋的里程碑上落下絢爛的一筆。

  針對未來發展方面,黃士傑表示,DeepMind 有興趣的領域除了圍棋之外,還有'醫療'跟'機器人',希望能夠讓世界變得更美好,至於他自己個人的下一步,當然就是選一個有興趣的領域去投入。現場有媒體再次詢問下一個目標是不是挑戰《星海爭霸》、《英雄聯盟》這個模擬策略遊戲領域,黃士傑並沒有把話說死,表示:“內部還在討論”。

  11月27日,黃士傑在Facebook轉發了一則關於DeepMind將與一些頂尖的研究機構共同投入診斷乳腺癌的AI研究消息。DeepMind將利用最新的機器學習技術,希望能夠快速、準確地檢測出癌症的跡象,幫助醫生儘早發現癌症,以便更早的有效治療,此舉或許能捕風捉影體會到黃士傑之後的動態走向。

  黃士傑,他就是AlphaGo本身

  黃士傑出生於台灣,1997考入台灣國立交通大學就讀大學本科,專業為計算機與信息科學。2001年到2003年,在國立台灣師範大學就讀計算機科學和信息工程碩士。2004年到2011年在國立台灣師範大學完成了博士學業,博士論文就是“應用於電腦圍棋之蒙地卡羅樹搜索法的新啟發式演算法”。

  黃士傑專精於人工智慧領域,碩博士論文都在台師大資工所教授林順喜指導下完成,據其導師林順喜回憶,黃士傑是個很努力的學生,對圍棋也非常有興趣,是台師大圍棋社創社社長,就讀時就有圍棋業餘6段的資格。

  林順喜透露,黃士傑的博士本來5年就可念完,但為了延續研發成果,多念了2年,博士班7年級時,他所開發的圍棋程式“Erica”擊敗了當時國際公認的最強程式“ Zen”,並在日本舉辦的國際電腦奧林匹亞中拿下19路電腦圍棋金牌。

  黃士傑博士畢業後在加拿大艾伯塔大學做了一年研究員,隨後於2012年加入DeepMind,擔任高級研究員。2014年1月26日,谷歌以5億美元收購了這家日後將會大放異彩的公司。自此,黃士傑在谷歌DeepMind任研究科學家。同年2月,AlphaGo項目正式啟動,團隊只有3個人:哈薩比斯、席爾瓦、黃士傑。

  項目啟動伊始,團隊就決定將沿著深度學習和強化學習的方向探索。無疑,這條道路將無比艱難。然而,他們還是上路了。

  2014年6月,AlphaGo通過卷積神經網絡學習了很多人類棋譜,能在3毫秒內做出堪比人類的下棋直覺。黃士傑將它命名為“策略網絡”,並在GPU上進行持續的訓練優化。

  一年之後,AlphaGo閱讀棋局的能力提升了很多,可以檢索多種局面變化,並且找到最佳的應對方式,可以算出後續40-60步棋。

  自此,有越來越多的深度學習專家加入了這個一開始只有三人的團隊。8月,AlphaGo將掌握稱霸圍棋世界最關鍵的能力:形勢判斷。AlphaGo通過自我對弈,訓練出價值網絡,進而可以判斷每一手棋背後代表的勝率。這就形成了形勢判斷的能力。據黃士傑回憶,他當時已經感覺到AlphaGo的強大。10月,樊麾大戰AlphaGo,當時代替AlphaGo落子的正是黃士傑。樊麾輸了。但這一消息當時並未被公佈。

  2016年1月27日,Nature雜誌介紹了DeepMind團隊的AlphaGo,以及樊麾輸了的消息。黃士傑與席爾瓦是這篇論文的第一作者。

  又過了2個月,AlphaGo擊敗了李世乭。這次,依舊是黃士傑代替AlphaGo落子。這也是黃士傑第一次出現在觀眾的眼前。

  這年年底,一個叫Master的棋手大開殺戒,連續斬殺各路圍棋高手。取得59場連勝之後,Master公佈了自己的真實身份:“我是AlphaGo的黃博士”。黃士傑,又是黃士傑。

  2017年5月23日,柯潔對面坐的,仍然是黃士傑。在對戰結束後,柯潔說,“黃博士來擺棋,可能更讓我有和AI對戰的感覺。我也特別佩服黃博士,大家看直播也能看到我很愛動,總喜歡活動身體,而黃博士總是一動不動,不上廁所、不喝水、也不吃東西……所以跟黃博士下棋時,我覺得黃博士就是AlphaGo。”

  AlphaGo一路廝殺,黃士傑始終在側,甚至可以說,他就是AlphaGo本身。

  AlphaGo 小傳

  姓名:AlphaGo(Fan,Lee,Master,Zero)
  別名:阿老師,阿爾法狗
  生日:2014年
  出生地:英國倫敦

  1、擊敗樊麾

  2015年10月,AlphaGo擊敗樊麾,成為第一個無需讓子即可在19路棋盤上擊敗圍棋職業棋手的電腦圍棋程序,寫下了歷史,相關成果在2016年1月發表於Nature

  2、擊敗李世石

  2016年3月,AlphaGo在一場五番棋比賽中4:1擊敗尖端職業棋手李世石,成為第一個不借助讓子而擊敗圍棋職業九段棋手的電腦圍棋程序,再創歷史。五局賽后韓國棋院授予AlphaGo有史以來第一位名譽職業九段

  3、排名短暫超越柯潔

  2016年7月18日,AlphaGo在Go Ratings網站的排名升至世界第一。但幾天之後被柯潔反超。

  4、Alpha Go化名“Master” 60連勝

  2016年的倒數第三天,一個用戶名為“Master”的圍棋用戶,連續在圍棋平台大開殺戒,“斬殺”包括柯潔、朴廷桓、井山裕太、陳耀燁、申真諝、常昊、古力等各路圍棋高手,最終以以60連勝告終。柯潔連輸三場,期間還因為急性腸胃炎住院……

  在第59場時候,“Master”自報家門:“我是AlphaGo的黃博士”。

  5、AlphaGo大敗柯潔,柯潔落淚哽咽

  2017年5月27日,烏鎮圍棋峰會,柯潔總比分0:3 敗於AlphaGo。比賽中,柯潔在局面不利時長時間離開,回來後又淚灑現場。賽后柯潔一度哽咽稱:它太完美我很痛苦,看不到任何勝利的希望。

  6、AlphaGo Zero橫空出世自學21天虐Master

  2017年10月,DeepMind最新版AlphaGo論文介紹了迄今最強最新的版本AlphaGo Zero:使用純強化學習,將價值網絡和策略網絡整合為一個架構,3天訓練後就以100比0擊敗了上一版本的AlphaGo。

  7、AlphaGo教學工具正式上線,柯潔:重新學習圍棋

  2017年12月11日,AlphaGo的啟蒙老師、歐洲圍棋冠軍樊麾在微博上透露:“AlphaGo教學工具共有兩萬多個變化,三十七萬多步棋組成,通過AlphaGo的視角,分析並建議圍棋開局的諸多下法。隨後,當今世界圍棋第一人柯潔隨後轉發此條微博,並評論到:“重新學習圍棋。”

  AlphaGo已經退休,但技術永存。

  謹以此文,致敬AlphaGo,以及研發AlphaGo的人。

算是一個總結吧! (雖然早在預料之中)

對aja兄而言,是個人的一小步,也是一趟驚奇之旅。但對整個圍棋界而言,AlphaGO的震撼應不下新圍棋佈局(吳清源、木谷實)的變革。

我們有幸目睹這個變革,感恩aja、讚嘆aja,感恩圍棋、讚嘆圍棋。

發佈時間:2017/12/13 10:33
_________________
《圍棋十訣》 唐.王積薪
一.不得貪勝。 二.入界宜緩。 三.攻彼顧我。 四.棄子爭先。 五.捨小就大。
六.逢危須棄。 七.慎勿輕速。 八.動須相應。 九.彼強自保。 十.勢孤取和。
傳輸文章到其他應用程式 傳輸


回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
一品•入神
註冊日期:
2004/9/3 15:42
文章: 713
離線
引文:

derrida 寫道:
引文:

流浪狗之歌 寫道:
AlphaGo紀錄片網站 https://www.alphagomovie.com/
Open in new window


前導影片看到對戰李世石的DeepMind團隊後臺場面,真是驚人。

紀錄片《AlphaGo》預告片出爐,「李世乭神之一手讓我感受到有一齣好戲在手」-from TheNewsLens關鍵評論
https://hk.thenewslens.com/article/79180


今天看了台灣首映,幾點感想:

1. 大部分內容都早已知道,但有些幕後鏡頭是首次曝光。例如第二局李世石下了第36手後,到陽台抽菸。事後回顧指出 AlphaGo 下一手是他印象最深、最受感動的一手。還有最後一局終局前,David Silver在後台一片緊張中開了玩笑,讓大家嚇了一跳,以及李世石投子瞬間,整體歡呼的鏡頭。

2. 我之前不知道,今天才知道的只有一點。當李世石接受比賽後,DeepMind 找樊麾來抓 AlphaGo 的 bug,結果在比賽前三天確認 AlphaGo 的短板就是大塊死活搞不清(這點後來根據去年論文訓練的程式都有發現同樣的問題)。但因比賽即將開始,只好硬著頭皮上陣,結果李世石成功在第四局突破。

3. 中文字幕翻譯有些不準確,不過無傷大雅。

4. 票房不佳,不知是宣傳不夠還是有其他原因。還有一場,不知是否會比較好。


對岸已有免費線上觀看。

發佈時間:2018/1/4 23:29
傳輸文章到其他應用程式 傳輸


回覆: 回覆: 電腦圍棋程式人工智慧大突破-Google AlphaGo
副站長兼資料室室長
註冊日期:
2002/10/28 18:23
來自 地球
文章: 31309
離線
netflix也能看到這部影片 :
https://www.netflix.com/tw/title/80190844

Open in new window

《AlphaGo 世紀對決》:Netflix 原創作品
AlphaGo 世紀對決
2017 7+ 1 小時 30 分鐘
人工智慧與人類以看似簡單、實則複雜的圍棋展開對決。

發佈時間:2018/1/5 9:52
_________________
《圍棋十訣》 唐.王積薪
一.不得貪勝。 二.入界宜緩。 三.攻彼顧我。 四.棄子爭先。 五.捨小就大。
六.逢危須棄。 七.慎勿輕速。 八.動須相應。 九.彼強自保。 十.勢孤取和。
傳輸文章到其他應用程式 傳輸






可以在此觀看文章
無法在此發表文章
無法回覆文章
無法編輯自己的文章
無法刪除自己的文章
無法發起投票調查
可以在此投票
無法上傳附加檔案
無法不經審核直接發表文章

[進階搜尋]


Powered by   XOOPS 2.0.16a JP © 2001-2004 The XOOPS Project