av片在线观看,日韩久久av电影

讓對(duì)方兩個(gè)子:

在圍棋里讓2子是說(shuō)讓一方先在棋盤(pán)上放上2個(gè)棋子（棋子只能放在星位），然后對(duì)方才開(kāi)始走。這兩個(gè)子在對(duì)弈之初的價(jià)值巨大，對(duì)于專(zhuān)業(yè)棋手來(lái)講，每個(gè)棋子價(jià)值至少在10目以上（這是最保守估計(jì)了）。讓兩子相當(dāng)于至少先讓出去對(duì)方20多目的地盤(pán)。由于棋盤(pán)是有限的，如果不能在后面的比賽中，在有限的空間里贏回這20多目，那就是讓子失敗了。而且讓子數(shù)越多，被讓方獲得的價(jià)值不單是線(xiàn)性增長(zhǎng)的，因?yàn)樽恿χg會(huì)形成配合，獲取更大的利益。比如說(shuō)，讓子，其價(jià)值就可能遠(yuǎn)不止40目了。

贏對(duì)方2個(gè)子：是指雙方下完后，贏的一方比輸?shù)囊环蕉喑?個(gè)子。如果按照吃住對(duì)方一個(gè)子算兩目的方法來(lái)算，那2個(gè)子只相當(dāng)于4目。AlphaGo贏了柯潔1/4子，就相當(dāng)于半目棋子而已。

所以“讓對(duì)方兩個(gè)子”和“贏對(duì)方2個(gè)子”不可同年而語(yǔ)。如果真的有圍棋之神存在（既他一定能找到最優(yōu)解，我們?nèi)耸菦](méi)有希望下過(guò)他的），一般頂尖專(zhuān)業(yè)棋手認(rèn)為他們跟這個(gè)神的差距在讓2-3子之間。由于AlphaGo可以被證明不能保證找到最優(yōu)解，所以他離神還有一定的距離。因此，說(shuō)AlphaGo可以讓人類(lèi)頂尖棋手4個(gè)子，這簡(jiǎn)直就是天方夜談。

誤區(qū)二：AlphaGo也會(huì)下出一些明顯不好的招數(shù)，是因?yàn)樗晕遗袛嘈问秸純?yōu)，而放松了自身的要求。

AlphaGo的搜索策略就是優(yōu)先對(duì)獲勝概率比較大的分支進(jìn)行更多的深度搜索，這個(gè)策略在任何時(shí)候都不會(huì)改變，也不能改變。他不會(huì)覺(jué)得自己優(yōu)勢(shì)了就下出緩手。下得不好的時(shí)候是因?yàn)槠鋬r(jià)值判斷本來(lái)就是一個(gè)近似，而且搜索空間也不能窮盡，得不到最優(yōu)解，因此，有時(shí)估計(jì)還不錯(cuò)的棋，其實(shí)不一定是真的最好的下法，AlphaGo出現(xiàn)這種不穩(wěn)定狀況是正常的。這也是人類(lèi)善存的希望所在。當(dāng)然人類(lèi)也有自身的弱點(diǎn)，如疲勞、情緒波動(dòng)等，人也會(huì)判斷失誤。而且棋局很長(zhǎng)，有些之前不太好的棋，經(jīng)過(guò)后面的變化（包括不是預(yù)料中的變化）有可能會(huì)變成好棋。所以，不是所有的錯(cuò)誤，都會(huì)直接影響到比賽的結(jié)果。而且現(xiàn)在大家似乎有點(diǎn)怕AlphaGo了，即便是AlphaGo下出一招不好的棋，大家更多的是懷疑自己的水平（是不是我們沒(méi)看懂??？），而選擇相信AlphaGo的“深謀遠(yuǎn)慮“。

誤區(qū)三：AlphaGo可以不斷自學(xué)習(xí)，從新的棋局里獲取經(jīng)驗(yàn)，快速提升自己。

AlphaGo的系統(tǒng)由于參數(shù)非常多，需要大量的數(shù)據(jù)來(lái)訓(xùn)練，新增的幾幅棋譜對(duì)提高它的棋力起不到任何作用。而且AlphaGo在做參數(shù)調(diào)整時(shí)是針對(duì)一大批數(shù)據(jù)的整體優(yōu)化，也必須對(duì)很多棋譜做批量處理，訓(xùn)練時(shí)間非常長(zhǎng)，不可能在很短時(shí)間內(nèi)大幅提升自身的水平。即便是同一組訓(xùn)練棋譜，參數(shù)調(diào)整方法不一樣也會(huì)訓(xùn)練出棋力水平差異較大的系統(tǒng)。其實(shí)AlphaGo是通過(guò)自我對(duì)弈來(lái)生成很多棋譜，然后利用棋譜中的（兩個(gè)連續(xù)的）盤(pán)面跟最后的勝負(fù)對(duì)應(yīng)關(guān)系訓(xùn)練出價(jià)值網(wǎng)絡(luò)來(lái)。這里只是借用了一下強(qiáng)化學(xué)習(xí)的框架來(lái)訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的參數(shù)而已，主要貢獻(xiàn)還是深度學(xué)習(xí)的近似能力帶來(lái)的（解決了傳統(tǒng)強(qiáng)化學(xué)習(xí)針對(duì)復(fù)雜環(huán)境和動(dòng)作狀態(tài)無(wú)法求解的難題）。因此，AlphaGo并沒(méi)有大家想象的那種自我博弈就能自己不斷進(jìn)步的能力。

誤區(qū)四：AlphaGo會(huì)故意放水輸?shù)粢痪直荣悺?/p>

這個(gè)沒(méi)有可能。要想輸還不能輸?shù)哪敲措y看和明顯，是一件非常難辦的事情，可能比贏棋還要難。在模型訓(xùn)練好之后，AlphaGo能夠臨時(shí)改動(dòng)的只有在搜索部分投入的資源多少（搜索多大的空間）可以改動(dòng)?？s減的太小，幾乎不會(huì)有太大變化，但如果縮減太多，就會(huì)下出一些非常低級(jí)的棋來(lái)。這點(diǎn)從技術(shù)角度來(lái)講很難把握。

誤區(qū)五：計(jì)算機(jī)的計(jì)算能力一定比人強(qiáng)，所以不要去跟AlphaGo比計(jì)算，應(yīng)該把局面簡(jiǎn)單化，避免復(fù)雜的戰(zhàn)斗。

AlphaGo依靠的是一種基于樹(shù)的搜索算法，遇到復(fù)雜局面搜索空間變大，對(duì)未來(lái)輸贏的價(jià)值判斷也會(huì)變難。因此，人算不過(guò)來(lái)的復(fù)雜局面，對(duì)AlphaGo來(lái)說(shuō)也很困難。如果局面太簡(jiǎn)單，機(jī)器可以非常好的計(jì)算出比較優(yōu)的解，人類(lèi)棋手更加沒(méi)有希望。因此，把局面弄復(fù)雜，人類(lèi)棋手才有希望獲勝，雖然這個(gè)對(duì)人類(lèi)也提出了更大的挑戰(zhàn)。

2/3 首頁(yè) 上一頁(yè) 1 2 3 下一頁(yè) 尾頁(yè)

人機(jī)大戰(zhàn)5個(gè)誤區(qū):人類(lèi)沒(méi)那么差阿爾法狗不會(huì)防水