听起來圍棋跟人工智能八竿子打不著。
為什麼圍棋方面的一次人機大戰會帶火人工智能呢?
這可能跟圍棋的機制有關系。
圍棋雖然一向被認為是目前世界最復雜的棋盤游戲之一。
但圍棋基本規則很簡單。
圍棋盤是方形的,由縱橫各19條線組成。
19╳19形成了361個交叉點(以下簡稱為點),棋子就下在這些點上,在邊、角、中月復任何一點都可以下。
下棋時棋子要下在棋盤的交叉點上,棋子下到棋盤上之後就不能再移動位置了。
黑先下子,黑子下一個,白子下一個,一直到最後,看哪一方佔的地盤多哪一方為勝。
當然了,具體如何衡量佔的地盤多寡,不同國家規則並不完全相同。
盡管圍棋的規則很簡單,但是這並不妨礙圍棋棋局千變萬化。
據稱一局圍棋中可能出現的變化比宇宙中全部的原子數目還要多。
在這種情況下計算機想通過窮舉得出一局游戲中所有可能出現的變化是不太現實的。
程序想取得更高的效率只能在算法上做文章。
然而即便是利用算法,涉及到圍棋方面︰
電腦要在圍棋中取勝比在國際象棋等游戲中取勝要困難得多。
因為圍棋的下棋點極多,分支因子遠多于其他游戲。
而且每次落子對情勢的好壞飄忽不定。
在這種情況下傳統的算法很難奏效。
別說傳統的算法了,就是一般的人工智能方法都很難奏效。
諸如暴力搜索法、Alpha-beta剪枝、啟發式搜索的傳統人工智能方法這些在圍棋中都效用不大。
正因為在技術層面困難重重。
前世雖然在97年的時候,在國際象棋層面人工智能就擊敗了人類頂尖棋手。
但在圍棋方面,人工智能卻一直折戟沉沙。
直到在擊敗國際象棋方面的頂尖高手18年之後。
人工智能才在圍棋方面第一次擊敗了來自宇宙國的圍棋九段高手。
這件事在前世也被解讀為「在任何一個單項領域,機器都有可能遠遠的領先人類。」
雖然這種說法的正確與否還無從評判。
但不可否認「人工智能」這個概念就是在李世石和阿法狗AlphaGo的那次人機大戰之後才突然火了起來。
這次對戰影響不僅僅局限在研究人工智能的那個小圈子里。
而是引起了整個社會對人工智能極大的討論。
反正林灰記得前世16年3月那段時間里,新聞、微博充滿了AlphaGo和人工智能。
有討論技術的,也有展望未來的,也有看到商機準備下場的……
當然,這喧鬧的一切背後不排除有運作的可能。
畢竟據林灰所知,圍棋其實主要流通于東亞這一帶,並不是世界範圍內高度流通。
而即便是在中國、島國、宇宙國這樣的圍棋流通還算可以的地方。
普通人里面圍棋愛好者的比例也不算太高。
即便有的稍微懂點規則,涉及到諸如劫爭之類稍微麻煩點的也說不太清楚了。
林灰姥爺是圍棋迷,之前還定過段。
林灰在其燻陶下對圍棋也算很了解,大概業五這樣的水平吧。
即便如此林灰從來不自詡擅長圍棋。
畢竟業五面對真正的職業九段普遍要被讓2~6子。
這種情況下「人工智能」的概念卻能夠借助「圍棋」火了起來。
很難說這背後沒有人在推波助瀾。
不過這些來龍去脈就不是林灰關心的了。
既然前世這次圍棋方面的這次人機大戰能成為人工智能的爆點。
那麼這個時空林灰也完全可以將阿法狗AlphaGo類似的程序搞出來然後想辦法促成人機對戰。
之後再適當加以運作使這次事件成為人工智能的爆點。
涉及到阿法狗AlphaGo。
前世阿法狗AlphaGo是deepmind這家嚶國公司推出的。
雖然這個時空也存在deepmind這家公司。
但林灰也不用擔心撞車什麼的。
前世阿法狗AlphaGo的誕生雖然跟deepmind這家公司有著千絲萬縷的聯系。
但涉及到阿法狗AlphaGo這個項目其實是deepmind這家公司被谷/歌收購之後他們才開始搞的。
總之前世阿法狗AlphaGo之所以能夠誕生跟deepmind和谷/歌之間的py交易有著很大的關系。
可是現在這個時空里谷/歌和deepmind並沒有進行該項目的合作。
而且大概率在將來也不會有合作的機會了。
林灰先前就了解過。
這個時空名為deepmind的公司確實存在。
但因為這個時空在人工智能上研究的整體性滯後。
deepmind這家公司雖然也從事人工智能方面的研究。
但進展什麼的寥寥無幾。
而且deepmind這家公司並不是很好過。
前不久該公司還試圖申請破產保護。
這樣的公司想獲得前世的成就基本不大可能。
在這個時空人工智能方面的研究整體滯後的情況下。
林灰要搬運阿法狗AlphaGo的話基本不用擔心有什麼技術撞車風險的。
雖然沒什麼風險,但涉及到阿法狗AlphaGo的搬運卻稍稍有點麻煩。
倒不是技術理論方面有什麼麻煩。
雖然這個時空的人們還沒搞定相應的技術。
但對林灰來說技術理論道路什麼的卻很清晰。
像阿法狗AlphaGo這樣的經典人工智能應用。
基本上十個搞人工智能的九個都專門鑽研過阿法狗AlphaGo是怎麼一回事。
涉及到阿法狗AlphaGo的技術︰
無非就是蒙特卡洛樹搜索與兩個深度神經網絡相結合的一個簡單應用。
蒙特卡洛樹搜索是一種用于某些決策過程的啟發式搜索算法,最引人注目的是在游戲中的使用。
在棋類游戲中尤為常見。
具體的兩個深度神經網絡,其中一個是估值網絡,另一個則是走棋網絡。
前者是用來評估比較合適的落點的,走棋網絡是用來調整最佳落子位置的。
為什麼要采用這種設計呢?
很大程度上是受人類下棋的啟發。
人類下棋的時候,首先棋手會通過過去的經驗、棋譜先大致判斷出下哪里不吃虧。
縮小搜索範圍之後,棋手會對某一局部位置進行詳細的推演。
至于推演時候,棋手主要思考的是自己如何落子、落子之後對手又會如何反應。
一般來說,優秀的棋手都應該具備這種的推演能力。
走一步看十幾步甚至幾十步,才能成為圍棋高手。
至于推演的目的則是是為了找出對自己最有利的落點。
總結一下,優秀棋手要具有一下能力︰
首先通過局勢判斷大概可行走法;
然後判斷局勢是否對自己有利;
再之後推演局勢找出最佳落點。
人工智能雖然看起來是機器方面的學問。
但實際上是科研人員在試圖讓機器像人那樣去思維。
阿法狗AlphaGo在運行的邏輯本質上很接近人類棋手的思考方式。
總之,涉及到阿法狗AlphaGo的技術實現什麼的其實不是很復雜。
涉及到技術方面的內容很清晰。
但具體施為起來依舊很麻煩。
首先就是涉及到很多技術底層的東西。
這個時空因為在人工智能方面的東西短腿。
很多理論性的東西還需要從無到有的建設。
換言之,林灰要想重新引爆人工智能這個爆點。
大概率要異時空搬磚,各種搬運人工智能方面的理論知識。
至于具體的搬運還要搞清楚技術路線。
雖然這個工作稍稍有點麻煩,但好在林灰現在多少也是有一個學術工具人的。
技術層面除了人工智能這方面的東西。
還需要一些其它技術層面的東西。
前世,在初代阿法狗AlphaGo里面,谷/歌除了應用了人工智能方面的成果之外。
還應用了一些分布式系統方面的研究成果。
在計算機科學中,分布式計算,又譯為分散式運算。
分布式系統是一組電腦,透過網絡相互連接傳遞消息與通信後並協調它們的行為而形成的系統。
雖然像阿法狗AlphaGo這類程序不依靠分布式計算也有著不錯的效能。
但分布式計算相比于傳統的效率往往更高。
涉及到分布式神馬的有點難辦。
林灰前世並沒有搞過類似的東西。
不過林灰前不久看到谷/歌方面和普林斯頓大學數學系在合作摘要式算法的學報中似乎提到過跟分布式有關的東西。
誠然如此的話,倒不是沒機會將涉及到分布式技術的一些東西忽悠過來。
除此之外,阿法狗AlphaGo還涉及到比較麻煩的訓練。
如果只是為了不麻煩的話。
林灰沒必要非盯著阿法狗AlphaGo不放。
前世又不是只有阿法狗AlphaGo。
阿法狗AlphaGo之後有master,master之後有Alpha_Zero。
如果說阿法狗AlphaGo還曾負于人類。
Alpha_Zero則完全是秒天秒地秒空氣了。
林灰記得前世看到過的一組數據。
Alpha_Zero算法只需要8個小時訓練後擊敗對戰李世石版本的「阿法狗AlphaGo」。
按照這個說法,意味著Alpha_Zero的訓練成本要遠遠低于阿法狗AlphaGo。
與前輩阿法狗AlphaGo相比,Alpha_Zero有很多自己的獨到之處。
盡管這個技術很強大,但Alpha_Zero和阿法狗實際上是有技術代差的。
想要搞出Alpha_Zero從邏輯層面來說還是要先搞出阿法狗AlphaGo。
這種情況下,林灰覺得技術神馬還是尊重客觀發展的規律比較好。
真要一步到位的話未必是好事。
能想到阿法狗AlphaGo這個人工智能的爆點已經很不錯了。
話說回來林灰早該想到阿法狗的。
林灰記得之前剛注冊微博時在微博上蛋疼兮兮地發的那兩句話︰
——「絕藝如君天下少,閑人似我世間無」
就跟鵝廠的圍棋AI有著很緊密的關系。
早點想到這點林灰應該很快就能想到阿法狗。
盡管已經想到了這些。
但涉及到阿法狗AlphaGo的實際復現依舊困難多多。
最大的困難似乎是硬件層面的。
阿法狗AlphaGo還有alphaZero這兩個技術想問世的話還需要深度學習框架以及硬件方面的支持。
無論是阿法狗AlphaGo還是alphazZro都涉及到前世谷/歌提出來的TensorFlow這個深度學習框架。
前世為了這個深度學習框架,谷/歌2016年還開發了張量處理器。
張量處理器(TPU)是谷/歌為機器學習定制的專用芯片。
就特麼超級離譜,國內芯片一言難盡。
國外這是人是鬼都在秀。
跟芯片看起來似乎半毛錢關系都沒有的也在搞芯片。
說起來初代的TPU規格大致參數林灰是記得一些的。
雖然不是記得特別全。
但林灰還是依稀記得初代TPU是28nm制程。
雖然以林灰的眼光看28nm制程有點糙。
但要知道此時iPhone5s上的芯片制程也不過才28nm。
這就很糟心。
也就是說即便林灰能搞TPU,大概率成本也會居高不下。
雖然林灰可以直接利用前世帶來的電腦跑模型。
但個人電腦終究會局限一些AI程序發揮效能。
即便在個人電腦上能發揮AI的全部效能林灰也不可能抱著來自往後七年的技術堂而皇之地區面對世人。
哎,難難難。
盡管有這樣那樣的麻煩。
但提出問題比解決問題更重要。
只要思想不滑坡,辦法總比問題多。
相比于這個時代中的人們還在黑暗中模索著前行。
林灰好歹知道如何解決問題以及解決問題面對的困難。
就這一點妥妥地優勢在我!
涉及到這種使用時代最先進技術制程。
似乎不可避免的要涉及到和歪果合作啊。
某積電似乎也看歪果仁臉色。
歪果憑啥拿這種技術資「敵」呢?
說起來搞個歪果的代言公司似乎不錯。
畢竟歪果仁蛇鼠一窩。
面對同樣的歪果公司芯片制作方似乎不會太大戒心。
歪果公司?
林灰突然想到了deepmind。
deepmind這個時空既然混得這麼慘。
把這個公司收購來似乎不錯啊。
想來一家即將申請破產保護的公司應該不是很貴吧?
林灰越想越覺得合理。
之所以有這樣的想法除了涉外合作之外。
還有另一層面的考慮。
某種程度上講林灰需要一個代言人。
涉及到新技術的問世往往面對巨大的爭議。
就拿前世阿法狗AlphaGo對圍棋方面的革新來說吧。
前世不學圍棋的人很難理解,相比于其他棋類運動,為什麼圍棋會受到人工智能這麼大的沖擊。
因為圍棋復雜的變化導致每位棋手在下棋時會有十分明顯的棋風。
不同的風格會導致棋手在不同的階段、局面和棋形采取不同的策略。
相比于其他棋類,圍棋在這一點上體現得更為明顯。
所謂「對弈」,不僅是兩位棋手腦力的角逐,更是棋手個人風格的交鋒。
但是人工智能的出現導致最復雜、最多變、最能體現「對弈」樂趣的圍棋也出現的所謂「最優解」。