由于時差的關系,林灰睡熟的時候,地球另一邊的人們還在緊張忙碌的工作中。
加利福尼亞時間比BJ時間慢16個小時,此時剛剛是21號上午8點。
斯坦福大學(位于加利福尼亞)校園內研究室還有一個自然語言處理算法團隊正在忙碌著。
看到這個研究室內忙碌的一眾研究人員,不少斯坦福大學經過的計算機專業相關的學生都會不自覺地將腳步放輕。
將腳步放輕的同時,這些人還會對研究室內的人員產生一絲羨慕。
因為他們知道雖然這些研究人員是在斯坦福大學的研究室內做著研究。
但實際上研究室中大部分成員都不屬于斯坦福大學,而是屬于大名鼎鼎的谷/歌研究院。
而谷/歌研究院可以說是所有斯坦福致力于就業的計算機專業相關的學生夢寐以求的工作場所了。
盡管這個地方的工資只能說是中等偏上吧,但關鍵是酷啊。
多少改變世界的技術都是從谷/歌研究院誕生的,
而哪個學子不曾幻想過改變世界呢?
總之這些路過學子眼中流露出的神采多數都是羨慕,以及一絲絲嫉妒。
埃克萊爾•基爾卡加博士就是研究室中的一員,他可不覺得他現在的生活哪里值得羨慕。
拿著$325000的年薪,卻要過著螻蟻一般的生活。
雖然現在才是早上八點,但事實上他和他的伙伴們已經忙碌了幾乎一整晚了。
埃克萊爾•基爾卡加討厭這種忙碌!
但是卻又不得不忙碌!
如果他們這個文本處理算法開發團隊不及時跟進最新的生成式文本摘要相關技術。
那麼他們極有可能步麻省理工學院自然語言處理文本摘要小組的後塵︰
——走向分崩離析。
雖然他們作為谷/歌研究院的一部分不大可能被直接遣散。
但很有可能被派遣到阿三那邊的研究院。
听說那邊的谷/歌研究院才剛剛成立,現在很缺人手。
埃克萊爾•基爾卡加可不想去那個骯髒混亂的土地。
一想到可能到來的悲慘結局,埃克萊爾•基爾卡加討厭那個叫LIN HUI的家伙。
這麼一個算法鬼才,搞什麼算法不都會有所成就?
干嘛非要搞什麼生成式文本摘要算法來搶他們的飯碗?
埃克萊爾•基爾卡加正發著牢騷呢,突然听到了同組人員哈雷•普萊斯的呼喊︰
「嘿,埃克萊爾•基爾卡加別發呆了,你那邊測試結果怎麼樣?」
埃克萊爾•基爾卡加︰「別提了,簡直糟糕透頂,我們所采用的X1算法在各方面的參數上都比不上林在南風APP里所采用的算法……」
所謂的X1算法是埃克萊爾•基爾卡加他們團隊受LIN HUI申請的專利中公開的技術路線啟發,開發的一個生成式摘要實驗算法。
之所以稱為實驗算法,是因為該算法主要用于測試。
作為一個測試算法,X1算法是合格的。
埃克萊爾•基爾卡加他們搞得這個算法已經有點生成式摘要算法那味了。
然而這個算法現在也僅僅只能作為測試算法了。
離真正的距離實際應用卻還差一步,然而盡管看起來只是一步。
這一步之遙,卻可謂是天差地別。
客觀地說,X1算法無論是文本摘要抽取速度還是準確度和LIN HUI南風APP里面的算法都差得遠。
提到準確度,埃克萊爾•基爾卡加就郁悶。
連衡量準確度的標準都是LIN HUI提供的,拿什麼去跟人家競爭?
還沒開始就已經結束了。
而且最令人郁悶的是他們搞得這個X1算法別說是跟LIN HUI搞得算法比了。
就是和他們之前鼓搗的算法相比,在抽取速度和準確度方面也是各種被吊打。
這種情況不免讓埃克萊爾•基爾卡加有些悲觀。
哈雷•普萊斯︰「說說具體數值上的差距。」
埃克萊爾•基爾卡加︰「我感覺你不會想知道的,具體差距令人絕望。
結果打印出來了,你拿去自己看吧……」
哈雷•普萊斯接過埃克萊爾•基爾卡加遞過來的報告,翻看了不一會便皺起了眉︰
「在識別準確度上有差別我能理解,畢竟LIN HUI搞得那套算法肯定是經過很長時間訓練才得到的結果。
可是為什麼我們搞得這個X1算法在識別速度上比南風APP里的算法要慢很多呢?
正常來說兩個理論相同的算法在處理同一問題時候,算法時間復雜度不都應該是一樣的嗎?」
埃克萊爾•基爾卡加︰「誰知道呢?可能我們采用的機制有問題……」
哈雷•普萊斯︰「怎麼可能,LIN HUI闡述的技術路線不就是以序列到序列(So-Snce)深度神經網絡模型為基礎麼?如果他的技術路線有問題的話我們完全可以去控告他的專利無效?」
埃克萊爾•基爾卡加︰「別天真了!他只是說模型是以So-Snce模型為基礎,又沒說他在算法里現在還應用這個模型的早期版本。」
哈雷•普萊斯︰「這些該死的異鄉人,真是卑鄙……」
埃克萊爾•基爾卡加︰「別抱怨了,換作我們遇到同樣的問題,使用的手段可能會更加過分。而且現在的重點是提升算法處理的準確度,至于速度什麼其實不重要……大不了到時候我們可以將這個算法放在分布式系統上運行。」
在計算機科學中,分布式計算,又譯為分散式運算。
分布式系統是一組電腦,透過網絡相互連接傳遞消息與通信後並協調它們的行為而形成的系統。
哈雷•普萊斯知道,谷/歌近些年因為谷/歌大腦計劃在分布式計算上進步很大。
要是將這個算法放在分布式系統上確實可以在執行速度上有所突破。
得知此消息,但哈雷•普萊斯絲毫高興不起來。
一旦真的選擇了將算法放在分布式系統上運行,那就等于他們直接落敗了。
要知道南風APP里的算法可是離線運行的,甚至連服務器都沒有。
直接上分布式算法,跟殺雞用h彈有啥區別。
而且速度上同LIN HUI算法的差距還算在哈雷•普萊斯理解範疇之內。
準確度上同LIN HUI算法的差距才是真真正正地大到讓人絕望……
在哈雷•普萊斯他們搞得X1算法準確度上甚至都比不上連尼克那個蠢豬弄得雅虎新聞摘要里采用的算法的摘要準確度。
這讓哈雷•普萊斯很是郁悶。
……
過了一會,哈雷•普萊斯突然靈光一現,對埃克萊爾•基爾卡加喊道︰
「親愛的伙計,你說問題會不會是出在LIN HUI搞得那個準確度衡量標準上。
應用那個準確度衡量標準的話,只有LIN HUI自己的算法用那個衡量標準才會獲得高分……」
埃克萊爾•基爾卡加︰……
埃克萊爾•基爾卡加︰「或許你的想法有你的依據,但是我現在更建議你去睡覺……你可能有點恍惚了,究竟是什麼原因讓你覺得一個標準委員會審核過的標準會是一個不公平的標準呢?」
哈雷•普萊斯︰「因為那個LIN HUI是c國人,他們什麼手段都會干,我記得他們國家有的手機廠商為了宣稱自己的手機強大還會專門開發一個測試軟件,使用那個測試軟件只有他們自己的廠商搞得手機才能獲得高分。
照我看來,那個LIN HUI搞得那個衡量標準度的模型就是類似于這樣一款測試軟件……」
------題外話------
分布式計算,這個涉及到一個比較好玩的東西,可以用後世知識坑人,把谷歌研究成果拐跑