但接觸的時間久了之後,給伊芙•卡莉留下更深刻的印象反而是林灰淵博的學識和靈動的思維。
具體伊芙•卡莉也不知道該怎麼回答這一問題。
對于這類的問題伊芙•卡莉干脆統一回復為︰
——LIN HUI是個理性且令人著迷的人。
事實如此,林灰極其理性的邏輯、沉靜的氣質、對待事物專注的態度這些都讓伊芙•卡莉著迷。
甚至于伊芙•卡莉心底深處似乎還生出了幾分沉寂已久的別樣情愫。
一個能夠舉手投足間悄無聲息影響世界又怎麼能不讓人著迷呢?
甚至不只是影響世界,實際上林灰的一些舉動已經產生很多深遠的影響了。
或許林灰自己還沒意識到他在改變世界。
但事實是林灰已經在改變世界了。
伊芙•卡莉對此卻是再清楚不過了。
首先,林灰在文本摘要方面的貢獻太大了。
而文本摘要本就是可以影響世界的。
這並不是夸張的說法。
涉及到文本摘要方面的研究其實有很長的歷史了。
東方對于文本摘要的研究是什麼狀況此前伊芙•卡莉不是很清楚。
但來到中國之後,伊芙•卡莉通過一些麻省理工學院同中國友好合作的機構才了解到。
廣泛意義上的文本摘要這方面中國雖然似乎沒啥項目。
但涉及到純粹的中文文本處理這個古老的東方國度不但有專門的項目。
甚至于有的還被863計劃這樣的國家級計劃所涵蓋。
863計劃,顧名思義自然是在86年3月開始執行的。
當時第一次听說不少涉及到文本摘要的項目甚至于早在上世紀末期就開始了。
伊芙•卡莉是震撼的。
甚至細思之下,伊芙•卡莉覺得比較恐怖。
都已經是2014年了,居然還有一個近乎于三十年前開始的計劃在按部就班地向前推進。
做計劃不難,難的是計劃的執行力度。
就這份三十年前確定的計劃的執行力度可以說世界範圍內也是沒誰了。
總之伊芙•卡莉覺得這在頻繁兩擋交替的美國幾乎是難以想象的事情。
不過僅僅是文本摘要這方面。
伊芙•卡莉還不至于太悲觀。
畢竟西方在文本摘要這方面一樣是傾注了大量心血。
甚至于要遠比華國在這方面開始的研究還早。
伊芙•卡莉記得此前還在學生時代的時候就听聞西方關于文本摘要這方面的研究在冷/戰初期就已經開始了。
最早進行這方面工作的是諸如斯坦福大學、麻省理工學院之類的這些學校。
不過當時這些學校背後的雇主是美國的五/角/大樓。
听起來很奇怪,但並不奇怪。
事實如此,現在人類互聯網以及計算機方面各種各樣的技術最初都和軍方有著千絲萬縷的聯系。
甚至于不少技術幾乎就是純粹的軍轉民。
涉及到文本摘要這個方向。
之所以當初當時進行文本摘要這方面的研究是旨在通過在文本摘要上實現技術突破從而能夠更加高效地通過一些諸如新聞、報道各種公開的資料進行信息處理,同時進行文本摘要方面的研究也是為了能更好的實現對敵對勢力的輿情分析。
至于是什麼敵對勢力,自然是昔年無比強大的北極熊。
說起來這也是早期文本摘要編碼的一個奇葩特征。
對中文這門使用人數相當多的語言基本沒啥處理能力。
對俄文處理卻幾乎擁有和英文同等水平的高效性。
不管最初的目的是什麼。
總之,在相當長的一段時間里涉及到文本摘要這方面的研究都相當受重視。
甚至在相當長的一段歷史時期該領域的部分研究經費甚至直接是來自M國軍費中的撥款。
後來隨著間諜衛星等更高效獲取情報的手段相繼問世,M軍方對這方面的研究的熱情才逐漸被淡漠。
盡管如此,商業上對文本摘要的熱情卻幾乎自始至終毫無動搖。
文本作為信息的重要載體,再怎麼重視也不為過。
新世紀互聯網的告訴發展,大量信息的涌現。
人們更是不得不重視。
對信息的研究越深入,我們就越能了解到這個世界。
文本摘要的深度探索,讓我們對信息的掌控更強。
就林灰在文本摘要上所作的貢獻而言。
說林灰改變了世界也不為過。
反正伊芙•卡莉不覺得這種說法有什麼不對的地方。
涉及到具體領域,林灰所作的貢獻在自然語言處理所做的貢獻實在是同樣很大。
相對于傳統的抽取式文本摘要,生成式文本摘要的意義空前。
之所以說生成式文本摘要的意義空前,並不僅僅是因為這項技術在處理文本摘要上效率上更高。
當然生成式文本摘要能夠擁有更高的處理文本的效率。
這個對于記者之類的相關使用人員來說效率的提高確實是很具有意義。
但這不是科研人員所關心的。
一個轉動的更快的輪子相比于一個同樣能轉但轉的較慢的輪子相比有價值。
但深究之下會發現其實價值也不大。
事實上伊芙•卡莉覺得生成式文本摘要最不起眼的內容就是其在效率方面的提升。
甚至可以說效率只是生成式文本摘要這項算法的外在表現而不是這一算法的真正內核。
通常意義上所說的自然語言處理(NLP)主要內容無非就是兩部分。
一部分是NLU,另一部分是NLG。
前者指的是自然語言理解,後者指的是自然語言生成。
林灰搞定的生成式文本摘要算法在自然語言理解和自然語言生成此二者上都有極為突出的意義。
生成式文本摘要這項全新的文本摘要算法。
其相比于傳統的抽取式摘要只能借助于原有的文本內容抽取而言,能直接「無中生有」的進行摘要生成。
這樣的一種算法在自然語言理解方面自然是做到了前所未有的高度。
而且這也啟發著在自然語言生成方面有可能實現新的突破。