庫克教授的主要研究方向“計算複雜性理論”,這種專業術語大多數人肯定聽不懂,
用兩句人話翻譯一下,大致就是這樣的:
首先,用一臺電腦來假設人腦面對問題時的處理模型。比如,當一個人走進一個滿是人羣的禮堂時,想知道“禮堂裡有沒有我認識的人”這個問題的答案,那麼他就得一步步搜尋,從頭到尾一個個認,如果全部人看完都沒有一個認識的人,才能得出“禮堂裡沒有我認識的人”。而只要找到一個認識的人,就能下“這裡有我認識的人”的判斷。
所以,常識一般認爲,“從科學嚴謹的角度而言,證明一件事情比證僞一件事情要耗費更多的判斷/計算資源,因爲證僞只需要找到一個反例就可以結束論證、不再繼續往下耗費計算資源。而證明需要推翻所有反例”。
可是實際情況下,人腦在“不刻意追求絕對科學嚴謹”的前提下,做很多大致粗略的判斷時,要比電腦快得多。
比如讓人看一張照片,判斷照片上的東西是不是“貓”,人一眼就判斷出了,而不需要去驗證“圖片上這個疑似貓的生物是否有xxxxx等生物學上的特徵”。
換句話說,人類懂得如何抓大放小、用“模糊算法”儘快得到一個勉強可用、但不太嚴謹的結論。
而1980年代以前,人類根本就不知道如何讓計算機“不嚴謹”。
所以計算機在求解一切問題時都是用嚴謹到爆的暴力算法硬扛的,導致很多因爲分支可能性多到天量級別而無法窮盡的問題,計算機就沒法解決。
比如圍棋。因爲哪怕以2010年代的計算機硬件運算速度,如果要暴力算法“科學嚴謹”地窮究一切可能性,全世界的計算機加起來分佈式運算都算不動。所以在那種思想指導下,人類只能滿足於“用暴力算法攻克國際象棋之類窮盡運算量也不大的腦力運動”。而平行時空的“阿爾法狗”幹掉那麼多高手,就絕對不能靠近乎低能兒蠻幹的暴力算法。
斯蒂芬.庫克的畢生研究,就是在解決“如何讓計算機在資源不允許其徹底嚴謹的前提下、學會像人腦一樣抓大放小、用有限的計算資源得到一個相對準確的大概結果”。
顧誠覺得,或許多倫多大學計算機系裡,在庫克麾下,藏着更多從不同角度試探這一領域的人才。而傑夫辛頓有可能只是因爲歷史的選擇而恰好最早在人工智能領域出頭引起了重視。
但這絕不代表這一體系內,其他分支的人才就沒有價值了。
如果可以折服史蒂芬.庫克教授,對於顧誠的全盤、系統挖人大計,顯然是很有幫助的。
……
下午3點,密西沙加校區,神經網絡實驗室。
顧誠見到了早已收拾妥當、一臉侷促的傑夫.辛頓教授。
還有成名天下垂20載、剛剛從聖喬治主校區風塵僕僕趕來的史蒂芬.庫克教授。
一番簡單的客套之後,顧誠說出了此行的主要來意,首先向傑夫辛頓發出了延攬的邀約,而且出價不菲。
“辛頓教授,我可以爲你成立一個基於‘深度學習算法’的研究所,你個人可以得到200萬美元的年薪,以及每年1000萬美元的研究經費,合同期至少5年。你的助手和帶的研究生,我也可以給予最優厚的條件。唯一的問題是,你可能會終生失去在學術界的地位。你的論文只有很少一部分有發表的潛力,而且還得籤保密協議。你自己看着辦吧。”
傑夫.辛頓有些尷尬,畢竟資格比他老20年的學界泰斗史蒂芬.庫克就坐在旁邊。顧誠這樣直截了當地談錢,實在有辱斯文。
“到企業去做事,我們從來是不反對的,學術應該跟產業界結合。不過,就不知道一個明明只是做社交裹挾和遊戲攀比的公司,能有什麼課題讓人拿出可以上ieee系列期刊的成果呢。”
庫克教授直接就點出了顧誠的短板。
別的產業界大牛,無論微軟還是谷歌,好歹有一水兒的頂級大學研究所支撐。顧誠雖然也是搞互聯網的,但他的技術含量是最低的那一型。
就像後世bat三巨頭當中,騰雲是技術含量最低的一個。
“你提到了神經網絡算法這個擬研究方向,但我看不出來這和你的產業有什麼結合。讓我們多倫多大學的教授去做那種看不到學術前景的花裡胡哨東西,有違本校的學風。”
庫克教授也不管自己只是個所長,直接就蓋棺定論了。
所謂“神經網絡式算法”,庫克教授十幾年前就有涉獵,相比於80年代以來的其他“np窮盡理論”而言,其最大的特點是“沒有運算核心”。
用人體來舉例,人作爲一個生物個體而言,是有中樞神經的——絕大多數機體行動,都是大腦控制肢體,眼口耳鼻手足感知到了外部信號之後先要通過反射弧傳遞到大腦(部分最低級的反射,至少也要到延髓/脊髓處理)等大腦作出處理指令之後,手足纔會作出反應。
但是如果把大腦單獨作爲一個獨立個體解剖開來看,大腦內部上千億個神經元是平等的。並不存在“某一小撮神經元高於其他周邊神經元、從而在處理信息時先由這一撮神經元預處理、預處理完之後再交給下一撮神經元處理”這樣的先後順序。
(神經網絡當然還有其他很多基礎特點,這裡僅僅討論和“遺傳算法/退火算法”的主要區別,所以不多贅述了。否則能水幾萬字,大家還看不懂。)
當年“神經網絡”的概念被提出時,就是爲了探討一種讓電腦高效處理類似於“找到禮堂裡到底有沒有我認識的人”問題的新方法:如果可以有多個電腦,自然隨機地分配任務,並行從多個點開始用就近算法尋找,那麼自然可以在“單核cpu”性能比較弱的情況下,通過堆砌cpu數量加快問題的解決速度。
但這個概念並沒有“節約計算資源”,因爲理論上它只是把“1臺電腦10小時工作量”變成了“10臺電腦1小時的工作量”而已。而且這種最原始的“神經網絡”也依然沒法解決那些“似是而非”的模糊問題——他們只能回答“有我認識的人/沒有我認識的人”這種非此即彼的問題。
庫克點名了在這個領域讓顧誠對其應用模型說出個子醜寅卯來,顧誠自然不能避戰。
“我拜讀過辛頓教授對於神經網絡的最新模型假說,卷積神經網絡,以及與之配套的學習型算法。我認爲這個東西可以和互聯網的自動識別/索引工具相結合。至於具體的應用場景麼……那就屬於商業機密了,恕我無可奉告。”
“卷積神經網絡的新用法?”
史蒂芬.庫克教授一愣,但很快冷靜下來,他可不是一個概念就能忽悠住的。
“看來,顧先生要論述的重點,就在於‘卷積’上面了?”
“沒錯,如果沒有‘卷積’,僅有‘神經網絡’,我們依然沒法討論近似於人腦判斷的模糊問題。”顧誠一副成竹在胸的樣子,似乎對對方的反應早有預判。
他打開電腦,接上投影儀,屏幕上出現了一張貓的圖片。
“我用圖上這隻貓舉例子——儘管這隻貓一隻耳朵豎着一隻耳朵折了,眼珠瞳孔也有點不正常,尾巴還特別短,毛色骯髒還和照片的背景色非常接近,但我作爲一個人類,還是一眼就認出了這確實是一隻貓。
現在,我用我根據辛頓教授的閥值思想編寫的自學程序,用機器對這隻貓是否是貓進行初次預判。在這個算法裡,我們預構了30個組合特徵量,比如‘貓眼’、‘貓耳’‘貓毛’、‘貓尾’……然後用三十個神經元單位的處理資源,分別針對每一個組合特徵量進行預判,然後分別給出結果。
在這三十個神經元單位內部,我們再根據‘本圖貓眼與本神經元見過的貓眼’之間的像素相似度作出判斷,給出一個積值,從而得到‘這有85%概率是一隻貓眼’或者‘有70%概率是一隻貓耳’之類的參考量。最後,把這30個組合特徵量按照默認1:1的權重進行組合,最終平均分高於60分就判定‘這是一隻貓’。”
“那成功率肯定很可憐。”庫克教授聳聳肩,一臉的悲憫。
“當然很可憐,因爲我的實驗纔開始呢——做到這一步,並不是要讓機器判斷正確,而是在機器判斷完之後,讓人眼再複查一遍。如果機器和人的判斷結果一致,那麼就給目前的特徵量分組方式和每個特徵量的權重比例數組加1分。
然後,再判斷下一次。如果還對,再加一分。直到判斷錯了,然後就自動對現有權重比例數組作出調整:比如,此前判斷正確的兩次‘平均分60分’的結果中,‘貓眼’得分分別是75和80分,而‘貓耳’得分是45和40分。而判斷錯誤的那一次‘平均分60分’的結果中,‘貓眼’是50分‘貓耳’是70分。那麼,我們就可以得出一個結論:決定貓是否長得像貓的所有特徵變量中,‘貓眼’是比‘貓耳’更關鍵的變量,在計算綜合分的時候應該提升其權重。
最後,按照這個邏輯讓這套算法看一百張貓圖,一千張,一萬張……算法自然會總結出一套‘即使不全對,但正確概率越來越高的判斷權重’。”
人類的小孩兒,在3歲的時候學習認各種東西,其實大腦裡就是這麼算的。沒什麼非堅持不可的特徵,看個幾百只貓,自然而然就調整各個特徵權重,知道什麼是貓了。
沒有任何一個變量,擁有“一票否決”的權力。充其量,只是其在卷積神經網絡中的“積分量”比較高而已。正是因爲如此,人類纔可以在看到一隻雙眼徹底被挖掉的貓時,依然認出這是一隻貓。
……
顧誠的整體論述,自然是非常冗長的,難以一一贅述。
其中很多關竅,說透了之後也完全通俗易懂,根本沒什麼逼格。
但是顧誠至少爲“如果做不到全對,就沒有商業價值”的卷積神經網絡,提供了一種“就算現在做得還不太好,也能在一兩年內就取得階段性商業變現可能性”的路徑。
史蒂芬.庫克教授與之交談良久,最後默然不知如何應對。
“神聖的神經網絡算法研究,居然用這種毫不嚴謹毫不科學的推論、假設、模擬來解釋。這些想法和推論根本沒法形成論文和成果體系。”庫克教授本能地抨擊了幾句,但是冷靜下來之後,一咬牙,不得不承認,“但是,很有啓發。”
對於庫克教授的指責,顧誠不以爲意:“就像中醫,不科學,但是有時候它確實可以治好病。只是要碰運氣,而且解釋不通其治好病的必然道理而已——但我只要療效,不在乎科不科學。您有興趣證明,完善學術體系,我很尊重您的想法。但我不太會爲這些證明掏錢。我這次來,只想投資一些哪怕不科學也能用上的東西。”
庫克教授無奈地搖搖頭:“真是可惜,有那麼好的腦子,卻不以投身科學爲榮。”
“沒辦法,我是產業界的人士,我在乎的是實用主義。”
顧誠不再理會那個理想主義的老學閥,只是重新提出了自己的邀請。
“庫克教授,我今天言盡於此。我希望你不會用你的學術權威,去勸阻其他人投身產業界。我也非常歡迎您給我介紹人才,介紹從各種角度‘碰運氣’的人才。”
03年的東海岸,盤根錯節的混逼格學者還是挺多的,成果和產業界的結合,普遍還停留在那些既能刷臉也能刷錢的成果。
要到傑夫辛頓這一票人普遍想通之後,東海岸學界以錢衡量成功的氛圍纔會濃重起來。任何事情,都是一步步來的。
“你們誰想去的,就去吧。我不會阻攔。至於第二個建議,我會考慮。”