一年一度的中國綠公司年會在鄭州召開,馬云、馬蔚華等知名企業家在大會上做了演講,依圖科技創始人朱瓏與人工智能學界很資深的一個人士,美國計算機協會2015年的杰出科學家、IEEE Fellow院士、阿里巴巴集團人工智能研究機構的資深總監華先勝,圍繞人工智能做了深度分享。以下是兩人的現場分享內容。
朱瓏對話華先勝:
今天的人工智能比肩工業革命毫不夸張
Q&A
商業被技術解鎖是加速度的,今天人工智能比肩或者超越工業革命
過去10年、30年所熱門的東西,到今天不僅是概念,從工業級的實驗數據上看到非常深遠的未來。我們今天說人工智能熱起來,是從結果來說的,所有領域的結果讓大家感覺到信心。
人工智能應用的場景是不斷被商業解鎖的,技術在商業化落地的過程,商業跟技術結合越來越加速。實際的應用場景有時候是超越你想象的,今天的智能,我們的想象已經跟不上人工智能發展的速度了,千萬不要擔心技術跟不上我們的想像力。
技術發展的差距關鍵在人,人的技術遠見很大程度影響了人工智能的發展速度
資源、數據、錢,會影響整個行業的發展,即便都具備了,你說大的公司敢投1億美金嗎?找不到那個人的時候,有錢也不敢投。
擁有技術的遠見,能夠知道數據在哪里,數據的商業價值在哪里,技術預測。行業真正一流的高手之間差距就是非常大的,最牛的人之間反而有可能是差距越來越大。同一件事情到你手里,信的人和不信的人,發展速度差別是巨大的。
最好的人只有最好的人才能判斷,你只能選擇信我或不信我。
越垂直、越分散的領域,創業公司有很大的機會。
AI本身不是一款產品,科學家沒有特別天生的優勢。技術對商業場景的理解,非常重要,需要高手。作為翻譯者或溝通者,這是比AI人才更稀缺的。
依圖在公安領域、醫療領域的部署,首先做好對人的理解,對部門之間的理解,其次是對產品和技術的理解。保持謙卑的學習心態,比公安的人更懂公安,比醫生更懂醫生。
即便是有人際關系壁壘、數據和專業知識壁壘的垂直領域,人工智能產品本身依然是最能打動人的,越垂直、越分散的領域,大公司不見得有機會,創業公司有很大的機會。
人工智能的社會影響,不止是安全問題,經濟形態的巨變更值得思考
技術帶來的社會影響其實是一個長久的話題,今天人工智能可能因為超越人的智能邊界的時候,會更加敏感。
技術都有兩面性,一定會出現有利的地方和不利的地方。目前AI技術并沒有跟其他的互聯網技術,或者是其他信息技術在安全性上,或者是其他層面上帶來的威脅有本質的區別。
其實不是安全問題,或者不止是安全的問題。“智能”大了之后的社會分工,我覺得十年之內有巨大的動蕩,不僅是中國,全世界都會面臨這個問題。我為什么是我?我大學上了到底有沒有用?將來的小孩到底學什么,要重新開始思考。今天我們開始重新認識自己。未來20年,人類社會分工,或者經濟形態會有巨大的變化。
對話全文:
鄧鋒:我們請來了人工智能學界很資深的一個人士,美國計算機協會2015年的杰出科學家、IEEE Fellow院士、阿里巴巴集團人工智能研究機構的資深總監華先勝,請華先勝來和朱瓏一起對話。中國人工智能是一個不是很大,全球都不是很大的圈子,現在說招一個人工智能的人才,給的工資都極高的。華先生您聽了朱瓏的演講,您有什么想“挑戰”朱瓏的?
華先勝:我經常說一句話,叫人工智能風生水起,視覺計算遍地開花。剛才朱瓏前面講的更多的是視覺內容,就是這些花開了能不能結果其實是很難講的。
我們回憶一下人工智能的發展,人工智能其實不是一個年輕的概念,大概60年前1952年的時候提出來的,那個時候大家也非常的興奮,十年以后人工智能就要超越人類了,大概過了十幾年以后發現不行,這個人工智能不下去了,到了80年代的時候,因為這個神經網絡的出現,而不是今天的深度學習網絡,包括這個一批算法的出現,大家又很激動很激動,這個人工智能來了,又要來了,過了十幾年以后又進展不下去了。那么我想問朱瓏一個問題就是,這一次人工智能起來以后,我怎么能知道它不是一個虛假的春天呢?前面兩個春天都已經證明這其實不是“幻象”,今天有什么不一樣呢?
朱瓏:我自己的理解,首先講不一樣的程度吧。我覺得說今天人工智能比肩或者超越工業革命毫不夸張。
很多人在談論的時候是用了這個詞匯,但實際行動上并不是這么大定義的,他實際嘴上說說,如果是這么大的,你應該把房子賣了都放進來對吧,但是實際行動是跟不上說話的這個程度,這個是講定義的程度。
第二個事情跟以前不一樣,以前講的概念,或者是30年前人工智能比較熱的時候,今天2012年那場會,2013年深度學習熱起來,深度學習我在那個實驗室待著,就是剛才說了很多科學家或者是年輕人并不愛學這個,它是一個冷門。
概念其實在那里躺著,已經躺了超過10年時間,算法和模型并沒有本質的變化,今天熱起來是從結果來說的,是所有的領域的結果讓大家感覺到信心,比如谷歌把錢給砸下去了。以前的熱是說有錢人跑到MIT說,聽說你在做腦科學,1000萬美金給你,我們一定要參與一下這種腦科學計劃,能不能做成。
今天是因為商業價值,看到了商業巨大的進展,這跟過去十年、過去30年所有的熱門的東西,不僅是概念,是在實驗數據上,工業級的實驗數據上看到非常深遠,或者說這種科學意義上的統計意義上的,我覺得這是最重要的不同。
華先勝:OK,這個我覺得是有道理的,跟以前不一樣了,我們現在看到了一些結果,盡管我們看到的結果其實也是一個局部的,當然還有關于深度學習技術真正在大規模的計算環境下能夠計算,這個深度學習技術的發展,計算能力的提升,網絡的提升,網絡帶寬的提升,數據產生的容易,包括這個用戶的參與,用戶的參與本身就是一個強的反饋,是看到的成果可能會更向前發展,真正產生作用。
那么第二個問題是想問問你這家創業公司,因為我本身也是做視覺技術的,在高手之間,算法的差別幾乎是越來越小,對于數據而言一家創業公司跟BAT相比好像也毫無優勢,從計算平臺的角度來講小公司更沒有計算平臺了,阿里云有計算平臺,百度有沒有不好說,至少微軟、谷歌這些公司都有大的計算平臺。從商業的角度來講,創業公司跟這些公司也是很難比的,那么怎么樣讓一個創業公司在這里面能夠勝出呢?我打一個比方,假如有一天,微軟、阿里云免費了,這些技術免費了,媒體同事請注意,我沒有說阿里云免費我只是打一個比方,不然我回去就被炒了,假如有一天這些大公司免費了,你怎么辦呢?
朱瓏:這個問題在我創業的第一天就被問過。因為我自己的身份還是有一定的立場能講這句話,什么意思呢?我在全球最好的人工智能實驗室待過,所以我天生回來的時候就很平靜的。有人問我,問百度就是問谷歌說做的怎么怎么樣,我知道我師弟幾斤幾兩在那邊做的,不是因為谷歌強他就牛逼了,這是由做人工智能領域最強的那個人決定的。
有數據有錢,1億美金給他,他能不能做成,不見得!這個差很遠的,但我這個觀點不代表是為所有的創業者說話,而是說,這個事情的本質是由最強的那個人決定的,大的公司之間的博奕,微軟和谷歌之間誰有那1億美金呀,大家都有,現在創業公司1億美金都很輕松,錢也不是問題。
資源、數據、都有錢,你說大的公司敢投1億美金嗎?找不到那個人的時候,有錢也不敢投。
鄧鋒:剛才我理解,聽出點火藥味來了,我們這兒人還是很牛,但是數據是關鍵,人家比你數據多。
朱瓏:首先數據是非常關鍵的,但是這里談技術的時候,我經常被同事們問。技術有幾個層次,其中有一個叫做技術的遠見或者技術的insight,大家是不談的,大家只是談算法,遠見是什么意思呢?
技術未來在哪里,就是說其實對技術的理解能夠讓你知道數據在哪里,繼續值錢到哪里,這不是大公司就一定知道的。大公司太多了,你看BAT跟谷歌對數據的理解還千差萬別,他敢投這個人工智能科學家,敢投5000人3000人下去,BAT是不敢投這么多人的,他不知道business在哪里,也不知道技術的預測。其實最一流的高手他差距就是非常大的,最牛的人之間反而有可能是差距越來越大。
創業公司有數據的瓶頸,四、五年前數據是約束我們的,這個倒是真的。但還要看你要進入哪個市場,比如醫療市場,醫療是一個非常分割的市場,今天沒有哪個大公司把這個數據通吃或者壟斷了。
哪一些市場是特殊的?有用戶場景的。有大量用戶場景是大公司的強優勢,我覺得小公司基本沒戲,既使是你有技術。這要區分來看,有一些領域,比如說人臉,大家都做人臉識別,那用網絡上的數據,其實大公司小公司都沒有太大差異,都能收集到1億、2億的數據,但是到比如剛才說的ATM機刷臉取款的那些場景,既使是非常大眾化的人臉識別這個領域,BAT也沒有ATM機的數據,你也得從最簡單的開始做起。越垂直、越分散的領域,大公司不見得有優勢,這是創業公司很大的機會。
華先勝:看來你對于自己的科學家的團隊還是很有信心的,實際上我覺得大家都知道,人工智能技術落地確實是有很多的因素在里面,有科學家,或者叫算法,算法是由科學家發明的,所以我把他混在一起來談,有數據,有平臺,有商業模式,有用戶,這些因素基本上是缺一不可的,他可能應用強調這部分更多一點,有一些應用可能強調另外一個因素更多一點,其實我有些同意剛才朱瓏的一些看法,特別是講到要深入一個行業去,我覺得是非常重要的。人工智能遠遠還沒有到我想到一個算法然后就work,不是這樣的。還差的遠的很。
第三個問題,剛才講到很多監控的問題,智能的發展對將來會不會產生一些負面的影響?比如安全方面,隱私方面,這些將來帶來的問題,帶來的困擾。就相當于計算機發展的過程當中剛開始PC的時候有病毒,后來網絡有木馬,現在數據和web2.0、3.0等等這些概念出來,假新聞等等之類的都會帶來負面的一些因素。我想問一下,雖然跟你的創業公司不見得有直接相關,我想問一下你在這方面有什么樣的看法。
朱瓏:技術帶來的社會影響其實是一個長久的話題,人工智能可能今天因為超越人的智能邊界的時候,會更加敏感。
我覺得兩個方面,第一個方面就是它其實不是安全問題,或者不止是安全的問題。“智能”大了之后的社會分工,我覺得十年之內有巨大的動蕩,不僅是中國,全世界都會面臨這個問題。我為什么是我?我大學上了到底有沒有用?大家如果家里有小孩,今天可以開始思考到底學什么。這個課題在過去的教育學家的課題可能這一頁應該翻過去了,要重新開始思考。
沒有人是特別知道應對30年后的世界,現在學什么才是對的,因為今天我們開始重新認識自己。未來20年,人類社會分工,或者經濟形態會有巨大的變化。以前大家都學車,那以后無人車都有了,你學車就被人笑話對不對。
第一個層面是說,這個會有非常不平衡的情況出現,而且政府一定是滯后的,因為這個時間越長,沒有人有特別強的預測能力和管控能力,所以這是第一個層面;
第二個事情是,目前AI技術并沒有跟其他的互聯網技術,或者是其他信息技術在安全性上,或者是其他層面上帶來的威脅有本質的區別。技術都有兩面性,一定會出現有利的地方和不利的地方,在過去因為有黑客互聯網就不發展了?不太可能。我覺得AI并沒有特別強的特殊性。
華先勝:剛才朱瓏講到了一個非常有意思的關于人臉識別技術,機器識別的能力,但是其實還有另外一點,機器識別的局限性。比如我們對一個人的時候,哪怕這個人的側面,哪怕是一個背影,哪怕是燈光灰暗的,哪怕是有人遮擋的,人是能夠識別的,機器很多情況下就歇菜了,也就是說這個機器是在某一個方面是強的,在某一方面是弱的。
比如說,現在還有一個例子就是對話這件事,你在某一個行業里面,或者說你只是問他一些,告訴它訂機票,查天氣,叫個車,那是很好的,你要隨便跟他聊聊天,說這個北京天氣怎么樣,飯館怎么樣,或者是杭州呢?它就說杭州有美麗的西湖,就不知道你的聯系到說杭州的天氣怎么樣。那么人工智能的局限會不會限制將來的發展?到底怎么樣結合人的智能和機器的智能的這個長處去產生真正的影響?
朱瓏:剛才這個問題也比較普遍會被問道到。我本來給大家解釋那條曲線,稍微有點復雜,我剛才跳過去了。那條曲線,橫軸是不同的年限,縱軸是錯誤率,大概是這么一條下滑的曲線,曲線上不同的點是什么呢?就是每一萬人當中把你識別出來超過95%的這種點,再往下是10萬人,100萬人,1000萬人,1億人,10億人。技術是這樣子發展的。什么意思?
剛才1萬人、10萬人對應的是算法的識別性能,也是對應算法適用的場景性能在10倍、10倍的提高。場景是不斷被解鎖的,而且這個過程是一個非常大非常大的加速的過程。
過去我們很難想象ATM機這種邊界是可以做的,實際的應用場景有的時候是超越你想象的。我們是業界最前沿的,有時候都會受到驚訝,舉個例子,警察拿著人臉識別去辨認尸體,這不是設計者最初能夠設計到的,我也不是這么弄的,警察說這個也可以,尸體不知道身份,他就可以查出來。他應用于這個事情的時候,大大超越設計者的想象。今天的智能,我們的想象已經跟不上人工智能發展的速度了,所以千萬不要擔心人工智能技術跟不上我們的想象。
鄧鋒:我舉一個例子,你雖然做的很準,但是你很難應用。拿醫學圖像處理來說,大家知道照X光,或者是各種各樣的CT,MRI,你可能有很多東西,如果你的影象科醫生是很好的,醫生他看的比較準,不好的醫師可能看不好,經驗不豐富看不了那么準。人工智能來做非常好,現在這個準確率也有提高,但是問題在哪兒呢?因為我們用了深度學習的方法,導致什么呢?他看的圖片以后,他可能看了幾百萬的圖片,其中有可能有幾十萬是病人,他就告訴你這個可能是有癌癥,或者說準確率多高有癌癥,但是他解釋不出來為什么。你要給到這個臨床醫生他給你看,他說,你這個左胸和右胸的這個紋理不夠清晰,或者是哪兒不夠清晰,結節的形狀,結節的大小等等,他會說一些這個東西,可是人工智能給你回答的只是說你這個疑似癌癥。這怎么在實際當中用?你沒法跟病人解釋怎么辦?
朱瓏:我來解釋一下,剛剛那個片子可能大家沒有細節看,我沒有展開。我剛才有一個CT的片子,我們出的報告恰恰是你說的,里面對結節的大小,它的體積、可疑性等都有描述,我們會出診斷報告。就是說它是可以被解讀、可以跟醫生交流的,他是做一個描述性的東西,不是只回答患癌或健康。
鄧鋒:你已經不是簡單的深度學習了,你已經走到結合其他的東西來做的方向了。
朱瓏:可以這么說吧。剛才說的問題是有一部分存在的,甚至是大部分存在的。時間就是2017年比2016年快太多,2016年比2015年快太多。
我舉一個例子,2016年我們的產品能夠被部署到醫院,就用了半年時間。在公安系統同樣的這個事情我做了兩年半的時間。
就是說技術在商業化落地的過程,商業跟技術結合的過程越來越加速。當然這個可能是我們一家公司的特例,或者說不是現在市面上的公司都這樣,但我覺得總體趨勢是這樣的。
鄧鋒:加速是最恐怖的一個事兒。
朱瓏:對。
鄧鋒:我們下面開放給下面的聽眾,大家可以提問。
聽眾:您好,想問一下朱總,人工智能在技術層面還有在發生哪些重要的變化嗎?短期之內是否,還有像Hinton2006年時發的那個同等重量級的那種論文的出現。剛剛您也在自己的演講中提到,AI的技術在這兩年有跳躍性的進步,想問一下您指的跳躍性的進步都有哪些?
朱瓏:這個算法或者說技術本身十年前就有了,不是在這十年有跳躍性的發展。整個世界認識它是跳躍性的,這些科學家憋著,憋著,也不是因為那個GPU、大數據,也是也不是,什么意思呢?當年我在MIT的時候,全球就少數的幾家團隊用GPU,就敢用GPU,他就相信那么大的數據能夠上去有效果。既使是發明的這個人,他當時并不如Hinton那么堅定。
就是說,同一個件事情到你手里,信的人和不信的人,發展速度差別是巨大的。因為任何的轉型,或者說往前突破都有風險和成本。
大家不要有一個誤區是最近有什么特別明顯的發展,這個技術是這幾年有逐漸的增加。跳躍性的意思不是代表這個技術,或者科學家理解上的跳躍性,是說這個東西在工業上或者說在應用上會有跳躍性的發展。
比如說,今天大家開始探討記憶,因為我們很多是識別大腦的智能的一些比較單一的功能,現在記憶推理都可以,或者說在嘗試并且是科學可驗證的手段,向人的水平逼近,所以這些能做了,好多事情就能夠實現,包括人機對話等等。
聽眾:謝謝,我想問朱總一個問題,剛才朱總提到,現在這個階段人工智能的技術也是沒有特別的權威,很多算法也是并不是什么特別創新的,或者是特別的算法,我想請教,作為一個商業機構依圖科技最核心的競爭能力是什么?您如果要往前發展,希望成為下一代BAT或者是成為一個獨角獸的話,您最核心的戰略推動是什么?謝謝。
朱瓏:講到技術好不好理解、投資機構怎么辨別。我講一個笑話,紅杉資本周逵總最后要投我們的時候,問我你這個技術,你說你最好,這個能判斷嗎?我說怎么判斷?你判斷不了,你只有信我或不信我,最好的人你是不可能有能力判斷的,你只能選擇信我或不信我,我是說“最好的人”,不是前10%的人,最好的人只有最好的人才能判斷。
那最好的人判斷他其實也不是通過這個結果,他有很多細節,他輸入的很多觀點是一致的,他是有體系的,三年前他是可以,三年后可以被驗證的,是有信用的,不是只是一句話喊對了,他100句話都說對了,他不是只是這一點上說對了。
我講一個具體的。今天很流行的說法是AI要跟to B結合,投資人或其他很多人認為這是想當然的事情。但是5年前,進我辦公室的人第一句話都是在問,你為什么不做to C?潛臺詞是沒有to B這件事情的。
今天to B變成人們一個共識了,投資人還是問我怎樣去辨別團隊。我覺得AI本身不是一款產品,科學家沒有特別天生的優勢。AI的任何技術不是產品。比如說在公安系統中,我們的后臺不是只有算法,而是端到端的。公安的業務平臺,對他的科技口、刑偵口和交通口的戰法應用,以及業務部門怎么分發到派出所,怎么配合,這些對產品的定義理解非常重要。醫療行業也是一樣,只是一個算法或截面的改動,對算法的要求差距就很大。這就非常需要對技術和商業場景相結合的理解,非常需要高手。作為翻譯者或溝通者,這個角色非常重要。這是比AI人才更稀缺的。
鄧鋒:我解讀一下,舉一個例子,拿醫療影像處理來說,很多團隊都在做靜態圖像對比。大家看到大量的數據公司做的很好,但是實際應用中發現不太好用,為什么會這樣?因為最大的問題是圖片。技術員拍攝的X光、CT,可能因為拍攝水平不高,圖像不標準。如果只是從技術的角度上考慮,不從產品的角度考慮,做的再好也沒用。怎么能夠讓產品幫助技術員實時的把照片拍好,這可能是產品很重要的點。這跟人工智能和影像識別沒有太大的關系。這點我很同意,我們要從行業切入,從用戶的剛需和痛點做好產品。再往后推,可能是人工智能的技術。還有問題嗎?
聽眾:我們是做醫療方面的,剛剛朱總談到您覺得進入醫療領域還蠻快的,我自己在行業里面覺得這個過程還挺慢。我特別認同場景這件事情。您舉了幾個例子,我自己的感覺是它沒有在創造價值的場景下發揮作用。您覺得在進入醫療行業時,會不會有一些阻礙的因素?
朱瓏:我們做醫療并不是第一次做垂直行業。我們首先做的是公安領域。這是一個很深的而且不是那么好做的垂直行業。這里面存在進入垂直行業的共性方法。這些方法和經驗是對人的理解,對部門之間的理解。這是對進入醫療行業有幫助的。
其次,對產品和技術的理解,在垂直行業中也會碰到,在醫療行業也會有共性。所以我們在公安領域里面有一個口號,就是我要比公安的人更懂公安。醫療也是類似的情況,所以我們會有比較謙卑的學習心態,讓我們比醫生更懂醫生。我要和醫生、生物學家、藥廠、投資人聊,比他們都懂這個行業。我覺得這個是很關鍵的。
鄧鋒:我問的問題可能更直接,其實進入醫療行業是強關系型的,跟技術和產品的關系不大,主要是靠客戶管理,對吧。
朱瓏:是。
鄧鋒:人工智能這個時代,是不是還要通過強關系才能交易,才能進醫院。
朱瓏:你剛才說的是現狀。我們在醫療行業感受到的和公安領域非常相近的地方是產品真的能打動人。我第一天進入醫療行業,一點醫療的算法和產品都不具備,但是我只問一句話,就是你最突出的問題是什么,或者哪些是有數據基礎可以做的。兩個月之后我就帶來一個樣本在這里試驗。他們真的關心這件事情,因為能解決他們的問題,真的有用。做的時間要足夠快,從算法定制到產品研發到給出結果,這個威力是非常大的。
鄧鋒:非常好,我知道觀眾還有很多的問題,但是時間有限。最后大家一起感謝我們的演講人和嘉賓。