學(xué)界與工業(yè)界的AI研究有什么不同 您的位置:首頁(yè) - 公司動(dòng)態(tài) - 常見(jiàn)問(wèn)題
現在不少學(xué)界的科學(xué)家都到公司里做研發(fā),那么,在工業(yè)界從事研發(fā)和以前在學(xué)界究竟有哪些不同?很多關(guān)心研發(fā)的人會(huì )有這樣的疑問(wèn)。
去年,講到人工智能時(shí)人們會(huì )談到它具有“三要素”:算法、算力和數據;從今年開(kāi)始,把場(chǎng)景加入進(jìn)來(lái),開(kāi)始用“四元分析”的方式來(lái)理解人工智能。加入場(chǎng)景非常重要的原因是人工智能終究是一種技術(shù),人工智能必須要落實(shí)到精準的場(chǎng)景,才有它實(shí)實(shí)在在的價(jià)值。
學(xué)術(shù)界追逐精度的極限
人工智能的概念實(shí)在太大了,現在深度學(xué)習最熱,學(xué)術(shù)界里研究深度學(xué)習會(huì )做些什么事情呢?
一般情況下,學(xué)術(shù)界把問(wèn)題設立好后,去思考研究一些新的算法,然后在具體的問(wèn)題上,力圖在精度上達到極限。從深度學(xué)習上設計更好的模型結構方面,過(guò)去這些年,像最初的Hinton用最基本的網(wǎng)絡(luò )結構,到谷歌的GoogleNet,微軟的殘差網(wǎng)絡(luò )(ResNet),可以看到基礎網(wǎng)絡(luò )結構是推動(dòng)學(xué)術(shù)界往前走的核心。但是除了基本的網(wǎng)絡(luò )結構之外,更大的網(wǎng)絡(luò )、更深的網(wǎng)絡(luò )以及不同的網(wǎng)絡(luò )模型的融合,也是大家追逐精度的常用方法。
另一方面,我們要訓練這些網(wǎng)絡(luò ),可能需要更多的計算資源,比如需要圖形處理器集群(GPU Cluster),比如希望有更便捷的訓練平臺,像Caffe、MxNet、Tensorflow等等。當然,更重要的是大家在一點(diǎn)點(diǎn)往前推動(dòng)的同時(shí),積累了很多小的經(jīng)驗,這些經(jīng)驗通過(guò)學(xué)術(shù)報告、論文的形式來(lái)分享。
大家都站在巨人的肩膀上一步一步往前走。當然,還有怎么樣用其他的非標注的數據來(lái)提升解決問(wèn)題的能力。所有的一切都結合在一起,在解決具體問(wèn)題的時(shí)候,能夠把精度達到極限。
學(xué)術(shù)界很多時(shí)候研究的目的,是要有成果論文發(fā)在最頂級的學(xué)術(shù)雜志上,也希望這些算法能夠具有普適性,除了能解決自己的問(wèn)題,其他人也能借鑒,最好能開(kāi)源,所有人都可以去使用,這樣就能很好地提升自己在這個(gè)領(lǐng)域的影響力。
沒(méi)有瑕疵的用戶(hù)體驗如何產(chǎn)生
但工業(yè)界不是這樣。工業(yè)界要去探索商業(yè),注定要有經(jīng)濟上的考慮,思考盈利模式,那對人工智能的考慮就會(huì )不一樣。
在工業(yè)界待過(guò)就會(huì )明白,人工智能本身并不是一個(gè)產(chǎn)品,不是單純靠人工智能就能獲得利益,必須要與自己的業(yè)務(wù)和場(chǎng)景相結合,才能發(fā)揮它的價(jià)值,核心算法只是其中的一個(gè)模塊而已。無(wú)論是往前端走,還是往后端走,還是需要很多不同類(lèi)型的人,才可以做出一個(gè)產(chǎn)品。
最重要的是,人工智能并不是一個(gè)靜態(tài)的東西。比如說(shuō)訓練出來(lái)的模型,要用到某個(gè)業(yè)務(wù)場(chǎng)景里面,業(yè)務(wù)場(chǎng)景里產(chǎn)生新的數據,這些數據進(jìn)一步提升人工智能模型的能力,再用到場(chǎng)景里面,這是一個(gè)閉環(huán)和不斷迭代的過(guò)程。
另一方面,也是很多從學(xué)術(shù)界到工業(yè)界的教授和學(xué)者很容易犯的一個(gè)很?chē)乐氐腻e誤,就是認為技術(shù)在真正推動(dòng)產(chǎn)品。但其實(shí),用在具體的場(chǎng)景里面,技術(shù)只是起到一個(gè)非常小的作用,它的貢獻大概30%到40%就不錯了。
一個(gè)成功的產(chǎn)品,還需要產(chǎn)品工程師和非常多的人,大家一起才能做出一個(gè)具備非常完美的用戶(hù)體驗的產(chǎn)品出來(lái)。一個(gè)核心點(diǎn)就是我們做技術(shù)的人,做研究的人,要明白永遠沒(méi)有完美的算法,算法永遠是有瑕疵存在的,我們一定要和場(chǎng)景工程師在一起,通過(guò)好的產(chǎn)品設計,把這些算法上的瑕疵避免掉,打造沒(méi)有瑕疵的用戶(hù)體驗。
此外,除了考慮用戶(hù)體驗,工業(yè)界設計一個(gè)產(chǎn)品還會(huì )考慮其他方面。比如,當前把視覺(jué),語(yǔ)音和相關(guān)的技術(shù)用在智能硬件上的時(shí)候,工業(yè)界可能會(huì )想,到底這個(gè)產(chǎn)品能不能滿(mǎn)足某種高頻的剛需?
工業(yè)界還會(huì )考慮一款產(chǎn)品用到的技術(shù)有沒(méi)有成熟?比如說(shuō)家用機器人,可以端茶送水,可以聊天,這是不可能的,技術(shù)上還有一個(gè)過(guò)程。
另外,工業(yè)界還會(huì )考慮技術(shù)成熟了,但有沒(méi)有壁壘?假設沒(méi)有技術(shù)壁壘的話(huà),今天做一個(gè)產(chǎn)品出來(lái),比較前沿的大公司,都有專(zhuān)家團隊,你把這個(gè)產(chǎn)品做出來(lái)立馬又失掉了,技術(shù)上的壁壘也一定要有。
另外一方面,就是學(xué)術(shù)界想得最少的:我們做一個(gè)場(chǎng)景,一定要有變現的模式。沒(méi)有一個(gè)變現的模式,產(chǎn)品出來(lái)了,但是今后掙不了錢(qián),也不可能讓這個(gè)公司維系下去。
用四元分析來(lái)看學(xué)界和工業(yè)界的區別
總的來(lái)說(shuō),學(xué)界進(jìn)行人工智能、深度學(xué)習的研究,一直是在追求精度和極限。用四元分析的方法來(lái)說(shuō)就非常有意思,即場(chǎng)景和數據確定了,然后設定一個(gè)問(wèn)題,設定一個(gè)數據集,假設有足夠多的計算機資源,怎么樣設計新的算法,讓精度能夠達到極限?
有很多的數據集,比如ImageNet,號稱(chēng)人工智能的世界杯;人臉研究界有LFW(人臉圖片的數據庫,用來(lái)研究不受限的人臉識別問(wèn)題);在視頻領(lǐng)域有美國組織的TRECVID;語(yǔ)音的話(huà)有Switchboard。他們共同特點(diǎn)就是:?jiǎn)?wèn)題和數據都是確定的,用盡量多的計算機資源,去設計不同的算法,最終希望達到精度的上限。
但不得不承認,很多成果是沒(méi)辦法商業(yè)化的。為什么?在ImageNet上,假設訓練了1000多層的網(wǎng)絡(luò ),把9個(gè)或更多網(wǎng)絡(luò )全部合在一起能達成一個(gè)很好的精度,在現實(shí)的場(chǎng)景下是不可能用這么大的模型和這么多的資源去做一件事情。所以,很多的成果,是假設將來(lái)計算能力達到一定的程度,精度能夠達到這個(gè)上限。
AI研究的另外一個(gè)維度是追求用戶(hù)體驗的極限。用四元分析的方法,是把場(chǎng)景和算力固定了。這是什么意思?假設我們要做一個(gè)機器人,希望它能識別你,這時(shí)候場(chǎng)景是確定的。算力確定了是說(shuō),這個(gè)場(chǎng)景推出的時(shí)候,用什么樣的芯片和什么樣的硬件,其實(shí)已經(jīng)確定了。我們要做的事情是在這樣一個(gè)確定場(chǎng)景和算力的情況下,怎么樣去提升數據和算法,跟具體的應用場(chǎng)景去形成一個(gè)閉環(huán),去不斷地迭代,去提升它的性能。這跟學(xué)術(shù)界把場(chǎng)景和數據固定是完全不一樣的。在這種場(chǎng)景下,可以不停地用收集到的新數據不停提升和優(yōu)化模型,在數據、算法和場(chǎng)景三要素中形成一個(gè)閉環(huán)。雖然我們能把所有的問(wèn)題解決,但是在具體的場(chǎng)景下,也有可能逐步地提升它的性能。
這時(shí)候做的事情很有意思——要做很多數據的清洗、標注。為了把產(chǎn)品的價(jià)格降低,比如用一個(gè)很差的CPU就能夠去做計算,肯定要不停地去優(yōu)化模型的速度。另一方面,很多時(shí)候,滿(mǎn)足這種體驗的需求會(huì )使一些新的問(wèn)題誕生出來(lái)。
仔細想一想,學(xué)術(shù)界多數做的事情是在思考,在想它的極限在哪,主要用腦;工業(yè)界并不是強調用腦,而是用心——就是怎么樣能把這個(gè)場(chǎng)景做出來(lái),并不一定要有非常高大上的算法,就是要從用戶(hù)使用產(chǎn)品的維度上,讓用戶(hù)感覺(jué)這個(gè)產(chǎn)品非常好。
學(xué)術(shù)界和工業(yè)界又不是完全割裂的:工業(yè)界敢去提某一個(gè)產(chǎn)品的設想,是看到了在學(xué)術(shù)界有一些前沿的成果,可以在工業(yè)界來(lái)用。同時(shí),工業(yè)界也在逐步提煉它的問(wèn)題,扔給學(xué)術(shù)界,希望他們去做這種前沿的探索。比如說(shuō)工業(yè)界可以想,三年、五年以后會(huì )往哪些方向去推動(dòng),他就可以把這些任務(wù)推給學(xué)術(shù)界。
在人工智能、深度學(xué)習的研究領(lǐng)域,學(xué)術(shù)界和工業(yè)界的差別還是很大的,同時(shí)也相互作用,相互增強。學(xué)術(shù)界和工業(yè)界一起合作,研究和產(chǎn)業(yè)相結合,一定會(huì )把人工智能帶上另外一個(gè)階段。
?。ㄗ髡呦?60公司首席科學(xué)家、人工智能研究院院長(cháng))
上一篇:阿里未經(jīng)授權使用漫畫(huà)作品一審判賠7.1萬(wàn)元 下一篇:數碼相機:如何借勢專(zhuān)利擺脫發(fā)展頹勢? |
網(wǎng)站首頁(yè) | 商標代理 | 關(guān)于我們 | 新聞中心 | 惟恒文化 | 法律法規 | 專(zhuān)業(yè)團隊 | 人力資源 | 典型案例 | 聯(lián)系我們 | 后臺管理
友情鏈接:
互聯(lián)網(wǎng)維修服務(wù)平臺 新行業(yè)加盟 中華人民共和國國家版權局 中國知識產(chǎn)權裁判文書(shū)網(wǎng) 中國工商紅盾網(wǎng) 廣東省工商局 中華商標網(wǎng)
聯(lián)系我們:
版權所有:廣州惟恒知識產(chǎn)權服務(wù)有限公司
客服專(zhuān)線(xiàn):15889958307 13500027759
QQ:1227531798 E-mail: vhonn_cn@163.com
廣州業(yè)務(wù)中心地址:廣東省廣州市天河區天潤路33號潤華大廈
粵ICP備13056144號-1
客戶(hù)服務(wù)熱線(xiàn)
158 8995 8307