7月5日,百度AI開發(fā)者大會(英文名稱:Baidu Create 2017)到來, 匯聚了全世界的AI開發(fā)者。這是中國工業(yè)史上第一次大規(guī)模的AI開發(fā)者大會,未來將每年夏季定期召開。
當(dāng)天上午的主論壇在科技、互聯(lián)網(wǎng)圈乃至汽車圈頻頻刷屏。而當(dāng)天下午的重頭戲之一——AI技術(shù)與開放平臺分論壇,以“開放創(chuàng)新 共襄AI未來”為主題。
如果看過前天的百度開發(fā)者大會,相信你也會和我一樣,認為“開放”可以算作百度整個AI戰(zhàn)略最重要的關(guān)鍵詞之一。百度人工智能開放戰(zhàn)略一直是延續(xù)的,從技術(shù)、戰(zhàn)略和人才這三個層面看,這個選擇大概率是正確的。這也是谷歌、亞馬遜這樣的國際AI巨頭們正在做的決策。
百度AI“開放套餐”已經(jīng)到了能力溢出階段
作為百度AI技術(shù)平臺體系(AIG)總負責(zé)人,百度副總裁王海峰在分論壇現(xiàn)場表示:
“百度在人工智能領(lǐng)域深耕多年,從十七年前百度誕生之日起就開始積累,幾乎所有主要人工智能技術(shù)都已在百度搜索引擎中得到應(yīng)用,來自搜索引擎及百度各產(chǎn)品的用戶需求、數(shù)據(jù)和平臺,支撐了百度AI技術(shù)的快速發(fā)展,現(xiàn)在百度人工智能在算法、數(shù)據(jù)、技術(shù)等方面具有領(lǐng)先優(yōu)勢?!?a target="_blank">南寧網(wǎng)站建設(shè)
百度此次開放了5大類目的14項核心技術(shù)。覆蓋語音、視頻、增強現(xiàn)實、機器人視覺、自然語言處理等各個領(lǐng)域,能夠滿足開發(fā)者從API、源碼、數(shù)據(jù)、計算能力等多個層次的需求。
之所以會選擇開放,主要還是因為百度人工智能成熟度足以開放給行業(yè)使用,而且技術(shù)領(lǐng)域覆蓋也比較完整,有能力為開發(fā)者提供“套餐”,而且已經(jīng)處于能力溢出的階段。
這幾年來百度在人工智能領(lǐng)域的深入研究,也決定了百度無論是在橫向(人工智能的領(lǐng)域)以及縱向(人工智能各個領(lǐng)域的深度)上都達到了國內(nèi)頂尖的水準。
用王海峰的話來說,百度的AI能力分為四層。
在基礎(chǔ)層,是AI算法、大數(shù)據(jù)、大計算能力。感知層,包括語音、圖像、視頻、AR/VR等技術(shù)。認知層,有自然語言處理、知識圖譜及用戶畫像等。在平臺層,基礎(chǔ)層、感知層、認知層的技術(shù)會平臺化,通過百度AI開放平臺開放。而百度AI開放平臺上開放的技術(shù)能力總共有60個,是最全面的AI技術(shù)開放平臺。
隨著越來越多行業(yè)(汽車、物流、電商、服務(wù)業(yè))的進一步深入,都必須用到AI能力,對于開發(fā)者以及創(chuàng)業(yè)者來說,很多時候?qū)τ贏I技術(shù)的運用往往是組合式的,以智能家居企業(yè)為例,一旦要嘗試使用AI,那么不僅僅需要用到人臉識別,還要語音識別等技術(shù),涉及到的技術(shù)點就包括了圖像識別、自然語言處理等。南寧網(wǎng)站開發(fā)
尤其是像無人車這樣的技術(shù)更是如此,這背后是無數(shù)人工智能技術(shù)復(fù)合的載體——導(dǎo)航時需要用到語音識別、語義識別技術(shù),自動駕駛時需要用到機器視覺技術(shù)。
如果沒有這樣的人工智能企業(yè)在背后做支撐,很多企業(yè)的智能化設(shè)想幾乎沒辦法推進,效率也無法提高。
考慮到人工智能領(lǐng)域的創(chuàng)業(yè)者越來越多,百度也是選擇把自己的能力開放出來,給創(chuàng)業(yè)者使用。重要的是,百度的AI覆蓋領(lǐng)域也足夠全面。
百度AI開放平臺覆蓋了各行業(yè)的合作伙伴,百度集團總裁及COO陸奇介紹說,百度做了一系列的行業(yè)解決方案和生態(tài)合作方案,從智能客服到智能銷售、智能大腦、出行大腦、醫(yī)療大腦、教育大腦等等。
對于創(chuàng)業(yè)者和開發(fā)者來說,這樣一個平臺,是一個萬能的“工具箱”,有需要就可以從里面掏出最適合自己的工具。
開放將推動人工智能技術(shù)、產(chǎn)品、生態(tài)得到完善
“工具箱”當(dāng)然僅僅只是一個層面的目的。事實上,技術(shù)開源是一個大趨勢,人工智能不可能靠一家公司來推動。
李彥宏在這次開發(fā)者大會上說到這樣一句話:
AI時代是屬于開發(fā)者的時代,因為有太多技術(shù)需要去提升和應(yīng)用。把這些技術(shù)應(yīng)用在任何領(lǐng)域,都打開了無數(shù)的可能性。但是互聯(lián)網(wǎng)時代的個人英雄主義行不通了。
開放這也是所有人工智能巨頭的選擇。2015年谷歌曾開源TensorFlow,這是谷歌基于DistBelief進行研發(fā)的第二代人工智能深度學(xué)習(xí)系統(tǒng),可以應(yīng)用到語音識別、自然語言理解、計算機視覺和廣告等領(lǐng)域。亞馬遜在后來也開放了自家深度學(xué)習(xí)框架MXNet。南寧微信開發(fā)
百度的開放策略與其相比,優(yōu)勢還是在于更容易學(xué)習(xí),也更便于開發(fā)者使用。像PaddlePaddle這樣的人工智能開源平臺僅需少量代碼就能訓(xùn)練深度學(xué)習(xí)模型,大大降低了用戶使用深度學(xué)習(xí)技術(shù)的成本。
降低學(xué)習(xí)成本的效果是顯而易見的,這會帶來四個結(jié)果:
1、借此構(gòu)建起一個以自身為核心的生態(tài)系統(tǒng)
有能力的巨頭建立生態(tài),從AI技術(shù)、整體解決方案、云平臺,到硬件和產(chǎn)業(yè)都有完整的布局。在這個生態(tài)系統(tǒng)中,開發(fā)者、創(chuàng)業(yè)者不僅僅用自己的工具,還用自己的標準和語言。不同的人工智能開源方案對感知層面的技術(shù)、學(xué)習(xí)與訓(xùn)練計算都有差異。人工智能計算能力的調(diào)用,將來可能會作為API直接被打包在整體解決方案甚至硬件中。
2、可以獲取到更多數(shù)據(jù),并且讓算法更加精確
在各個垂直領(lǐng)域的開發(fā)者和平臺對接后,復(fù)雜的數(shù)據(jù)結(jié)構(gòu)會被傳輸至人工智能神經(jīng)網(wǎng)中進行分析和處理。之所以要開放自家平臺,核心目的還是要不斷用實踐數(shù)據(jù)不斷去“喂飽”自家的人工智能,讓它的算法更精確,尤其是在各個垂直領(lǐng)域的開發(fā)者和平臺對接后,不僅能夠讓自家業(yè)務(wù)有精確數(shù)據(jù)進行指導(dǎo),反過來也可以繼續(xù)調(diào)教平臺的準確性。
3、真正和具體行業(yè)結(jié)合在一起,產(chǎn)生更多研究成果
如Android開發(fā)者平臺使APP開發(fā)者有統(tǒng)一標準可以參與開發(fā)一樣,人工智能的開發(fā)工具和相對標準的開源硬件的成熟,若能形成云端智能和終端智能打通的工具平臺,普通開發(fā)者參與開發(fā)難度降低,生態(tài)發(fā)展會大大加速。
在人工智能領(lǐng)域軟件系統(tǒng)開源同樣會是常態(tài),多家巨頭都將自己的人工智能系統(tǒng)開放出來,也已有巨頭在硬件開源方面進行嘗試,這有利于業(yè)內(nèi)更多的企業(yè)和工程師參與人工智能領(lǐng)域的研發(fā),產(chǎn)生更多有價值的研究成果。模型與基礎(chǔ)算法并非核心競爭壁壘,結(jié)合行業(yè)數(shù)據(jù)的使用才產(chǎn)生巨大的價值。
AI開放策略還將會吸引、培育更多專業(yè)領(lǐng)域人才
福布斯在6月21日發(fā)表了一篇名為《These 20 Leading TechnologistsAreDriving China's AI Revolution》(這20個人領(lǐng)導(dǎo)了中國的人工智能革命)的文章,20位領(lǐng)導(dǎo)者有7人在百度任職,3人曾在百度任職,也就是說,20人一半來自于百度。
百度之所以會成為中國甚至是世界人工智能的黃埔軍校,核心原因就在于這里匯聚了一批優(yōu)秀的“教官”,這些“教官”有自己的一套“教材”,能夠不斷確定標準,并且基于這套“教材”培育出新的人才。
所謂的“教材”其實就是開源人工智能,把自家語言、標準制定出來,作為標準提供給開發(fā)者使用。
谷歌公開自家系統(tǒng)的重要目的之一,就是要是吸引到更多的人工智能專家,來為軟件的改進和應(yīng)用出謀劃策,英國布里斯托大學(xué)的人工智能教授克里斯蒂亞尼曾分析:
“谷歌此舉并不是昏了頭。深度學(xué)習(xí)不是即插即用,它需要做很多測試、調(diào)整和適配工作。這類系統(tǒng)有數(shù)百萬個參數(shù)需要調(diào)整。如果沒有工程師進行這一工作,那么谷歌這次放出的深度學(xué)習(xí)算法用途就極為有限?!?/span>
這樣的分析過程實際上也是在為行業(yè)確定一套通用的語言。當(dāng)然,這套語言是否簡單、易懂,便于操作也是重要因素之一。南寧安卓開發(fā)
所以百度杰出科學(xué)家徐偉曾經(jīng)談到,讓開發(fā)者決定使用哪個平臺進行開發(fā)的決定因素主要包含幾個方面,首先是該平臺能否實現(xiàn)自己想實現(xiàn)的功能,其次是使用某平臺實現(xiàn)起來的難度有多大,最后是效率有多高。
就像對于程序員來說,如果選擇了更為流行的編程語言,就會有更多可使用的庫,也能更輕松的做出好的產(chǎn)品。縱覽程序語言的發(fā)展歷史,最為流行的,總是最容易上手的。就像前文中所說的,百度的優(yōu)勢則在于,它的平臺更容易學(xué)習(xí)。
谷歌、百度、亞馬遜開放自己的平臺,其實也是希望開發(fā)者盡可能使用自己的語言,尤其是這次百度把覆蓋語音、視頻、增強現(xiàn)實、機器人視覺、自然語言處理5大類的14項核心技術(shù)全面開放出來,目的就是在于方便開發(fā)者開發(fā)出優(yōu)秀的產(chǎn)品,甚至讓人才圍繞著自家標準進行開放。
人工智能開源上的競爭,也在重演編程語言的歷史。作為國內(nèi)人工智能領(lǐng)域最早的開源者,百度實際上也是為國內(nèi)所有在人工智能領(lǐng)域的開發(fā)者制定了一套標準。百度舉辦這樣的開發(fā)者大會,不僅僅是在為制定“教材”,更是在為中國人工智能行業(yè)培育人才。