來源:虎嗅
虎嗅注:徐持衡是商湯科技的聯(lián)合創(chuàng)始人、技術(shù)支持總監(jiān)、001號(hào)員工。商湯科技在成立短短4年的時(shí)間里,已經(jīng)獲得了數(shù)輪大額投融資。其中投資方包括IDG、高通、阿里巴巴、淡馬錫、蘇寧等知名公司機(jī)構(gòu)。
徐持衡本人是一位90后學(xué)霸,高二被清華大學(xué)破格簽約錄取,2012年加入香港中文大學(xué)多媒體實(shí)驗(yàn)室實(shí)習(xí)。2014年,商湯科技創(chuàng)始人湯曉鷗教授帶領(lǐng)團(tuán)隊(duì)開發(fā)出深度學(xué)習(xí)模型DeepID,人臉識(shí)別準(zhǔn)確率達(dá)到98.52%,超越人眼97.53%的識(shí)別準(zhǔn)確度。計(jì)算機(jī)人臉識(shí)別準(zhǔn)確率首次超越人眼,突破工業(yè)化紅線的契機(jī)已經(jīng)到來。
在11月24日的虎嗅F&M創(chuàng)新節(jié)上,徐持衡為大家?guī)砹艘粓?chǎng)題為《A.I.讓數(shù)據(jù)創(chuàng)造價(jià)值》的演講,著重以AI從業(yè)者的身份,為現(xiàn)場(chǎng)觀眾講述了AI的過去、現(xiàn)在和未來。尤其是最終AI的作用,徐持衡認(rèn)為:AI的核心在于服務(wù)好每一個(gè)人。
以下內(nèi)容由虎嗅整理自現(xiàn)場(chǎng)速記:
大家好。
今天在科大訊飛后面講壓力非常大,因?yàn)榭拼笥嶏w是一家在人工智能做得非常棒的公司,尤其是在語音和自然語言處理方面。相比之下,商湯科技是專注于計(jì)算機(jī)視覺領(lǐng)域。但有一點(diǎn)很巧,假如我們把生活中的語音加上文字加上圖片加上視頻,這就是我們?nèi)粘I钪凶罱?jīng)常接觸到的數(shù)據(jù)形式。
我今天主要想分享的是《A.I.讓數(shù)據(jù)創(chuàng)造價(jià)值》。我們可以先來看下歷史,回顧到更早的石器時(shí)代,鐵器時(shí)代,到現(xiàn)代的蒸汽時(shí)代,電力時(shí)代,再到我們當(dāng)下的信息時(shí)代,我們發(fā)現(xiàn)每一個(gè)時(shí)代,它都是以當(dāng)下最前沿的技術(shù)來命名的。
所以我們期待下一個(gè)時(shí)代能夠以A.I.來命名,因?yàn)锳.I.能夠給人類社會(huì)帶來極大的突破和創(chuàng)新。參考蒸汽時(shí)代,解決的是動(dòng)力的來源問題,人力被替換為了機(jī)器的動(dòng)力,那么電力時(shí)代其實(shí)解決的是動(dòng)力的傳輸和使用,它能夠讓燈泡發(fā)光,能夠用來做各種的事情。
而我們現(xiàn)在所在的信息時(shí)代,最大的特點(diǎn)是大量的信息數(shù)據(jù)積累,而且信息數(shù)據(jù)的傳輸能力也在不斷升級(jí)。所以對(duì)于A.I.時(shí)代,我們要做的、最重要的一件事情就是要讓數(shù)據(jù)產(chǎn)生價(jià)值。
要繼續(xù)聊這個(gè)問題之前,我們可以再倒回來看看科技進(jìn)步到底給我們帶來了什么?科技進(jìn)步跟藝術(shù)創(chuàng)作它們之間關(guān)聯(lián)是什么樣?在我看來,科技的進(jìn)步帶來的是藝術(shù)創(chuàng)作變得更快了!
相信在座的各位都看過斯坦·李老先生的漫威宇宙系列電影,這是一個(gè)充滿超級(jí)英雄、科幻的主題。今時(shí)今日,去看3D電影是再正常不過的事情,一部3D電影可能有幾萬幀的3D特效構(gòu)成,但是這個(gè)事情放在幾百年前,絕對(duì)是不可想象的。那個(gè)時(shí)代的“3D大作”,是像羅丹《地獄之門》這樣的作品,而羅丹為了這個(gè)作品足足花了37年時(shí)間。相比之下,最新漫威宇宙中的《毒液》,從開拍到上映只花了不到一年的時(shí)間,這兩者都是對(duì)我們想象力最好的體現(xiàn)、最好的藝術(shù)形式的表達(dá),都值得我們?nèi)テ肺逗托蕾p。
不僅創(chuàng)作更容易了,藝術(shù)創(chuàng)作載體也變的更加豐富了,參與的人群更廣了。例如攝影技術(shù)一開始出現(xiàn)的時(shí)候,大家一度認(rèn)為它將對(duì)繪畫市場(chǎng)帶來巨大的打擊,肖像畫的需求可能就沒有那么旺盛了。但是后來,我們發(fā)現(xiàn)數(shù)碼相機(jī)雖然取代了膠卷,但行業(yè)在短暫的“衰落”之后,反而參與其中的人更多了。
不僅大家每一個(gè)人都會(huì)開始拿起手機(jī)拍照,誕生了更多的攝影師,在圖片拍攝之后還需要處理、也就是PS,所以也需要更多的圖片設(shè)計(jì)師。反過來看,實(shí)際上是更多的人參與到了藝術(shù)創(chuàng)作當(dāng)中。
還有一個(gè)很有意思的技術(shù)——3D打印,現(xiàn)在越來越多的中學(xué)生用3D打印技術(shù)進(jìn)行創(chuàng)作,這明顯對(duì)還在大學(xué)念雕塑系的同學(xué)們來說不公平,他們正在面臨來自中學(xué)生的巨大競(jìng)爭,所以現(xiàn)在可以考慮一下是不是該轉(zhuǎn)計(jì)算機(jī)系了。
說一個(gè)題外話,大家總是在探討說人工智能是不是會(huì)顛覆行業(yè),是不是會(huì)替代掉多少的勞動(dòng)力,讓多少人失業(yè)。但就過去幾百年的經(jīng)驗(yàn)來看,那些被技術(shù)改變、被技術(shù)顛覆的行業(yè),最終都獲得了更大的動(dòng)力、更好的活力。
所以我們相信人工智能接下來要顛覆的事情,未來一定也會(huì)給各個(gè)行業(yè)帶來更強(qiáng)的動(dòng)力,更多的職業(yè),甚至更大的繁榮。
當(dāng)下是一個(gè)軟件快速發(fā)展,反過來推動(dòng)硬件發(fā)展的時(shí)代。以蘋果為例,一年頂多推出不到10款iOS設(shè)備,但Apple Store一年的新應(yīng)用數(shù)量就超過70萬個(gè)。在經(jīng)歷了幾十年快速發(fā)展后。摩爾定律已經(jīng)不再有效了,芯片制程從十納米到七納米已經(jīng)舉步維艱,晶體管的密度不再那么容易得到提升。但在這個(gè)趨勢(shì)下,我們可以看到NVIDIA的GPU的出貨量開始變高了。
是因?yàn)榇蛴螒虻娜俗兌嗔藛幔坎皇牵钪匾脑蚴荖VIDIA把GPU的計(jì)算能力開放給了軟件挖掘,讓軟件通過迭代最終實(shí)現(xiàn)效益的最大化。這個(gè)過程也將推動(dòng)人工智能技術(shù)的發(fā)展,以及更廣泛的技術(shù)應(yīng)用和落地。最終,大量的軟件應(yīng)用將會(huì)改變我們的生活。
而事實(shí)上,軟件的意義就是讓人與信息產(chǎn)生關(guān)聯(lián),除了滿足我們的好奇心之外,它們也在改變我們的生活、融入我們的生活,最終改變我們身邊所有的事情的發(fā)展。最簡單的,現(xiàn)在衣食住行都有APP,人們通過APP能夠在一個(gè)數(shù)字化的世界里沒有障礙地互相觸達(dá)。
以共享出行為例,現(xiàn)在我們可以通過APP直接約到一輛車,而且這輛車有可能是路面任意一輛閑置的運(yùn)營車輛,你還可以和司機(jī)直接約定上車地點(diǎn),并且實(shí)時(shí)看到車所處的位置。這極大化地降低了人找車和車找人這兩個(gè)過程的復(fù)雜性。
在用戶、司機(jī)看來,對(duì)象有可能是車、也有可能是人,但他們實(shí)際上他們分享出來的是數(shù)據(jù)。背后還有各種算法,能夠把路面上閑置的車輛跟你的需求做一個(gè)關(guān)聯(lián)和匹配,最后引導(dǎo)著兩邊形成商業(yè)價(jià)值。
所以我認(rèn)為現(xiàn)在推動(dòng)社會(huì)向前發(fā)展的就是萬物數(shù)據(jù)化,因?yàn)槲磥淼娜f事萬物都必將變成數(shù)據(jù)。
在這個(gè)過程中,有很多數(shù)據(jù)需要通過計(jì)算機(jī)視覺的方法來消化和理解。舉個(gè)例子,我們看的很多視頻數(shù)據(jù),大多數(shù)的消費(fèi)者還是人。比如我們特別喜歡看運(yùn)動(dòng)類的視頻,這些運(yùn)動(dòng)類的視頻,我們能夠在里頭看到他的競(jìng)技,看到它的競(jìng)爭。
但是對(duì)于計(jì)算機(jī)來講,它只是幀的畫面,每一幀畫面每一個(gè)像素RGB到底是什么樣的值,所以我們需要教會(huì)計(jì)算機(jī)去理解去看到這里面發(fā)生的事情,這里面的主體是什么?理解這里面結(jié)構(gòu)化的信息。
最終,我發(fā)現(xiàn),我們要做的事情,非常像小時(shí)候趙忠祥老師給我們解說《動(dòng)物世界》一般,在《動(dòng)物世界》里面有什么動(dòng)物,然后發(fā)生了什么事情,有什么場(chǎng)景。如果沒有這些解說,相信大多數(shù)人會(huì)看不明白。
而我們現(xiàn)在在教計(jì)算機(jī)去做的,就是讓計(jì)算機(jī)去理解視頻中它的主體是什么,發(fā)生了什么事情,這些都賦予了視頻新的意義。到今天為止,我們教計(jì)算機(jī)去理解的視頻,包括電視劇,包括運(yùn)動(dòng)視頻,也包括更廣泛的視頻書數(shù)據(jù)和內(nèi)容,這些視頻數(shù)據(jù)內(nèi)容可能對(duì)大家來講沒有那么吸引,但它們內(nèi)在都有大量的價(jià)值,也就是說有有效信息可以去挖掘。這是順應(yīng)了剛剛講到的萬物數(shù)據(jù)一個(gè)趨勢(shì),也是人工智能能夠得到快速的普及和應(yīng)用的原因之一。
我們一直講數(shù)據(jù)是人工智能非常重要的一環(huán),但在我看來,其實(shí)人工智能貫穿了數(shù)據(jù)的理解,認(rèn)知,采集到最后決策的整個(gè)鏈條。所以在萬物數(shù)據(jù)化之上,實(shí)際就是萬物智能化。
到今天為止,我們的物理所有權(quán)形態(tài)已經(jīng)發(fā)生了很大的轉(zhuǎn)變。以前一個(gè)東西在我手上,我可以用它做任何的事情,但到今天我們發(fā)現(xiàn)路邊停了大量的單車,我可能沒有辦法騎走它,但我可以通過APP掃碼解鎖這輛車。這個(gè)過程中,現(xiàn)實(shí)世界的物理權(quán)限和虛擬世界的軟件權(quán)限管理,實(shí)際上已經(jīng)結(jié)合到了一起。
我們?cè)賮砜词謾C(jī),你現(xiàn)在隨便拿起別人的新手機(jī),你拿起的同時(shí)實(shí)際上手機(jī)也在“看”你,分辨你是不是它的主人,如果你不是真正的主人,那你就只能看到鎖屏上的時(shí)間信息。只有它認(rèn)出來你是它的主人,你才能操控所有的功能。這背后的技術(shù)基礎(chǔ),就包括了商湯科技的人臉識(shí)別技術(shù)。
未來很多涉及到權(quán)限的場(chǎng)景,都可以通過人臉識(shí)別來改變,因?yàn)槿四樃袷擒浖械蔫匙,它是多對(duì)多的憑證,而且你還會(huì)隨時(shí)把它帶在身邊。所以大家未來完全不需要在身上帶更多的鑰匙,因?yàn)槟阕约壕褪亲詈玫?ldquo;鑰匙”。
既然是多對(duì)多的“鑰匙”,那么鑰匙權(quán)限的管理也將變得尤為重要,但我相信這一個(gè)概念將會(huì)在更廣泛的事物中不斷涌現(xiàn),最終讓我們和生活中萬物的交互變得更加自然。
講完了人與機(jī)器之間的交互,我們來講一講機(jī)器與環(huán)境之間的交互。剛剛百度的同事也講到了我們無人駕駛技術(shù)的發(fā)展,這幾年無人駕駛技術(shù)發(fā)展得非常的快。但我們目前還沒有完全解決信息傳遞的問題。
假如車輛本身知道馬路上的所有信息,例如前后車如何做決策,即將是要?jiǎng)x車、減速這種程度的信息,我相信自動(dòng)駕駛的技術(shù)迭代將會(huì)變得更快,無人駕駛的機(jī)會(huì)也將很快來到。但我們現(xiàn)有的實(shí)際路面情況是真的很復(fù)雜,所以我們必須先通過計(jì)算機(jī)視覺技術(shù),盡可能地去挖掘里面有價(jià)值的信息。
我們給自動(dòng)駕駛車裝上一堆RGB攝像頭和毫米波雷達(dá)、激光雷達(dá),我們可以識(shí)別路牌、路燈、識(shí)別車道線、識(shí)別可行駛區(qū)域,前車行人等等,甚至我們?cè)谟脭?shù)據(jù)去預(yù)測(cè)人和車的軌跡,預(yù)測(cè)他們會(huì)不會(huì)穿越橫線,會(huì)不會(huì)變道。這些嘗試,將會(huì)成為未來實(shí)現(xiàn)無人駕駛過程中關(guān)鍵性的決策組成。
我在今天之前,的確沒有來過751 Park這個(gè)場(chǎng)地,說老實(shí)話這個(gè)場(chǎng)地跟我想象的不太一樣,還好我跟著導(dǎo)航走到了正確的位置。但現(xiàn)實(shí)中很多用戶真的是看不懂導(dǎo)航中地圖指示,所以前不久我們聯(lián)合OPPO、高德地圖推出了AR步行導(dǎo)航。你可以讓吉祥物小歐出現(xiàn)在街道實(shí)景上,這種無縫的融合,最終目的是引導(dǎo)你,指引你前往目的地,把導(dǎo)航過程中的決策和指示變得更加直接
這種以前不敢想象的事情,都已經(jīng)實(shí)現(xiàn)了,如果我們繼續(xù)把大量的數(shù)據(jù)和大量的新技術(shù)結(jié)合在一起,完全可以構(gòu)建出一個(gè)更加智能化,更加智慧的一個(gè)生活空間。就商湯科技自己而言,就是希望我們的技術(shù)能力會(huì)賦予每一個(gè)參與者,讓他們體會(huì)到技術(shù)更新、進(jìn)步帶來的體驗(yàn)升級(jí)。
我在這再展示一個(gè)例子,有一個(gè)女士把包丟了。因?yàn)槭窃诠矃^(qū)域,我們就先來尋找她自己的足跡,把她在監(jiān)控中的片段都找出來,然后我們?cè)偃ケ葘?duì)包的特征。我們可以看到某一個(gè)時(shí)刻之后,她的包就不見了,再經(jīng)過簡單查詢我們可以發(fā)現(xiàn),她實(shí)際上是自己一個(gè)馬虎把包忘了。
但包現(xiàn)在的確已經(jīng)不見了,所以我們把包變成跟蹤的對(duì)象,很明顯能看到一位男士坐在了包旁邊,然后被他拎走了。雖然我們不知道這位男士的身份,但是憑借他身體的姿態(tài)和形態(tài),再加上人臉的特征,我們就可以繼續(xù)在這個(gè)區(qū)域去尋找他的軌跡,找到之后就可以物歸原主了。
這個(gè)過程,在原來是完全依靠人力的,也就是把所有攝像頭的數(shù)據(jù)調(diào)出來幾個(gè)人一起查看,而現(xiàn)在實(shí)際上只需要幾臺(tái)電腦一小會(huì)兒就能完成。這其中人力物力的消耗,被極大化地降低了。
這項(xiàng)技術(shù)還容易開發(fā)出其他一些用途,例如特別關(guān)注公共區(qū)域的老人和小孩。小孩目前的位置在哪里,他的軌跡是怎么樣的,是否有跟家里人走丟?又或者是對(duì)公共區(qū)域的大型犬類進(jìn)行監(jiān)控,在發(fā)現(xiàn)有人不栓狗繩的情況下派人去提醒。
所以在最后,我想跟大家探討一點(diǎn),人工智能到底給人類帶來了什么?我認(rèn)為人工智能給人類帶來的,是給予每一個(gè)人應(yīng)有的關(guān)注和關(guān)懷,而不只是解放生產(chǎn)力這么宏觀的概念。
例如將來的某一天,我們已經(jīng)不再需要司機(jī)了,因?yàn)槎家呀?jīng)實(shí)現(xiàn)自動(dòng)駕駛了,路上任何一輛車都可以是你的車。上學(xué)也將變得更加簡單了,我們可以通過人工智能進(jìn)行教學(xué);醫(yī)療也變得更加簡單,人工智能會(huì)監(jiān)控你的身體直接給出初步的預(yù)警和診斷。正因?yàn)槿斯ぶ悄苣軌驅(qū)崿F(xiàn)很多人類才能完成的基礎(chǔ)工作,我們現(xiàn)有的社會(huì)稀缺資源,將會(huì)和機(jī)器結(jié)合起來,為更廣泛的人提供基礎(chǔ)服務(wù),同時(shí)為更多的人提供高等級(jí)服務(wù)。
所以最終,人工智能還應(yīng)該專注于服務(wù)在座、以及我們身邊每一個(gè)人。
這個(gè)時(shí)候我們倒回來看,人工智能到底給社會(huì)帶來最大的改變是什么?帶來的是更大的、更高的效率,更大的產(chǎn)能嗎?不是,我認(rèn)為,人工智能帶來的最重要東西,是人類公平生活的權(quán)利。這就是我今天分享的內(nèi)容,我們是商湯科技,堅(jiān)持原創(chuàng),我們相信AI將引領(lǐng)人類前進(jìn),謝謝。
推薦閱讀
劉立榮承認(rèn)賭輸10多億 金立倒下的根本原因是“一直在虧錢”
深陷賭博輿論漩渦的金立董事長劉立榮,在接受媒體采訪中,正式承認(rèn)了自己曾去塞班島賭博的事實(shí),但否認(rèn)了賭輸100億元的傳聞,稱只輸了10多億元。同時(shí),他也首次向外界透>>>詳細(xì)閱讀
本文標(biāo)題:商湯科技徐持衡:AI的核心在于服務(wù)好每一個(gè)人
地址:http://www.sdlzkt.com/a/daohang/307839.html