揭秘iPhone4S語音識(shí)別系統(tǒng)

作者: 來源:IT新聞網(wǎng) 2012-12-29 04:25:04 閱讀 我要評(píng)論 直達(dá)商品

Siri和以前公眾使用過的所有產(chǎn)品都不相同。你說的話可以和你想表達(dá)的意思在字面上毫不相干,從嚴(yán)格的技術(shù)上看也似乎是文不對(duì)題,但Siri會(huì)根據(jù)上下文、人類歷史以及能夠理解一般人類語言的人工智能去分析,并在多數(shù)情況下領(lǐng)會(huì)你的意思。

不久前,蘋果公司宣布下一代iPhone將啟用一項(xiàng)新的語音識(shí)別系統(tǒng):Siri。關(guān)于它的簡(jiǎn)介和部分發(fā)布會(huì)演示照片請(qǐng)參看果迷網(wǎng)之前的《Siri智能語音識(shí)別,iPhone 4S能夠聽懂你的話》一文。Cult of Mac則對(duì)Siri進(jìn)行了一番深入的解析,看過此文或許能讓你更有理由相信,人工智能已經(jīng)走進(jìn)我們的生活。

說道Siri,這是一道硬菜。可在Android上,這個(gè)功能一年前就有了,蘋果不過是想在這方面“不輸他人”,而且其功能也并非如此強(qiáng)大。對(duì)吧?

錯(cuò)。除了它確實(shí)是一道硬菜以外,其他的都錯(cuò)。

其實(shí),Siri是十年內(nèi)移動(dòng)平臺(tái)上最重要的事件之一。

對(duì)Siri持否定看法的人一般會(huì)分成兩個(gè)陣營(yíng):一邊會(huì)說它沒什么了不起的;另一邊會(huì)說Android上之前已經(jīng)有了。這兩方的說法都不正確。

Siri的意義相當(dāng)重大

我們不妨先從Siri的血統(tǒng)說起。Siri直接發(fā)端于史上最大的人工智能項(xiàng)目:五角大樓的CALO項(xiàng)目。CALO是“Cognitive Assistant that Learns and Organizes”的縮寫(會(huì)學(xué)習(xí)和組織的認(rèn)知助理),這個(gè)項(xiàng)目匯聚了全球人工智能方面的頂尖科研人員。

整個(gè)CALO計(jì)劃的帶頭人名叫Adam Cheyer,他現(xiàn)在也是蘋果iPhone團(tuán)隊(duì)的工程總監(jiān)。

在《麻省理工技術(shù)評(píng)論》的采訪中,Cheyer說CALO早已開始探索如何把“對(duì)話、自然語言理解、視覺、演說、機(jī)器學(xué)習(xí)、制定計(jì)劃、理性思考、服務(wù)代表全部融合到一個(gè)??模仿人類的助理中,幫助人們完成不同的事情。”

他形容說Siri計(jì)劃就是尋求在一件消費(fèi)產(chǎn)品中做同樣的事情。其實(shí),在過去的四年里,Cheyer和他的團(tuán)隊(duì)一直在鉆研如何優(yōu)化CALO,使其能夠在一臺(tái)強(qiáng)大的移動(dòng)電話中發(fā)揮效用,每天都能被成千上萬的用戶使用。在過去一年半中,他們把主要精力放在Siri技術(shù)和iOS及其應(yīng)用程序的整合上。

它不是單純的“聲音識(shí)別”。它是人工智能。當(dāng)人工智能進(jìn)入了你的手機(jī),難道意義還不夠重大?

Siri和Voice Actions是兩碼事

Android系統(tǒng)的Voice Actions也是一項(xiàng)偉大的技術(shù),并已經(jīng)被許多Android用戶所熟知和使用。但說真的,它和Siri不是同一個(gè)層面的產(chǎn)品。

Voice Actions提供了非常堅(jiān)實(shí)可靠的聲音識(shí)別引擎,它的高識(shí)別度把曾經(jīng)一度流行的語音識(shí)別工具都比了下去。

不過,和過去的所有語音命令系統(tǒng)一樣,它要求你說的話嚴(yán)格符合一系列特定的語法,否則它就無法理解。

Siri和以前公眾使用過的所有產(chǎn)品都不相同。你說的話可以和你想表達(dá)的意思在字面上毫不相干,從嚴(yán)格的技術(shù)上看也似乎是文不對(duì)題,但Siri會(huì)根據(jù)上下文、人類歷史以及能夠理解一般人類語言的人工智能去分析,并在多數(shù)情況下領(lǐng)會(huì)你的意思。

打個(gè)比方,你想小睡一會(huì),并準(zhǔn)備上個(gè)鬧鐘,只需要說“20分鐘后叫醒我”。如果你想查閱后面的日程安排,你可以說:“我今天接下來都有什么事?”

這些語句中既不包括會(huì)用到的應(yīng)用程序名稱,也不包括所需數(shù)據(jù)的名稱。Siri仍然能夠理解。

對(duì)人類而言,這些句子再平常不過了。但要讓機(jī)器去理解這些變化多端的棘手詞匯,就是人工智能的圣杯了。

而更加人性化的特點(diǎn)是,一旦你開始和Siri進(jìn)入一段對(duì)話,它甚至能理解許多含義模糊或者引申的語義。比如,你可以問它:“步行范圍內(nèi)有沒有什么頂尖的意大利餐館?”如果Siri查詢后回答“沒有”的話,你可以說:“那墨西哥的呢?”Siri會(huì)將你的這個(gè)問題連同上文的“頂尖的餐館”和“步行范圍”一道進(jìn)行理解。

Android的Voice Actions做不到這樣的事情,因?yàn)樗且粋(gè)聲控命令軟件,而并非人工智能。

Siri有時(shí)會(huì)為你顯示網(wǎng)頁搜索的結(jié)果,有時(shí)能替你執(zhí)行一些操作,有時(shí)能夠直接控制iPhone里的應(yīng)用程序。

而且Siri同樣能夠回答問題,這要?dú)w功于它整合的Wolfram-Alpha。你可以隨機(jī)提問:“30英里是多少公里?”,“巴黎現(xiàn)在幾點(diǎn)?”,“鋼琴上有多少個(gè)八度?”,或者“天空為何是藍(lán)色的?”Siri能夠直接回答這些問題。不是唰地顯示一個(gè)網(wǎng)頁。就是回答你的問題。

關(guān)于Siri,重中之重是什么?

從歷史和文明的角度來看,關(guān)于Siri,最偉大的事情并非人工智能本身。而是蘋果通過Siri把人工智能帶進(jìn)了現(xiàn)實(shí)生活中。

理由就是:蘋果將Siri做成了iPhone的一個(gè)核心組成部分,并且讓它作為手機(jī)使用的主流,讓每個(gè)用戶都覺得除了使用很方便之外,更想時(shí)時(shí)刻刻都嘗試使用它。

提到“主流”,我指的是撿起那些被人類文明邊緣化了的東西,并使其成為大量人群每日生活的一部分。現(xiàn)在,Google出品的Voice Actions不得不面臨被邊緣化的境地。一般人甚至都沒聽說過它。

Siri會(huì)成為主流的。人們會(huì)逐漸熟知它,甚至包括非iPhone用戶。

愛迪生并不是發(fā)明燈泡的人。他是通過產(chǎn)品設(shè)計(jì)和市場(chǎng)營(yíng)銷,將燈泡變?yōu)橹髁鞯娜恕?/p>

福特并不是發(fā)明汽車的人。他是通過控制成本和市場(chǎng)營(yíng)銷,將汽車變?yōu)橹髁鞯娜恕?/p>

我們總是記住那些將事物變成主流的人,因?yàn)檎沁@些人和公司讓科學(xué)技術(shù)真正融入每個(gè)人每天的生活。于是,說道燈泡,它就溯源于愛迪生;說道汽車,它就溯源于福特。

Google的Voice Actions并非人工智能,雖說它確實(shí)讓用戶省去了打字輸入、觸摸操作的工序,只需要使用聲音去控制機(jī)器就可以完成一系列事情。但是,Voice Actions最終沒有讓聲控成為主流。或許一些極客們會(huì)學(xué)著使用它吧。

然而,媽媽們會(huì)選擇Siri。

And One More Thing(還有一件事)

iPhone 4S也許會(huì)成為第一款支持藍(lán)牙4.0的手機(jī),這項(xiàng)技術(shù)可以降低能耗,同時(shí)可以做到一件非常特別的事:?jiǎn)拘言O(shè)備。

如果把Siri和這項(xiàng)無線技術(shù)結(jié)合起來,其使用范圍就更加廣泛了。例如,可以想象你戴著一款“超長(zhǎng)待機(jī)”手表,它會(huì)一直睡眠,你觸摸它才會(huì)顯示時(shí)間,或者在iPhone收到短信時(shí),手表會(huì)被Siri喚醒。你如果要和Siri交談,只需要對(duì)著手表說話就可以了,甚至連手機(jī)都不用掏出來。

同樣,可以試想一下,有這么一款桌面麥克風(fēng),當(dāng)你說話時(shí)會(huì)喚醒iPhone,就像《星際迷航》里那樣不用按任何按鈕直接說話,并從企業(yè)號(hào),呃我是說iPhone的人工智能,得到回應(yīng)。

那么讓我們來總結(jié)一下Siri對(duì)于人類而言意味著什么。Siri是人機(jī)交互新紀(jì)元的黎明,是大眾進(jìn)入真正的人工智能時(shí)代的開端。

當(dāng)然,目前它尚未達(dá)到完美,蘋果目前將其定位在“beta”階段。并且,它也還不是你在科幻電影里看到的那種無限高能的人工智能。

但它的步伐遠(yuǎn)未停止。iPhone 4S里的Siri只是一個(gè)開端。相信以后會(huì)有更加復(fù)雜的版本出現(xiàn)。

Google、微軟和其他公司也終會(huì)拿出自己的人工智能產(chǎn)品的(并且我預(yù)言就是按照這個(gè)排序)。

所以,一旦你最終和Siri搭上話了,請(qǐng)善待它。Siri具有非常非常重大的現(xiàn)實(shí)意義,和以往任何產(chǎn)品都不同。它能夠代表計(jì)算機(jī)發(fā)展的一個(gè)新紀(jì)元。當(dāng)然,它會(huì)讓每個(gè)人都“說”起來的。


  推薦閱讀

  一條短消息揪出144部被盜手機(jī)

民警立即逐一對(duì)手機(jī)進(jìn)行檢查,結(jié)果發(fā)現(xiàn)其中一部手機(jī)中還存有這樣一條短信,“你偷了我的手機(jī),要不立即還給我,我就報(bào)警>>>詳細(xì)閱讀


本文標(biāo)題:揭秘iPhone4S語音識(shí)別系統(tǒng)

地址:http://www.sdlzkt.com/a/01/20121229/106065.html

樂購科技部分新聞及文章轉(zhuǎn)載自互聯(lián)網(wǎng),供讀者交流和學(xué)習(xí),若有涉及作者版權(quán)等問題請(qǐng)及時(shí)與我們聯(lián)系,以便更正、刪除或按規(guī)定辦理。感謝所有提供資訊的網(wǎng)站,歡迎各類媒體與樂購科技進(jìn)行文章共享合作。

網(wǎng)友點(diǎn)評(píng)
我的評(píng)論: 人參與評(píng)論
驗(yàn)證碼: 匿名回答
網(wǎng)友評(píng)論(點(diǎn)擊查看更多條評(píng)論)
友情提示: 登錄后發(fā)表評(píng)論,可以直接從評(píng)論中的用戶名進(jìn)入您的個(gè)人空間,讓更多網(wǎng)友認(rèn)識(shí)您。
自媒體專欄

評(píng)論

熱度

主站蜘蛛池模板: 成人免费视频网| 色噜噜狠狠成人网| 黄色成人免费网站| 日韩国产欧美成人一区二区影院| 日韩精品无码成人专区| 2345成人高清毛片| 成人午夜私人影院入口 | 国产成人精品免费视频软件| 亚洲综合成人网| 欧美在线成人午夜网站| 成人免费一区二区三区| 亚洲av无码成人网站在线观看| 成人午夜性a一级毛片美女| 免费国产成人高清视频网站| 成人欧美1314www色视频| 国产成人av免费观看| 成人欧美一区二区三区| 97久久精品国产成人影院| 国产成人精品999在线观看| 青青国产成人久久激情91麻豆| 午夜视频免费成人| 伊人色院成人蜜桃视频| 国产成人综合久久精品下载| 成人综合在线视频免费观看完整版 | 欧美成人亚洲欧美成人| 亚洲av无码成人网站在线观看| 国产成人精品A视频一区| 国产成人精品午夜福利| 国产精品成人第一区| 成人福利网址永久在线观看| 欧美成人精品一区二区| 久久成人福利视频| 久久久久99精品成人片直播| 亚洲成人在线免费观看| 亚洲综合在线成人一区| 中文字幕人成人乱码亚洲电影 | 国产成人精品视频一区二区不卡| 成人永久福利在线观看不卡| 成人性一级视频在线观看| 成人做受120秒试看动态图| 国产成人高清视频|