自電視機(jī)問(wèn)世80多年以來(lái),顯示技術(shù)的不斷革新,從黑白到彩色、從2D到3D、從標(biāo)清到超高清,呈現(xiàn)的畫面越來(lái)越精美,然而似乎卻越來(lái)越難以將大眾留在電視機(jī)前,這與互聯(lián)網(wǎng)時(shí)代內(nèi)容來(lái)源的爆發(fā)有關(guān),豐富而個(gè)性化的內(nèi)容通過(guò)網(wǎng)絡(luò)呈現(xiàn)。實(shí)際上,并非人們不愛(ài)看電視,而是由于大多數(shù)人白天忙碌沒(méi)有時(shí)間看電視,只剩下碎片化時(shí)間,因此移動(dòng)小屏更符合人們的需求,讓交互形式局限在用遙控器切換頻道的傳統(tǒng)電視開(kāi)始變得與用戶愈加疏遠(yuǎn)。
早在六年前就開(kāi)始發(fā)力電視語(yǔ)音交互的長(zhǎng)虹,在10月12日再次帶來(lái)了劃時(shí)代的人工智能CHiQ電視5K,這次在成都舉辦的品鑒會(huì),將其遠(yuǎn)場(chǎng)語(yǔ)音、聲紋識(shí)別、模糊檢索三大核心賣點(diǎn)展示的淋漓盡致,尤其是長(zhǎng)虹首次在人工智能電視行業(yè)應(yīng)用的聲紋識(shí)別技術(shù),更是與同行業(yè)競(jìng)爭(zhēng)對(duì)手拉開(kāi)差距的關(guān)鍵技術(shù)。
聲紋識(shí)別賦予電視辨識(shí)家庭成員的能力
聲紋識(shí)別技術(shù),顧名思義,就是可以識(shí)別發(fā)出語(yǔ)音指令者的具體身份特質(zhì),再根據(jù)每個(gè)人的選擇喜好、觀看歷史,推薦音視頻節(jié)目。而其他競(jìng)品的語(yǔ)音識(shí)別功能,還停留在忽略語(yǔ)音指令由誰(shuí)發(fā)出的這一關(guān)鍵問(wèn)題,僅僅根據(jù)歷史瀏覽和語(yǔ)義理解來(lái)實(shí)現(xiàn)節(jié)目推薦,然而這對(duì)于家庭用戶而言,卻是最不該忽略的一環(huán),在當(dāng)前人工智能電視的技術(shù)中,用戶行為畫像被列為基礎(chǔ)數(shù)據(jù)之一,而不能夠?qū)彝コ蓡T進(jìn)行細(xì)分,將大大降低用戶行為分析的準(zhǔn)確度。

在品鑒會(huì)現(xiàn)場(chǎng),CHiQ電視產(chǎn)品經(jīng)理陳科宇與另一位女嘉賓扮演起家庭成員的角色,當(dāng)說(shuō)出“我要看電影”的指令時(shí),CHiQ智能電視給出的推薦片源并不相同,而且界面亦根據(jù)聲紋識(shí)別選擇了不同的圖案色彩,成年男性、女性和兒童的界面及推薦結(jié)果都分別對(duì)應(yīng)其性格特征和觀看習(xí)慣,而當(dāng)從未使用過(guò)這臺(tái)電視的嘉賓開(kāi)口時(shí),CHiQ識(shí)別到這是一個(gè)陌生人,因此只按系統(tǒng)默認(rèn)推薦了視頻。
陳科宇介紹到,長(zhǎng)虹應(yīng)用國(guó)際前沿的I-vector技術(shù)為聲紋建模,同時(shí)借助云計(jì)算平臺(tái),建立起每個(gè)家庭成員獨(dú)一無(wú)二的聲紋數(shù)據(jù)庫(kù),能夠在家庭應(yīng)用環(huán)境中快速精準(zhǔn)地實(shí)現(xiàn)家庭成員的身份識(shí)別,識(shí)別率超過(guò)90%。
據(jù)了解,達(dá)到如此出色識(shí)別率并不容易,長(zhǎng)虹聲紋識(shí)別項(xiàng)目組在開(kāi)發(fā)過(guò)程中遇到了不少困難,在項(xiàng)目初期,聲紋數(shù)據(jù)少是面臨的主要困難之一,無(wú)法對(duì)建立的模型進(jìn)行有效的驗(yàn)證及訓(xùn)練。而聲紋識(shí)別算法需要在足夠多的訓(xùn)練數(shù)據(jù)的條件下,才能夠準(zhǔn)確地學(xué)習(xí)到不同說(shuō)話人之間差異性。為此,項(xiàng)目組的每一個(gè)成員每天按時(shí)拿著遙控器,不停的呼喊“長(zhǎng)虹小白…我要看…我想看…”,一遍、兩遍…無(wú)數(shù)遍,日復(fù)一日地采集聲紋樣本。
有了足夠多的數(shù)據(jù),聲紋識(shí)別算法的設(shè)計(jì)開(kāi)始變得更為重要。此前項(xiàng)目組的技術(shù)積累主要在圖像識(shí)別領(lǐng)域,并沒(méi)有語(yǔ)音相關(guān)領(lǐng)域的經(jīng)驗(yàn),因此算法的設(shè)計(jì)尤為艱辛。項(xiàng)目組核心成員吳郢教授身在美國(guó),每周都會(huì)定時(shí)兩次通過(guò)視頻會(huì)議和國(guó)內(nèi)的項(xiàng)目組成員討論,經(jīng)過(guò)三個(gè)月左右的努力,終于完成了算法的設(shè)計(jì)、服務(wù)器的部署,并成功交付。
模糊搜片和遠(yuǎn)場(chǎng)語(yǔ)音 讓人工智能更親切
現(xiàn)在許多人工智能電視以遙控器內(nèi)置麥克風(fēng)采集用戶語(yǔ)音指令,這讓語(yǔ)音交互的連貫性大打折扣,而CHiQ5K配備集成式陣列麥克風(fēng),實(shí)現(xiàn)5米范圍內(nèi)的遠(yuǎn)場(chǎng)語(yǔ)音采集,并且能夠?qū)崿F(xiàn)語(yǔ)音開(kāi)關(guān)機(jī),從打開(kāi)電視到完成節(jié)目播放,全程無(wú)需遙控器,只通過(guò)語(yǔ)音控制即可實(shí)現(xiàn)。
計(jì)算機(jī)可以在精確的指令下完成各種任務(wù),而人工智能的價(jià)值在于識(shí)別自然對(duì)話和不那么精準(zhǔn)的指令,長(zhǎng)虹CHiQ5具備的模糊搜片能力,帶來(lái)了強(qiáng)大的相關(guān)性分析和糾錯(cuò)能力,即便用戶表達(dá)不夠準(zhǔn)確,也能夠呈現(xiàn)用戶希望的影視資源。
以模糊檢索功能為例,用戶在點(diǎn)播視頻的時(shí)候,不慎將《羋月傳》中的“羋”字按錯(cuò),打成了“半”字,這時(shí)候電視機(jī)智能系統(tǒng)可以自行判別,并根據(jù)用戶大數(shù)據(jù)進(jìn)行關(guān)鍵詞糾錯(cuò),從而將點(diǎn)播節(jié)目定位到《羋月傳》上。
對(duì)于這一功能的實(shí)現(xiàn),陳科宇談到“具有這樣的交互功能需要技術(shù)體系的協(xié)同支撐,在人工智能電視Q5K的身后,有基礎(chǔ)數(shù)據(jù)平臺(tái)、語(yǔ)義平臺(tái)、用戶畫像平臺(tái)和媒資匯聚平臺(tái)進(jìn)行支撐。電視具有語(yǔ)義理解算法、檢索算法、推薦算法、數(shù)據(jù)挖掘算法四種算法系統(tǒng)。同時(shí)還有設(shè)備控制協(xié)議、基礎(chǔ)應(yīng)用管理協(xié)議、數(shù)據(jù)查詢協(xié)議和算法功能協(xié)議。擁有如此技術(shù)系統(tǒng)支撐的人工智能電視Q5K具有強(qiáng)交互、可成長(zhǎng)、可思考、可廣泛協(xié)同其他設(shè)備的特點(diǎn)。”
聲紋識(shí)別、遠(yuǎn)場(chǎng)語(yǔ)音、模糊搜片,看起來(lái)簡(jiǎn)單精煉的三個(gè)特質(zhì),背后凝聚了長(zhǎng)虹人多年研發(fā)成果的積淀,長(zhǎng)虹新一代人工智能電視Q5K的推出,刷新中國(guó)在世界人工智能領(lǐng)域的技術(shù)新高度,確立人工智能電視的技術(shù)新標(biāo)桿,為電視這一傳統(tǒng)家庭娛樂(lè)中心帶來(lái)了革命性的交互體驗(yàn)。
推薦閱讀
長(zhǎng)虹CHiQ電視聲紋識(shí)別更懂你 確定人工智能電視的技術(shù)新標(biāo)桿
圍繞著“更懂你”的人工智能電視消費(fèi)需求和自身創(chuàng)新追求,長(zhǎng)虹電視始終拼殺在AI電視的最前沿,每一次的產(chǎn)品升級(jí)或新品發(fā)布似乎都能引起世人巨大的驚嘆。10月>>>詳細(xì)閱讀
本文標(biāo)題:全球首款聲紋識(shí)別人工智能電視上市 長(zhǎng)虹再度掀起交互革命
地址:http://www.sdlzkt.com/a/05/304568.html