現(xiàn)有的基于統(tǒng)計翻譯的在線工具如巴比魚和Google翻譯,翻譯的結(jié)果勉強可用,但離完美還相去甚遠。現(xiàn)在,Google工程師在預印本網(wǎng)站上發(fā)表論文,介紹了一種不依賴于統(tǒng)計翻譯的新技術(shù)。他們的方法是將語言翻譯變成向量空間數(shù)學問題,利用數(shù)據(jù)挖掘技術(shù)建模一種語言的結(jié)構(gòu),然后與另一種語言的結(jié)構(gòu)進行對比。

新的方法是基于一個概念,即每一種語言都有一套相似的理念,因而使用單詞的方式也存在相似性。例如,大多數(shù)語言中都有描述相同動物的單詞,如狗、貓和牛,這些單詞很可能以相同的方式在句子中使用,如“貓是一種比狗小的動物”。語言中單詞之間的關(guān)系集合被稱為“語言空間”,可類比為一個點到另一個點的向量集合,能以數(shù)學的方式進行處理,例如王減去男性加上女性等于女王(‘king’–‘man’+‘woman’=‘queen’)。在向量空間中,許多語言都有共通之處,可以利用向量空間線性變換將一種語言翻譯成另一種語言。Google工程師表示,新的方法非常有效。
推薦閱讀
[圖]土豪快看:113萬美元可買完蘋果App Store付費應(yīng)用
大家有沒有想過這樣一個問題:如果把蘋果應(yīng)用程序商店中的所有(付費>>>詳細閱讀
本文標題:Google工程師將語言翻譯變成向量空間數(shù)學問題
地址:http://www.sdlzkt.com/a/05/20130930/289048.html

網(wǎng)友點評
精彩導讀
科技快報
品牌展示