中國機器翻譯發(fā)展迅猛 系統(tǒng)在不斷擴(kuò)大
2013/1/6 11:39:55
機器翻譯的研究是建立在語言學(xué)、數(shù)學(xué)和計算機科學(xué)這3門學(xué)科的基礎(chǔ)之上的。語言學(xué)家提供適合于計算機進(jìn)行加工的詞典和語法規(guī)則,數(shù)學(xué)家把語言學(xué)家提供的材料形式化和代碼化,計算機科學(xué)家給機器翻譯提供軟件手段和硬件設(shè)備,并進(jìn)行程序設(shè)計。缺少上述任何一方面,機器翻譯就不能實現(xiàn),機器翻譯效果的好壞,也完全取決于這3個方面的共同努力。
沈陽格微軟件有限責(zé)任公司的發(fā)明格微協(xié)同翻譯平臺在不到一年的時間里,輕松完成超過2億漢字的翻譯任務(wù),這是一家一家百人規(guī)模的翻譯公司需要8至10年才能完成。更令人驚嘆的是,如此快的速度,差錯率遠(yuǎn)低于國家翻譯質(zhì)量標(biāo)準(zhǔn),被人們稱為“翻譯機器人”。
經(jīng)過十多年的艱難研究,張桂平的研發(fā)團(tuán)隊走過了自動翻譯、詞典翻譯、輔助閱讀、輔助翻譯、全過程輔助的研發(fā)歷程,又開發(fā)起知識管理與機器翻譯的融合技術(shù)。
格微協(xié)同翻譯平臺主要包括協(xié)同翻譯系統(tǒng)、協(xié)同質(zhì)檢系統(tǒng)、協(xié)同校對系統(tǒng)、知識管理系統(tǒng)、任務(wù)管理系統(tǒng)和系列輔助工具包等,內(nèi)含術(shù)語資源超過2600萬條、雙語資源超過900萬句對,平均翻譯效率可提高2至4倍。
格微協(xié)同翻譯平臺的研發(fā)和應(yīng)用,為實施大規(guī)模工程科技資料翻譯工作提供了必要保障,在國防重大引進(jìn)工程、百萬專利翻譯工程、航空民用大飛機專項、新一代航空發(fā)動機專項、航天的高分辨率圖像處理專項及裝備制造業(yè)等多領(lǐng)域發(fā)揮了巨大作用,并取得顯著效果。
中國機器翻譯研究起步于1957年,是世界上第4個開始搞機器翻譯的國家,60年代中期以后一度中斷,70年代中期以來有了進(jìn)一步的發(fā)展。翻譯的語種和類型有英漢、俄漢、法漢、日漢、德漢等一對一的系統(tǒng),也有漢譯英、法、日、俄、德的一對多系統(tǒng)(FAJRA系統(tǒng))。此外,還建立了一個漢語語料庫和一個科技英語語料庫。中國機器翻譯系統(tǒng)的規(guī)模正在不斷地擴(kuò)大,內(nèi)容正在不斷地完善。
很多人對機器翻譯有誤解,他們認(rèn)為機器翻譯偏差大,不能幫人們解決任何問題。其實其誤差在所難免,原因在于,機器翻譯運用語言學(xué)原理,機器自動識別語法,調(diào)用存儲的詞庫,自動進(jìn)行對應(yīng)翻譯,但是因語法、詞法、句法發(fā)生變化或者不規(guī)則,出現(xiàn)錯誤是難免的,比如《大話西游》中“給我一個殺你的理由,先”之類狀語后置的句子。畢竟?jié)h語因其詞法、語法、句法的變化及其語境的更換,其意思大相徑庭,就連很多國人都是丈二和尚——摸不著頭腦,就別說機器了。
本文是由搜了網(wǎng)整理發(fā)布,如想了解更多請瀏覽:http://www.nanjingzc.cn/
【生意上的事-用搜脈。了解更多搜了網(wǎng)資訊,請立即關(guān)注搜了網(wǎng)官方微信(微信號:sole518)】

上一篇: 有機保溫材料使用不在設(shè)限 可廣泛應(yīng)用
下一篇: 利用虛擬現(xiàn)實化技術(shù)選購太陽鏡足夠省時