?譯者 | 崔皓
審校 | 孫淑娟
開篇
當今社會正處于語言和技術高速發展的階段,因此語言和技術的碰撞是不可避免的——甚至有些人說這種碰撞已經發生了,我們只是在等待塵埃落定。數字化、物聯網、人工智能和機器學習,以及更進一步——智能手機、語音識別,以及互聯網和社交媒體的引入;所有這些技術都為我們的生活做出了貢獻。
在所有技術中,人工智能在行業中的應用最為廣泛。今天,我們將談論正在發生巨大變化的翻譯行業。企業之間的無邊界溝通正在消除語言障礙。雖然機器翻譯(MT) 已經存在了很長時間,但人工智能的應用極大地提高了翻譯的實時性和可用性,并取得前所未有的成績。人工智能的應用帶來了諸多便利,包括以高準確性整合上下文和語言細節。
無論您是從事翻譯還是技術行業,都希望本文能夠給你帶來啟發。讓我們從一個基本問題開始:當兩件事(語言服務和技術)沖突時會發生什么?我們又如何獲得實時翻譯技術。
翻譯行業前瞻
智能技術的發展以及對翻譯的滲透極大地推動了翻譯行業的發展。事實上, 2020 年,翻譯行業的價值為 393.7 億美元,預計到 2028 年將達到 462.2 億美元。除了這些數據之外,引入技術翻譯引擎并轉向機器翻譯一直是翻譯領域的一場革命。因此,在 2019 年,在全球范圍內,機器的翻譯量已經超過了人工翻譯。
什么是實時翻譯技術?
顧名思義,實時翻譯技術 (RTT) 是指一種以技術驅動的翻譯解決方案,可以將任何類型的內容從一種語言即時翻譯成另一種。你沒看錯,是可以翻譯成任何類型的內容。因為今天,技術不僅可以翻譯文本,還可以幫助翻譯語音。利用技術您可以進行語音翻譯、對象檢測、文本翻譯、圖像翻譯等。不僅可以用于個人,還可以用于企業,RTT 的特點是提升溝通質量同時彌補語言存在的差距。
站在企業的角度,翻譯提供商在服務中提供 API,讓其能夠涵蓋內部流程和客戶溝通系統,如 CMS 管理、客戶支持等。
支持人工翻譯的翻譯軟件擁有很強的智能水平,無需過多編輯即可提供翻譯服務。現代實時翻譯軟件就利用了最新的神經機器翻譯 (NMT)。機器學習算法和模式識別軟件可以識別單詞和聲音,同時神經網絡和深度學習系統會根據上下文和短語來評估語音。然后再對數據進行編碼和翻譯。具有高處理能力的 RTT 工具可以從數百萬頁中提取的單詞形成數據庫。整個過程只需要 2 到 5 秒,準確度為 85%。
人工智能在翻譯中的作用:它是如何工作的?
許多技術對行業都有著深遠的影響,尤其是翻譯行業,依賴語音交互技術。在這種情況下,人工智能可以提供各種格式的即時翻譯,包括文本、音頻、圖形,甚至街道標志。AI 現在可以管理大量需要翻譯的文本或語音。
人工智能基于神經網絡,對整個短語而不僅僅是對單詞進行翻譯,同時還會考慮到單詞之間的關系從而提升翻譯的準確率。借助神經網絡的機器翻譯 (NMT),人工智能可以從過去的翻譯經驗中不斷學習,根據上下文了解單詞使用方式、短語的結構和語言表達的目的。這種方法比以前使用的任何技術都更加成功,因為它使用更少的內存和數據來完成翻譯工作。所有翻譯都是相互關聯的,并為后來的語音或文本提供上下文參考,從而提升翻譯的準確性。
在幕后,人工智能得到了自然語言處理、圖像識別、預測和推薦引擎等多項技術的支持。任何一段翻譯,無論是單詞還是文本,都會經歷以下幾個階段:
數據采集- 來自 AI 堆棧。
數據存儲- 快速訪問的大數據存儲,通常會用到云技術。
數據處理和分析涉及機器學習、深度學習、自然語言處理、情感分析、圖像識別和推薦引擎。并通過第三方 API的方式對服務進行調用。
數據輸出和報告——根據需要,輸出的形式多種多樣,如語音拷貝、語音翻譯、文本形式等。
技術(AI 和 NLP)如何幫助人工翻譯?
人工智能在語言翻譯中的應用給企業和個人都帶來了便利,讓翻譯工作以更好、更快的方式開展。
持續進步
人工智能驅動的神經機器翻譯利用以往的翻譯經驗和語言資產,通過獲取反饋而不斷學習和發展。這意味著使用翻譯工具次數越多,它就會變得越智能,結果也越準確。
針對不同需求的特定詞匯
借助高級 AI 編輯器中包含的術語數據庫,通過自定義元數據排列術語有效地處理術語。使用元字段導入術語或創建新字段從而提高翻譯的一致性。這一優勢在技術翻譯和專業內容中至關重要。
時間和成本效益
如果不需要 100% 準確地翻譯大型文檔,那么機器翻譯是非常好的選擇。人工智能驅動的翻譯改進,讓后期編輯過程變得更加容易,它減少了人工翻譯的成本和時間。
人工智能會取代人工翻譯嗎?
進步是不可阻擋的,事實上,沒有人愿意回到無法獲取信息的時代。還有一個問題:“人工智能會在某些行業取代人類嗎,比如翻譯行業,或者其他行業?答案是:不。”
無論人工智能多么聰明和快捷,對于技術來說都沒有同理心。即使有 99% 的準確率,仍然需要1% 的人工讓翻譯結果更加完美。我們能做的是使用高效快捷的技術,讓生活變得更加舒適。
譯者介紹
崔皓,51CTO社區編輯,資深架構師,擁有18年的軟件開發和架構經驗,10年分布式架構經驗。曾任惠普技術專家。樂于分享,撰寫了很多熱門技術文章,閱讀量超過60萬。《分布式架構原理與實踐》作者。
原文標題:??How Are Smart Technologies Changing the Translation Industry????,作者:Anahit Ghazaryan?