2022 年的翻譯產業:機器翻譯的衝擊與契機

※本文為 Termsoup 取得翻譯自動化用戶協會(Translation Automation User Society, TAUS)授權翻譯,轉載請務必註明出處。

※原文連結:https://www.taus.net/news2/blog/the-story-of-the-translation-industry-in-22

 

二○一七年三月二十二日至二十四日,在阿姆斯特丹一處前身為秘密教會的地方,聚集了五十位專家一同思考二○二二年的翻譯產業將產生什麼改變。我們可以把這個故事看成是人類和機器之間的戰爭,而後者則會贏得勝利。但是,如果我們看得更深一點,會發現這裡面有許多引人入勝的玄機,有能夠改變遊戲規則的技術和趨勢,以及出現讓所有推動今日發展的人都感到困惑的結果。小心你許的願

 

 

今天的翻譯公司到了二○二二年會變得很不一樣,我們會看到翻譯科技和創意網絡、數據工廠和說故事,以及平台和精品之間分道揚鑣,它們或許偶而仍會在同一個名義下運作,但功能卻完全分開。這個故事聽起來很熟悉,對吧?也許你在想的是廣告業和行銷業發生過的劇變,人們曾認為這些產業充滿創意,它們在工廠和辦公室自動化的環境中有其獨特之處,但現在,在歷經幾十年的數據風暴後,廣告代理商的業務已經根本地改變了。

行銷已經自動化,並由數據和點擊驅動,線上廣告快速興起,精準行銷以及透過像 Google 和 Facebook 這種按點擊次數收費的公司,把這個領域攪得翻天覆地。上奇廣告公司、麥肯廣告以及智威湯遜廣告公司,曾帶給我們影集《廣告狂人》那段美好的時光,但是創意總監們現在都要向大型控股公司報告,這些控股公司都用了像宏盟集團、WPP集團、埃培智集團以及陽獅集團這種無聊透頂的名字。

在未來的五年內,在相對較小的翻譯產業很有可能出現類似的併購,並與其他因數據風暴而被犧牲的創業產業-廣告和行銷產業-整合在一起。

但是,在事情發展到那一步之前,先來看看幾週前發生在阿姆斯特丹的故事。我們把這個故事分成彼此相關的十章來說,就像一本很棒的小說。

一、演算管理

機器幾乎會在各方面表現得比人類好。就像在許多其他產業一樣,我們認為機器也會來到翻譯領域,強化並擴大我們的工作,最終則取代我們。它一開始是從簡單計算要翻譯的原文字數開始,如今則擴大到配對譯者的工作、辨識新的術語、有效利用翻譯記憶、分析內容、取樣檢查、決定品質評估的類型與檢查錯誤的類型、狀態追蹤、報告、開立帳單以及傳送檔案。

很快地,機器能夠檢查品質、生產力,甚至預測尚未進行的工作品質。它們會依照有多少讀者閱讀譯文來追蹤每一個訊息或不同段落的譯文的投資報酬率,更別說它們自己當然也會生產譯文、語音翻譯、即用即付以及所有其他由演算法帶動的創新服務。它們會涵蓋這個故事的其他小節。我們已經聽到很多這個產業裡的新創公司說自己是翻譯界的 Uber,所以這裡的結論是:自動翻譯將成為二○二二年的常態。

二、翻譯數據化

翻譯數據化始於一篇與數據有關極具影響力的文章,它是 Google 科學家 Fernando Pereira、Peter Norvig 以及 Alon Hale 在二○○九年撰寫,又或是始於 TAUS 在更早的二○○八年上線的數據雲。機器翻譯是從數據中學習,在早期,「更多資料」是王道,英文翻法文的 Google 機器翻譯引擎就是從內含一千億個字的語料庫訓練出來的。如今,有了新一代的神經機器翻譯,需要龐大數據的時代已經過去了,追求高品質的翻譯數據,將會挑戰保護主義者,並為盜版創造機會。

不論是哪一種情況,翻譯產業都會追求數據。我們要的不只是翻譯記憶的資料,還要語音的資料。我們想對人類和機器翻譯進行編輯和註釋,還有內容類型的屬性、產業部門、譯者的所在地、使用的過程,以及使用的技術。何不把這些內容也和氣象預報、譯者的社會關係圖以及追蹤他們瀏覽動態的數據也結合在一起?畢竟,我們永遠都可以從新的數據學到一些東西。

網路巨人在翻譯數據上擁有競爭優勢,但它們卻用機器翻譯過度消耗自己的資源。現在,這場競爭已經開放給新的數據市場。歐盟執行委員會投資了連接歐洲設施計畫,但是,也要小心中國新興的翻譯數據公司,又或是近在咫尺的 TAUS 資料雲。

三、品質至上

不過,別被數據和科技矇騙了。無所不在的枯燥機器翻譯將帶動一種需求,那就是生產出能夠刺激讀者想像力的故事和訊息,從而建立起客戶品牌並吸引全球和多元化社群,這正是翻譯和廣告與行銷產業間最可能出現綜效的地方。在開放的全球經濟裡,我們必須重新創造故事。世界上被生產且自動翻譯出來的爛內容已經夠多了。

數據對於我們了解市場和客戶非常有幫助,讓我們了解他們喜歡或不喜歡什麼,他們點了什麼又不點什麼,讓我們在創造內容和創譯時能夠判斷該投資什麼,又不該投資什麼。我們是這樣看待未來:譯者會變成作家、記者、說故事的人、文化諮詢師、全球品牌宣傳者

四、整合

整合是指技術、商業模式或市場的融合,未來最大的創新會出現在這些交叉路口上,其中最好的例子仍然是 Google 翻譯的成功:它為龐大的翻譯產業敲了一記警鐘。Google 無意摧毀翻譯產業,甚至要做到這一點也並不容易,但是自動翻譯的按鈕與 Google 搜尋引擎的結合受到人們極大的歡迎,開啟了部分先驅早在一九七○年代夢寐以求的景象(請見 Jean Gachot 在巴黎 Minitel 提出的 Systran Translate)。

在接下來的五年裡,這種整合將驅動出最引人入勝且富想像力的創意。日本的翻譯大聲公和「ili 譯利」都是機器翻譯和語音翻譯整合的好例子,可以讓遊客和旅客在外語環境裡亦能泰然自處,而二○二○年的東京奧林匹克運動會則可能帶給我們更多出乎意料的翻譯創意。在商業和產業裡,只要有一點點想像力就可以想出類似的創新。如果機器翻譯、文字轉語音和視訊會議,全都整合在微軟的 Hololens 3D 眼鏡裡,讓人在越南的強鹿公司現場工程師在遇到拖車出現障礙時,可以透過這種眼鏡和德國的工廠互動,你覺得如何?同樣的,中國的實驗室助理在羅氏醫療診斷設備公司與血液檢測機一起工作時,如果設該備會說中文,或者在詢問問題時能回答問題,那麼這個設備會不會更好?

這種整合的力量,將會在沒有人要讀的翻譯文件上發揮最強大的力量,因為它們往往在該出現的時候沒有出現。

五、語音

TAUS 語音對語音翻譯技術最近預測認為,在接下來的五年會有良好的語音對語音解決方案出現。Skype 翻譯和前面提到的日本穿戴裝置,只是早期出現的一部分方案而已。人們很懶惰,而且比起閱讀和寫作,大家往往喜歡用聽的和用講的。科技已經走到這個程度,而且它確實有用。

現在,我們需要的是必要的語言要有聲音,而且別忘了,還要數據訓練並且自動化語音對語音的翻譯系統,這是語言服務供應商可以拓展並研發新服務、尋找並雇用人才的另一個新領域。口說翻譯會在許多應用程式裡冒出頭來,在手環、眼鏡並且整合進軟體公司、汽車製造商、醫療設施以及線上服務的產品中。

為了把語音轉語音翻譯的規模擴大到和文字翻譯相仿,翻譯產業的服務和技術公司必須開發新的流程、工作流程、數據蒐集和工具。新的專業帶動新的機會。

六、微型和長閱讀翻譯

在接下來的五年裡,微型翻譯和長閱讀翻譯之間,以及產品在地化和創譯之間的界線會變得越來越明顯。產品在地化有其特性,一年一度的產品發表已成為過去式,我們已經活在不斷推出新產品的時代裡。任務和工作變得越來越碎片化,被切細到句子和片語的層次,專案的概念越來越模糊,工作過程變得更敏捷,並且和產品研發整合在一起。

突飛猛進的機器翻譯拯救了我們,但是不管是否採用機器翻譯,翻譯永遠都在進行中,而且它實際上是即時的。從服務和科技供應商的角度來看,平台整合似乎是不可避免的發展。近年來,市場上出一些創新的雲端平台提供了品質不一的隨傳隨翻功能,它們會挑戰現狀,並且強迫許多供應商和買家追隨其腳步。

但是,如果這中間需要人類加工,需要幫其他人將故事重新創造或創譯成其他語言呢?譯者會變成作家、文化諮詢師和品牌宣傳者。在新的市場裡,他們將是產品成功的關鍵。多層的供應練將面臨壓力,去仲介化又會成為議題,像 Translate and Create 這樣的新公司將挑戰既有的翻譯社。整合出版、廣告與行銷的服務,看起來是個自然而然的發展方向。能看著市場如何圍繞著自動化翻譯與創譯之間此一鴻溝演化,是一件很有趣的事。

七、飛躍的進展

我們將在二○二二年回顧神經機器翻譯飛躍進展的五年,它為我們的機器翻譯品質帶來前所未有提升。如果可以用百分比表示的話,專家會說五年的神經機器翻譯等同於二十年的統計機器翻譯。詭異的是,研究人員常常也不知道這些快速的進展究竟是什麼被刺激來的。現在機器已經可以自行學習,並且在歷經上千個決定後達到較好的結果。

此外,深度學習技術會讓任何數據,包括單語、雙語、聲音甚至影片,建立起可以讀唇語(和翻譯)的多元引擎,甚至可以在沒有直接的雙語資料下翻譯兩種語言。屆時的機器翻譯會比我們今天習慣的機器翻譯更加流暢、自然,能夠把潛在不精準的部份隱藏起來不讓我們看見。多虧了流暢的功能和較低的儲存容量負擔,神經機器翻譯十分有利於更多語音轉語音的翻譯應用程式問世。

所有這一切導致了一個現實,那就是未來所有公開的內容基本上或至少實際上會有五十種語言的翻譯,這表示它可以隨選隨用、即時又可能是免費的。這與當今的現況相比可是個極大的躍進,儘管今天(二○一七年)機器翻譯的產出實際上已經比所有人類譯者全部的產出要多出五百倍以上。

有傳聞說在神經機器翻譯成功後,機器翻譯的技術會有新突破,也已經有人稱之為量子機器翻譯。量子機器翻譯也許能夠增加機器翻譯的精準度,這是目前神經機器翻譯系統在精準度上必須跨越的障礙。

八、長尾

在二○二二年,翻譯產業在語言普及度上的限制將大幅縮小,持續進行的全球化會不斷打開市場,民粹主義的政治趨勢將難以阻止西方和亞洲企業追求更多世界各地的客戶。事實上,我們會看到便利的電子商務將讓客戶彼此靠得更近,包括中小型企業也是如此,從而刺激全球貿易進一步增長。

舉例來說,中國的一帶一路計畫把焦點放在古代絲路上的國家,把一些語言納入其中,增加翻譯業涵蓋的語言。如果今天一家全球企業平均涵蓋二十五種語言,我們預估五年後這個數字將會翻一倍。無所不在的機器翻譯可以很大程度填滿這個需求。

新一代的神經機器翻譯表現得更好,也能夠更快、更容易加入新語言,因為它不再那麼依賴大量的翻譯配對。用所謂「零數據」(zero-shot)翻譯技術建立機器翻譯引擎,可以讓開發者在沒有配對的情況下,用不同但相關的語言建立起翻譯引擎。出人意料的是,我們認為大量提供新語言的機器翻譯,將可以刺激人們對創作長篇故事翻譯的需求,而不是讓譯者失業。人們對於新文化和新語言的興趣,反而會因為科技而增長。

九、即付即用

隨手可得的翻譯作為一種公用工具,它雖往往是免費的,其品質卻不一定都合格或夠好,因此刺激了新的業務和定價模式出現。何不讓用戶在點擊並使用翻譯時才收取他們費用?何不靠內容、點擊次數來區分價格?或是引進評估方法幫我們決定何時需要高品質的人類翻譯。

語言服務公司很習慣隨時改良它們的業務,更新它們的服務範圍,它們也將在未來的五年內繼續這樣做,而且會做得更快、更徹底。根據字數收取固定費用的模式將會消失,翻譯技術公司會根據人們使用其平台來收費,而創譯公司則寧可根據它們所需的人才數按時薪計價。

十、使用者第一

我們經常忽略了自己為什麼要翻譯,為什麼人翻譯,以及人們如何使用翻譯,這一點在翻譯業裡尤其如此。我們常常用老舊的推銷或出版模式生產譯文,不太關心譯文的可用性和可搜性。如果我們要跟上更民主、以使用者為中心的商業模式趨勢,就必須改變這種狀況。翻譯業的服務供應商可能在諮詢可用性和文化多元性上扮演更重要的角色。事實上,讓使用者在新市場中界定功能、標籤、翻譯和服務與產品的術語,可以產生巨大的優勢。也就是說,使用者成為新的創作人才。

後記

當我們在二○二二年回顧過去五年翻譯業的故事時,我們不會在這個故事所強調的十個章節裡看到一趟平順的旅程。當然不會。相反的,會出現的是不適應和失敗、嘗試、錯誤以及激烈的競爭。翻譯業的供應商在老舊的銷售模式中,繼續耗費過高比例的營收。這個行業將面臨 Bodo 困境*:雖有豐富的工具、技術、數據和創新解決方案,卻缺乏相關的人才。

數據變得越來越重要,而由於有越來越多開源方案以及學術論文分享的最新發展,技術的優勢正在減弱。數據、數據共享、機器學習和雲端計算的強大趨勢,一方面會帶來迷人的創新、增長和成熟,但另一方面卻引發了人們對隱私和安全性的疑慮。我們可能會看到翻譯屏障的現象,類似加入屏障以保護公司和供應鏈免受不必要和不請自來的免費翻譯所影響。

有些供應商會因為提供安全和封閉的翻譯服務以及內部部署技術而獲利,但是就長期來說,在這個產業的下一個五年裡,雲端對最容易擔心安全問題的人來說都可能變得無法抗拒,尤其如果新的量子電腦科技可以提供終極的安全防護。誰知道會怎麼樣呢?

*Bodo 困境是以威睿軟體公司品質經理 Bodo Vahldieck 命名,他在 TAUS 產業高峰會表達過他的無奈,說他找不到年輕人才願意且能夠做到他需要的在地化技術。

 

Termsoup 雲端翻譯軟體,協助譯者更快完成翻譯任務。我們提供一站式翻譯稿件介面,讓譯者在同一個畫面翻譯、查詢詞彙、新增個人詞彙、使用個人翻譯記憶等,大幅減少跨網站、跨介面不便。

 

Leave a reply:

Your email address will not be published.

Site Footer