0
9月11-9月13日,首屆北京國際語言文化博覽會(以下簡稱語博會)在京舉行,作為本次大會的首席戰略合作伙伴,中譯語通科技(北京)有限公司(以下簡稱中譯語通(GTCOM))全程深度參與。9月12日舉行的語博會“語言科技與人類福祉”國際語言文化論壇上,中譯語通(GTCOM)CEO于洋發表題為“人工智能時代的語言科技創新”的主旨演講。回顧中譯語通(GTCOM)五年來的發展進程,以及對如何構建語言科技、語言服務新生態的思考,并解讀中譯語通(GTCOM)在人工智能時代契機下的語言科技創新之力。

語言是文化的象征,而文化則離不開傳承,關于語言的話題從來沒有像今天這樣如此豐富。從文化到經濟、從政治到軍事、從現實到虛擬,在科技領域作為人工智能核心的語言智能引領潮流。中譯語通(GTCOM)則在這樣的契機下,運勢而生。于洋用數據解讀了這5年來中譯語通(GTCOM)的發展軌跡。
2014年中譯語通(GTCOM)發布了機器翻譯,隨著技術的躍升,目前中譯語通(GTCOM)在機器翻譯領域已擴展到32種語言,992種語言方向,每天訪問量超過了1.5億次,而通過機器翻譯進行大數據的運算,一天超過200億次,也就是說機器翻譯每天要翻譯4000億次,這些數字的背后是依托億萬級語料庫、強大的技術研發實力及40余年的優秀管理運營經驗的積淀。2015年,中譯語通(GTCOM)首創跨語言大數據概念,發起語言大數據聯盟(LBDA),當前聯盟在全球已經擁有167所高校和語言研究院所的加入。
隨著互聯網的深入,大數據、人工智能時代的到來,則讓中譯語通(GTCOM)擁有更大的展現舞臺,并在短時間內完成從語言服務企業到跨語言大數據提供商的華麗戰略轉型,打造出譯云語言科技生態、譯見大數據技術生態兩大核心生態,當人們還沉浸于大數據、人工智能帶來的思維顛覆時,中譯語通(GTCOM)已站在了“巨人的肩膀上”。
構建語言科技、語言服務新生態
隨后于洋側重講述了對語言科技、語言服務新生態構建的思考。在新生態下,機器翻譯將起到“連接器”的作用。目前中譯語通(GTCOM)可以承載每天3000萬+篇網頁數據,5億+的社交數據日更新,多達65+種語言,以及EB級全球互聯網開放性文本及多媒體數據。于洋提出,如果能把所有的語言符號去除“語言”的外殼,“化身”為可分析的結構化數據后,經過分析和解構,我們能清晰的看到這些數據點繪制出的一幅數據地圖,挖掘數據背后的奧秘,將會爆發出更大價值。
正如于洋所談到的那樣,未來跨越語言、跨越時間的海量數據,將成為人工智能縱深發展的驅動力。在今天,我們講的人工智能,它只是一種算法、一種技術,而數據則會貫穿始終。一年前人們的認知停留在算法秒殺一切,在今年,人們更多看到的是數據升級下的巨大潛能。當我們擁有了海量的、高質量的數據時,數據就足以秒殺算法。
未來,中譯語通(GTCOM)將繼續深耕大數據應用領域,致力于推動語言科技、語言創新服務的融合發展,通過跨語言大數據和AI認知技術的發展,打破語言壁壘,大大提升科研能力和認知范疇,這無疑將對語言服務行業帶來巨大影響力。同時機器學習技術在機器翻譯上的應用也賦予冰冷的機器思考的能力,正如本次論壇主題所闡述的那樣,以語言科技之名,創新人類福祉,最終讓AI+大數據+語言科技認知智能的場景化應用變得觸手可及。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。