中華電信旗下的中華電信研究院不僅進行新壹代通信技術、物聯網、雲計算之外的研究,還專註於人工智能和深度學習。十個研究單位的龐大數據研究院,匯聚了100多位大數據領域的專家,在嚴格的數據安全保護下開發多樣化的應用。與中華電信本身關系最密切的包括聊天機器人和104查號臺的語音識別服務。
據中華電信研究院副院長陳博士介紹,Chatbot已經被企業廣泛導入,但大多數企業只是導入外部軟件公司或服務平臺提供的解決方案,而中華電信研究院壹直從前端向應用層面發展,並以中華電信龐大的數據和技術為後盾,提供符合電信業務的解決方案。
為了減輕客服人員的負擔,中華電信首先以基於Chatbot的智能文字客服解決客戶的共性問題,通過語義分析解決客戶的共性問題,減少客服電話人力,降低客戶等待時間和服務質量。但單靠文字型客服仍不足以滿足電信行業的服務需求,因此中華電信也有意推出基於人工智能的語音客服。而語音系統遠比文本復雜,語音轉文字後的復雜性更多的與口音差異和語義分析有關,需要依靠更多的計算來解決語音客服系統所需的深度學習和神經網絡。
中華電信在開發AI語音客服系統的同時,於2010開始研究圖像分析和人臉識別系統。但當時由於GPU的加速,深度神經網絡還不成熟。以當時的技術,中華電信沒有突破80%的準確率。但由於中華電信對圖像分析和人臉識別系統的不斷研發,也發現了NVIDIAGPU在圖像識別方面的優勢。它被導入到系統架構中。中華電信在引入TeslaK80加速器和神經網絡架構後,僅用壹年時間就達到了91.1%的準確率,訓練2萬人* * 1萬的畫像數據庫僅用了72小時。中華電信雖然認為90%以上是相當大的突破,但還是不滿足,決定提高導入率。
中華電信在2017年推出了基於Pascal架構的TeslaP100GPU。訓練同樣數量的訓練庫後,只用了24小時就達到了原來72小時的模型訓練。與此同時,DGX-1超級計算機於同年年底推出。采用新壹代NVIDIATeslaV100GPU,訓練時間再次縮減至1/3,準確率進壹步達到99.6%的高水平。中華電信也加速了NVIDIAGPU在AI語音客服中的應用。
起初,中華電信試圖利用傳統的基於CPU的AI模型訓練來構建語音客服的人工智能模型,但結果和性能都達不到中華電信的要求。中華電信不僅引入kaldin3語音識別工具進行TDNN訓練,還通過NVIDIATeslaV100GPU進行訓練,不僅將訓練語料從48小時大幅提升至1,000小時,還能進行更復雜的語義分析,將語言和語義識別的準確率從47.53%提升至82.8%。
同時,中華電信也看到了擁抱開放的創新力量。為了讓更多的企業、教育機構和創客享受到AI資源,中華電信還開放了雲AI(Paas+Iaas)平臺,讓對AI深度學習服務感興趣的開發者可以利用中華電信提供的平臺,開發圖像識別、語音合成、語音識別等技術和服務,擁抱開放,攜手開發者進行AI技術創新和應用開發。