PP云視頻專家團(tuán)隊翻譯 普華永道AI最新技術(shù)前沿
在商業(yè)領(lǐng)域和政府的推動下,AI一直是科技的前沿和中心。但是在實驗室里,他們還將有哪些新的突破?學(xué)術(shù)界和企業(yè)研究人員發(fā)現(xiàn),未來一年AI將會發(fā)生新的趨勢轉(zhuǎn)變。PP云視頻服務(wù)專家團(tuán)隊就普華永道官網(wǎng)最新發(fā)布的AI潮流技術(shù)前沿進(jìn)行了詳細(xì)深入的翻譯。
最近,普華永道的分析師們從AI加速器研究團(tuán)隊中,追蹤到一些值得分析師和行業(yè)領(lǐng)袖密切關(guān)注的2018年最潮AI技術(shù)。下面就讓我們介紹一些這些重要的技術(shù)趨勢分別是什么,以及為什么很重要。
1.深度學(xué)習(xí)理論:揭開神經(jīng)網(wǎng)絡(luò)的工作原理
技術(shù)趨勢:模仿人類大腦的深度神經(jīng)網(wǎng)絡(luò)已經(jīng)展示了他們從圖像、音頻和文本數(shù)據(jù)中“學(xué)習(xí)”的能力。然而,即使到目前為止,仍然有很多我們還不了解的關(guān)于深度學(xué)習(xí)的技術(shù)方法,包括神經(jīng)網(wǎng)絡(luò)如何學(xué)習(xí),或者他們?nèi)绾伪憩F(xiàn)的更出色。這些情況開始悄悄發(fā)生變化了,這要歸功于信息瓶頸原理(Information Bottleneck)應(yīng)用于深度學(xué)習(xí)的新理論。實質(zhì)上,它表明在初始擬合階段后,深度神經(jīng)網(wǎng)絡(luò)將“忘記”并壓縮噪聲數(shù)據(jù),即拋棄含有大量無意義信息的數(shù)據(jù)集,同時仍保留相關(guān)數(shù)據(jù)代表的信息。
重要性:準(zhǔn)確理解深度學(xué)習(xí)理論有助于促進(jìn)它未來深度的應(yīng)用和發(fā)展。例如,它可以深入了解最佳網(wǎng)絡(luò)設(shè)計和架構(gòu)選擇,同時為安全關(guān)鍵或監(jiān)管應(yīng)用提供更高的透明度。未來有機(jī)會看到更多的學(xué)習(xí)結(jié)果,從探索這一理論應(yīng)用于其他類型的深度神經(jīng)網(wǎng)絡(luò)和深度神經(jīng)網(wǎng)絡(luò)設(shè)計中去。
2.膠囊網(wǎng)絡(luò):模擬大腦的視覺處理優(yōu)勢
技術(shù)趨勢:膠囊網(wǎng)絡(luò)是一種新型的深度神經(jīng)網(wǎng)絡(luò),它以與大腦處理視覺信息完全相同的方式,這意味著它們可以基本完全對等。這與最廣泛使用的神經(jīng)網(wǎng)絡(luò)之一“卷積神經(jīng)網(wǎng)絡(luò)”形成鮮明對比。卷積神經(jīng)網(wǎng)絡(luò)未能考慮簡單和復(fù)雜對象之間的重要空間層次結(jié)構(gòu),導(dǎo)致錯誤分類和高錯誤率。
重要性:對于典型的識別任務(wù),膠囊網(wǎng)絡(luò)通過減少錯誤提供更高的準(zhǔn)確性高達(dá)50%。他們也不需要太多的訓(xùn)練模型數(shù)據(jù)。未來可以看到膠囊網(wǎng)絡(luò)在許多問題領(lǐng)域和深度神經(jīng)網(wǎng)絡(luò)架構(gòu)中被廣泛使用。
3.深入強化學(xué)習(xí)(DRL):與環(huán)境交互以解決業(yè)務(wù)問題
技術(shù)趨勢:深入強化學(xué)習(xí)是一種神經(jīng)網(wǎng)絡(luò)。通過觀察,行動和激勵與環(huán)境相互作用來學(xué)習(xí)。深度強化學(xué)習(xí)(DRL)已被用于學(xué)習(xí)策略游戲,例如Atari和Go--包括著名的AlphaGo項目,通過AI技術(shù)擊敗人類冠軍。
重要性:DRL是所有學(xué)習(xí)技術(shù)中最通用的目的,因此它可用于大多數(shù)商業(yè)應(yīng)用程序。與其他技術(shù)相比,它需要更少的數(shù)據(jù)來訓(xùn)練其模型。更值得注意的是,它可以通過模擬進(jìn)行訓(xùn)練,從而無需完全標(biāo)記數(shù)據(jù)。鑒于這些優(yōu)勢,預(yù)計未來一年將會有更多將DRL和基于代理的仿真相結(jié)合的業(yè)務(wù)應(yīng)用。
4. 生成式對抗網(wǎng)絡(luò):配對神經(jīng)網(wǎng)絡(luò)來刺激學(xué)習(xí)并減輕處理負(fù)擔(dān)
技術(shù)趨勢:生成式對抗網(wǎng)絡(luò)(GAN)是一種無監(jiān)督的深度學(xué)習(xí)系統(tǒng),實現(xiàn)為兩個競爭神經(jīng)網(wǎng)絡(luò)。一個網(wǎng)絡(luò),即生成器,會創(chuàng)建與真實數(shù)據(jù)集完全相同的假數(shù)據(jù)。第二個網(wǎng)絡(luò),鑒別器,攝取真實和合成數(shù)據(jù)。隨著時間的推移,生成式對抗網(wǎng)絡(luò)會得到改進(jìn),機(jī)器的知識來源不再局限于人類,而是可以彼此之間相互交流相互學(xué)習(xí)。
重要性:GAN向更廣泛的無監(jiān)督任務(wù)開放了深入的學(xué)習(xí),其中標(biāo)記的數(shù)據(jù)不存在或獲取成本太高。它們還減少了深度神經(jīng)網(wǎng)絡(luò)所需的負(fù)載,因為這兩個網(wǎng)絡(luò)分擔(dān)了這個負(fù)擔(dān)。預(yù)計未來會在更多的商業(yè)應(yīng)用中看到GAN,例如網(wǎng)絡(luò)探測。
5.精益數(shù)據(jù)分析:解決標(biāo)簽數(shù)據(jù)挑戰(zhàn)
技術(shù)趨勢:機(jī)器學(xué)習(xí)(尤其是深度學(xué)習(xí))面臨的最大挑戰(zhàn)是可用大量標(biāo)記數(shù)據(jù)來訓(xùn)練系統(tǒng)。兩種廣泛的技術(shù)可以幫助解決這個問題:一是綜合新數(shù)據(jù);二是將針對一個任務(wù)或領(lǐng)域訓(xùn)練的模型轉(zhuǎn)移到另一個任務(wù)或領(lǐng)域。諸如轉(zhuǎn)移學(xué)習(xí):將從一個任務(wù)/領(lǐng)域?qū)W到的見解轉(zhuǎn)移到另一個任務(wù)/領(lǐng)域;或單次學(xué)習(xí):轉(zhuǎn)移學(xué)習(xí)極端化,僅通過一個或沒有相關(guān)示例發(fā)生學(xué)習(xí)的技術(shù),使他們成為“精益數(shù)據(jù)”學(xué)習(xí)技術(shù)。同樣,通過模擬或內(nèi)插合成新數(shù)據(jù)有助于獲取更多數(shù)據(jù),從而擴(kuò)大現(xiàn)有數(shù)據(jù)以改善學(xué)習(xí)。
重要性:使用這些技術(shù),我們可以解決更多種問題,尤其是那些歷史數(shù)據(jù)較少的問題。預(yù)計會看到精益數(shù)據(jù)分析更多用于工業(yè)大數(shù)據(jù),以及適用于廣泛業(yè)務(wù)問題的不同類型數(shù)據(jù)學(xué)習(xí)。
6.概率編程:簡化模型開發(fā)的語言
技術(shù)趨勢:一種高級編程語言,更容易讓開發(fā)人員設(shè)計概率模型,然后自動“解決”這些模型。概率編程語言可以重用模型庫,支持交互式建模和形式驗證,并提供必要的抽象層以促進(jìn)通用模型類中的通用高效推理。
重要性:概率編程語言能夠適應(yīng)業(yè)務(wù)領(lǐng)域中常見的不確定和不完整的信息。我們將看到商業(yè)領(lǐng)域會更廣泛地采用這些語言,比如產(chǎn)品決策;除此之外,它們也能夠應(yīng)用于數(shù)據(jù)深度學(xué)習(xí)。
7.混合學(xué)習(xí)模型:結(jié)合模型不確定性的方法
技術(shù)趨勢:不同類型的深度神經(jīng)網(wǎng)絡(luò),如GAN或DRL,在性能和廣泛應(yīng)用于不同類型的數(shù)據(jù)方面顯示出巨大的前景。然而,深度學(xué)習(xí)模型不能模擬不確定性,貝葉斯方法或概率方法;旌蠈W(xué)習(xí)模式結(jié)合了這兩種方法來充分利用每種方法的優(yōu)勢;旌夏P偷囊恍├邮秦惾~斯深度學(xué)習(xí),貝葉斯GAN和貝葉斯條件GAN。
重要性:混合學(xué)習(xí)模式可以擴(kuò)展各種業(yè)務(wù)問題,包括深度學(xué)習(xí)和不確定性。這可以幫助我們實現(xiàn)更好的模型性能和可解釋性,從而可以鼓勵醫(yī)療方面采取更廣泛的應(yīng)用。期望看到更深層的學(xué)習(xí)方法獲得貝葉斯等價物,而概率編程語言的組合開始融入深度學(xué)習(xí)。
8.自動機(jī)器學(xué)習(xí)(AutoML):無需編程即可創(chuàng)建模型
技術(shù)趨勢:開發(fā)機(jī)器學(xué)習(xí)模型需要耗時且由專家驅(qū)動的工作流程,其中包括數(shù)據(jù)準(zhǔn)備,特性選擇,模型或技術(shù)選擇,培訓(xùn)和調(diào)優(yōu)。 AutoML旨在使用大量不同的統(tǒng)計和深度學(xué)習(xí)技術(shù)來自動化此工作流程。
重要性:AutoML是AI工具民主化的一部分,使商業(yè)用戶可以在沒有深厚編程背景的情況下開發(fā)機(jī)器學(xué)習(xí)模型。它還將加快數(shù)據(jù)科學(xué)家創(chuàng)建模型的時間。期待在更大的機(jī)器學(xué)習(xí)平臺中看到更多的商業(yè)AutoML包和AutoML集成。
9.數(shù)字化雙胞胎:超越工業(yè)應(yīng)用的虛擬復(fù)制品
技術(shù)趨勢:數(shù)字化雙胞胎是一個虛擬模型,用于促進(jìn)身體或心理系統(tǒng)的詳細(xì)分析和監(jiān)測。數(shù)字化雙胞胎的概念起源于工業(yè)界,廣泛用于風(fēng)車農(nóng)場或工業(yè)系統(tǒng)的分析和監(jiān)測,F(xiàn)在,使用基于代理的建模(用于模擬自治代理的行為和交互的計算模型)和系統(tǒng)動力學(xué)(計算機(jī)輔助的政策分析和設(shè)計方法),數(shù)字化雙胞胎正在應(yīng)用于非物理對象和過程,包括預(yù)測客戶行為。
重要性:數(shù)字雙胞胎可以促進(jìn)物聯(lián)網(wǎng)(IoT)的發(fā)展和更廣泛的應(yīng)用,為預(yù)測性診斷和維護(hù)物聯(lián)網(wǎng)系統(tǒng)提供了一種方法。未來更多應(yīng)用于物理系統(tǒng)和消費者選擇建模。
10.可解釋的AI:了解黑盒子
技術(shù)趨勢:今天,有許多機(jī)器學(xué)習(xí)算法正在使用,它們在各種不同的應(yīng)用中感知,思考和行動。然而,這些算法中的很多被認(rèn)為是“黑盒子”,對于如何達(dá)成結(jié)果幾乎沒有任何洞見。可解釋的AI是開發(fā)機(jī)器學(xué)習(xí)技術(shù)的一種運動,它可以產(chǎn)生更多可解釋的模型,同時保持預(yù)測的準(zhǔn)確性。
重要性:可解釋、證明和透明的AI對于建立對技術(shù)的信任至關(guān)重要,并將鼓勵更廣泛地采用機(jī)器學(xué)習(xí)技術(shù)。企業(yè)在啟動人工智能廣泛部署之前將采用可解釋的AI作為需求或最佳實踐,而政府可能會在未來將可解釋的AI作為監(jiān)管要求。
后記:PP云憑借PPTV 十多年媒體技術(shù)和服務(wù)經(jīng)驗,在AI領(lǐng)域已經(jīng)有些重大突破,以上10種技術(shù)中,深度學(xué)習(xí)、精益數(shù)據(jù)分析等技術(shù)都已經(jīng)很好的在業(yè)務(wù)中有成熟運用和發(fā)展。同時,PP云將AI前沿技術(shù)充分融合融入到流媒體技術(shù)、P2P、CDN 分發(fā)、海量存儲、安全策略等,成為專注視頻云服務(wù)行業(yè)首屈一指的一站式SaaS 服務(wù)平臺。在未來,將支持更多云上企業(yè),實現(xiàn)全場景視頻云服務(wù)業(yè)務(wù)發(fā)展。