PP云視頻專家團(tuán)隊(duì)翻譯 普華永道AI最新技術(shù)前沿
在商業(yè)領(lǐng)域和政府的推動(dòng)下,AI一直是科技的前沿和中心。但是在實(shí)驗(yàn)室里,他們還將有哪些新的突破?學(xué)術(shù)界和企業(yè)研究人員發(fā)現(xiàn),未來一年AI將會(huì)發(fā)生新的趨勢(shì)轉(zhuǎn)變。PP云視頻服務(wù)專家團(tuán)隊(duì)就普華永道官網(wǎng)最新發(fā)布的AI潮流技術(shù)前沿進(jìn)行了詳細(xì)深入的翻譯。
最近,普華永道的分析師們從AI加速器研究團(tuán)隊(duì)中,追蹤到一些值得分析師和行業(yè)領(lǐng)袖密切關(guān)注的2018年最潮AI技術(shù)。下面就讓我們介紹一些這些重要的技術(shù)趨勢(shì)分別是什么,以及為什么很重要。
1.深度學(xué)習(xí)理論:揭開神經(jīng)網(wǎng)絡(luò)的工作原理
技術(shù)趨勢(shì):模仿人類大腦的深度神經(jīng)網(wǎng)絡(luò)已經(jīng)展示了他們從圖像、音頻和文本數(shù)據(jù)中“學(xué)習(xí)”的能力。然而,即使到目前為止,仍然有很多我們還不了解的關(guān)于深度學(xué)習(xí)的技術(shù)方法,包括神經(jīng)網(wǎng)絡(luò)如何學(xué)習(xí),或者他們?nèi)绾伪憩F(xiàn)的更出色。這些情況開始悄悄發(fā)生變化了,這要?dú)w功于信息瓶頸原理(Information Bottleneck)應(yīng)用于深度學(xué)習(xí)的新理論。實(shí)質(zhì)上,它表明在初始擬合階段后,深度神經(jīng)網(wǎng)絡(luò)將“忘記”并壓縮噪聲數(shù)據(jù),即拋棄含有大量無意義信息的數(shù)據(jù)集,同時(shí)仍保留相關(guān)數(shù)據(jù)代表的信息。
重要性:準(zhǔn)確理解深度學(xué)習(xí)理論有助于促進(jìn)它未來深度的應(yīng)用和發(fā)展。例如,它可以深入了解最佳網(wǎng)絡(luò)設(shè)計(jì)和架構(gòu)選擇,同時(shí)為安全關(guān)鍵或監(jiān)管應(yīng)用提供更高的透明度。未來有機(jī)會(huì)看到更多的學(xué)習(xí)結(jié)果,從探索這一理論應(yīng)用于其他類型的深度神經(jīng)網(wǎng)絡(luò)和深度神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)中去。
2.膠囊網(wǎng)絡(luò):模擬大腦的視覺處理優(yōu)勢(shì)
技術(shù)趨勢(shì):膠囊網(wǎng)絡(luò)是一種新型的深度神經(jīng)網(wǎng)絡(luò),它以與大腦處理視覺信息完全相同的方式,這意味著它們可以基本完全對(duì)等。這與最廣泛使用的神經(jīng)網(wǎng)絡(luò)之一“卷積神經(jīng)網(wǎng)絡(luò)”形成鮮明對(duì)比。卷積神經(jīng)網(wǎng)絡(luò)未能考慮簡(jiǎn)單和復(fù)雜對(duì)象之間的重要空間層次結(jié)構(gòu),導(dǎo)致錯(cuò)誤分類和高錯(cuò)誤率。
重要性:對(duì)于典型的識(shí)別任務(wù),膠囊網(wǎng)絡(luò)通過減少錯(cuò)誤提供更高的準(zhǔn)確性高達(dá)50%。他們也不需要太多的訓(xùn)練模型數(shù)據(jù)。未來可以看到膠囊網(wǎng)絡(luò)在許多問題領(lǐng)域和深度神經(jīng)網(wǎng)絡(luò)架構(gòu)中被廣泛使用。
3.深入強(qiáng)化學(xué)習(xí)(DRL):與環(huán)境交互以解決業(yè)務(wù)問題
技術(shù)趨勢(shì):深入強(qiáng)化學(xué)習(xí)是一種神經(jīng)網(wǎng)絡(luò)。通過觀察,行動(dòng)和激勵(lì)與環(huán)境相互作用來學(xué)習(xí)。深度強(qiáng)化學(xué)習(xí)(DRL)已被用于學(xué)習(xí)策略游戲,例如Atari和Go--包括著名的AlphaGo項(xiàng)目,通過AI技術(shù)擊敗人類冠軍。
重要性:DRL是所有學(xué)習(xí)技術(shù)中最通用的目的,因此它可用于大多數(shù)商業(yè)應(yīng)用程序。與其他技術(shù)相比,它需要更少的數(shù)據(jù)來訓(xùn)練其模型。更值得注意的是,它可以通過模擬進(jìn)行訓(xùn)練,從而無需完全標(biāo)記數(shù)據(jù)。鑒于這些優(yōu)勢(shì),預(yù)計(jì)未來一年將會(huì)有更多將DRL和基于代理的仿真相結(jié)合的業(yè)務(wù)應(yīng)用。
4. 生成式對(duì)抗網(wǎng)絡(luò):配對(duì)神經(jīng)網(wǎng)絡(luò)來刺激學(xué)習(xí)并減輕處理負(fù)擔(dān)
技術(shù)趨勢(shì):生成式對(duì)抗網(wǎng)絡(luò)(GAN)是一種無監(jiān)督的深度學(xué)習(xí)系統(tǒng),實(shí)現(xiàn)為兩個(gè)競(jìng)爭(zhēng)神經(jīng)網(wǎng)絡(luò)。一個(gè)網(wǎng)絡(luò),即生成器,會(huì)創(chuàng)建與真實(shí)數(shù)據(jù)集完全相同的假數(shù)據(jù)。第二個(gè)網(wǎng)絡(luò),鑒別器,攝取真實(shí)和合成數(shù)據(jù)。隨著時(shí)間的推移,生成式對(duì)抗網(wǎng)絡(luò)會(huì)得到改進(jìn),機(jī)器的知識(shí)來源不再局限于人類,而是可以彼此之間相互交流相互學(xué)習(xí)。
重要性:GAN向更廣泛的無監(jiān)督任務(wù)開放了深入的學(xué)習(xí),其中標(biāo)記的數(shù)據(jù)不存在或獲取成本太高。它們還減少了深度神經(jīng)網(wǎng)絡(luò)所需的負(fù)載,因?yàn)檫@兩個(gè)網(wǎng)絡(luò)分擔(dān)了這個(gè)負(fù)擔(dān)。預(yù)計(jì)未來會(huì)在更多的商業(yè)應(yīng)用中看到GAN,例如網(wǎng)絡(luò)探測(cè)。
5.精益數(shù)據(jù)分析:解決標(biāo)簽數(shù)據(jù)挑戰(zhàn)
技術(shù)趨勢(shì):機(jī)器學(xué)習(xí)(尤其是深度學(xué)習(xí))面臨的最大挑戰(zhàn)是可用大量標(biāo)記數(shù)據(jù)來訓(xùn)練系統(tǒng)。兩種廣泛的技術(shù)可以幫助解決這個(gè)問題:一是綜合新數(shù)據(jù);二是將針對(duì)一個(gè)任務(wù)或領(lǐng)域訓(xùn)練的模型轉(zhuǎn)移到另一個(gè)任務(wù)或領(lǐng)域。諸如轉(zhuǎn)移學(xué)習(xí):將從一個(gè)任務(wù)/領(lǐng)域?qū)W到的見解轉(zhuǎn)移到另一個(gè)任務(wù)/領(lǐng)域;或單次學(xué)習(xí):轉(zhuǎn)移學(xué)習(xí)極端化,僅通過一個(gè)或沒有相關(guān)示例發(fā)生學(xué)習(xí)的技術(shù),使他們成為“精益數(shù)據(jù)”學(xué)習(xí)技術(shù)。同樣,通過模擬或內(nèi)插合成新數(shù)據(jù)有助于獲取更多數(shù)據(jù),從而擴(kuò)大現(xiàn)有數(shù)據(jù)以改善學(xué)習(xí)。
重要性:使用這些技術(shù),我們可以解決更多種問題,尤其是那些歷史數(shù)據(jù)較少的問題。預(yù)計(jì)會(huì)看到精益數(shù)據(jù)分析更多用于工業(yè)大數(shù)據(jù),以及適用于廣泛業(yè)務(wù)問題的不同類型數(shù)據(jù)學(xué)習(xí)。
6.概率編程:簡(jiǎn)化模型開發(fā)的語言
技術(shù)趨勢(shì):一種高級(jí)編程語言,更容易讓開發(fā)人員設(shè)計(jì)概率模型,然后自動(dòng)“解決”這些模型。概率編程語言可以重用模型庫(kù),支持交互式建模和形式驗(yàn)證,并提供必要的抽象層以促進(jìn)通用模型類中的通用高效推理。
重要性:概率編程語言能夠適應(yīng)業(yè)務(wù)領(lǐng)域中常見的不確定和不完整的信息。我們將看到商業(yè)領(lǐng)域會(huì)更廣泛地采用這些語言,比如產(chǎn)品決策;除此之外,它們也能夠應(yīng)用于數(shù)據(jù)深度學(xué)習(xí)。
7.混合學(xué)習(xí)模型:結(jié)合模型不確定性的方法
技術(shù)趨勢(shì):不同類型的深度神經(jīng)網(wǎng)絡(luò),如GAN或DRL,在性能和廣泛應(yīng)用于不同類型的數(shù)據(jù)方面顯示出巨大的前景。然而,深度學(xué)習(xí)模型不能模擬不確定性,貝葉斯方法或概率方法。混合學(xué)習(xí)模式結(jié)合了這兩種方法來充分利用每種方法的優(yōu)勢(shì)。混合模型的一些例子是貝葉斯深度學(xué)習(xí),貝葉斯GAN和貝葉斯條件GAN。
重要性:混合學(xué)習(xí)模式可以擴(kuò)展各種業(yè)務(wù)問題,包括深度學(xué)習(xí)和不確定性。這可以幫助我們實(shí)現(xiàn)更好的模型性能和可解釋性,從而可以鼓勵(lì)醫(yī)療方面采取更廣泛的應(yīng)用。期望看到更深層的學(xué)習(xí)方法獲得貝葉斯等價(jià)物,而概率編程語言的組合開始融入深度學(xué)習(xí)。
8.自動(dòng)機(jī)器學(xué)習(xí)(AutoML):無需編程即可創(chuàng)建模型
技術(shù)趨勢(shì):開發(fā)機(jī)器學(xué)習(xí)模型需要耗時(shí)且由專家驅(qū)動(dòng)的工作流程,其中包括數(shù)據(jù)準(zhǔn)備,特性選擇,模型或技術(shù)選擇,培訓(xùn)和調(diào)優(yōu)。 AutoML旨在使用大量不同的統(tǒng)計(jì)和深度學(xué)習(xí)技術(shù)來自動(dòng)化此工作流程。
重要性:AutoML是AI工具民主化的一部分,使商業(yè)用戶可以在沒有深厚編程背景的情況下開發(fā)機(jī)器學(xué)習(xí)模型。它還將加快數(shù)據(jù)科學(xué)家創(chuàng)建模型的時(shí)間。期待在更大的機(jī)器學(xué)習(xí)平臺(tái)中看到更多的商業(yè)AutoML包和AutoML集成。
9.數(shù)字化雙胞胎:超越工業(yè)應(yīng)用的虛擬復(fù)制品
技術(shù)趨勢(shì):數(shù)字化雙胞胎是一個(gè)虛擬模型,用于促進(jìn)身體或心理系統(tǒng)的詳細(xì)分析和監(jiān)測(cè)。數(shù)字化雙胞胎的概念起源于工業(yè)界,廣泛用于風(fēng)車農(nóng)場(chǎng)或工業(yè)系統(tǒng)的分析和監(jiān)測(cè)。現(xiàn)在,使用基于代理的建模(用于模擬自治代理的行為和交互的計(jì)算模型)和系統(tǒng)動(dòng)力學(xué)(計(jì)算機(jī)輔助的政策分析和設(shè)計(jì)方法),數(shù)字化雙胞胎正在應(yīng)用于非物理對(duì)象和過程,包括預(yù)測(cè)客戶行為。
重要性:數(shù)字雙胞胎可以促進(jìn)物聯(lián)網(wǎng)(IoT)的發(fā)展和更廣泛的應(yīng)用,為預(yù)測(cè)性診斷和維護(hù)物聯(lián)網(wǎng)系統(tǒng)提供了一種方法。未來更多應(yīng)用于物理系統(tǒng)和消費(fèi)者選擇建模。
10.可解釋的AI:了解黑盒子
技術(shù)趨勢(shì):今天,有許多機(jī)器學(xué)習(xí)算法正在使用,它們?cè)诟鞣N不同的應(yīng)用中感知,思考和行動(dòng)。然而,這些算法中的很多被認(rèn)為是“黑盒子”,對(duì)于如何達(dá)成結(jié)果幾乎沒有任何洞見。可解釋的AI是開發(fā)機(jī)器學(xué)習(xí)技術(shù)的一種運(yùn)動(dòng),它可以產(chǎn)生更多可解釋的模型,同時(shí)保持預(yù)測(cè)的準(zhǔn)確性。
重要性:可解釋、證明和透明的AI對(duì)于建立對(duì)技術(shù)的信任至關(guān)重要,并將鼓勵(lì)更廣泛地采用機(jī)器學(xué)習(xí)技術(shù)。企業(yè)在啟動(dòng)人工智能廣泛部署之前將采用可解釋的AI作為需求或最佳實(shí)踐,而政府可能會(huì)在未來將可解釋的AI作為監(jiān)管要求。
后記:PP云憑借PPTV 十多年媒體技術(shù)和服務(wù)經(jīng)驗(yàn),在AI領(lǐng)域已經(jīng)有些重大突破,以上10種技術(shù)中,深度學(xué)習(xí)、精益數(shù)據(jù)分析等技術(shù)都已經(jīng)很好的在業(yè)務(wù)中有成熟運(yùn)用和發(fā)展。同時(shí),PP云將AI前沿技術(shù)充分融合融入到流媒體技術(shù)、P2P、CDN 分發(fā)、海量存儲(chǔ)、安全策略等,成為專注視頻云服務(wù)行業(yè)首屈一指的一站式SaaS 服務(wù)平臺(tái)。在未來,將支持更多云上企業(yè),實(shí)現(xiàn)全場(chǎng)景視頻云服務(wù)業(yè)務(wù)發(fā)展。