獲ICME人臉106關(guān)鍵點(diǎn)檢測(cè)比賽冠軍 百度大腦彰顯AI實(shí)力
捷報(bào)頻傳,百度大腦再次登上國(guó)際舞臺(tái)。在今年4月初結(jié)束的ICME人臉106關(guān)鍵點(diǎn)檢測(cè)比賽(Grand Challenge of 106-p Facial Landmark Localization)中,百度大腦視覺(jué)技術(shù)團(tuán)隊(duì)與來(lái)自全球的20多個(gè)優(yōu)秀代表隊(duì)同臺(tái)競(jìng)技,其中包括阿里、華為、美團(tuán)、中科大等國(guó)內(nèi)視覺(jué)技術(shù)實(shí)力強(qiáng)勁的團(tuán)隊(duì),最終一舉摘得桂冠。
ICME 人臉106關(guān)鍵點(diǎn)檢測(cè)比賽排行榜
ICME 比賽 TOP3 的相對(duì)誤差分布示意圖
IEEE ICME(IEEE International Conference on Multimedia and Expo)是由IEEE Computer Society、Circuits and Systems Society、 Signal Processing Society以及Communications Society共同主辦的計(jì)算機(jī)多媒體領(lǐng)域最重要的國(guó)際會(huì)議之一,至今已連續(xù)舉辦18屆,涵蓋文本分析、圖形圖像、視頻、語(yǔ)音音頻等多媒體數(shù)據(jù)的處理、傳輸、分析與應(yīng)用等主題。
Grand Challenge of 106-p Facial Landmark Localization則是ICME 2019上舉辦的四項(xiàng)比賽之一。其測(cè)試樣本涵蓋大姿態(tài)、極端表情、遮擋等多種高難度、復(fù)雜的情況,且訓(xùn)練樣本少,對(duì)算法的泛化能力、準(zhǔn)確性及魯棒性等多個(gè)方面提出了巨大的挑戰(zhàn),極富學(xué)術(shù)和實(shí)用價(jià)值,吸引了來(lái)自百度、阿里、華為、美團(tuán)、中科大等數(shù)十個(gè)企業(yè)和高校的參賽隊(duì)伍參賽。
據(jù)悉,今年比賽主要考驗(yàn)了算法在大姿態(tài)、極端表情、遮擋等復(fù)雜場(chǎng)景下的魯棒性和準(zhǔn)確性。而百度內(nèi)部使用的自主研發(fā)AutoDL技術(shù)——SA-NAS,則能夠顯著提高算法的魯棒性和準(zhǔn)確性,從而在眾多參賽隊(duì)伍中脫穎而出,獲得了第一名的好成績(jī)。
SA-NAS是百度憑借在人臉關(guān)鍵點(diǎn)檢測(cè)領(lǐng)域的長(zhǎng)期積累與研究,自主研發(fā)的AutoDL技術(shù)。它針對(duì)比賽任務(wù)的特點(diǎn)、以模型精度和結(jié)構(gòu)的多樣性為導(dǎo)向,實(shí)現(xiàn)了自動(dòng)化模型構(gòu)建。并且該方法相比RL-NAS搜索速度提升超過(guò)30倍,收斂過(guò)程更加穩(wěn)定,讓設(shè)計(jì)深度神經(jīng)網(wǎng)絡(luò)模型擺脫了低效的人工調(diào)參困境。此外,百度在算法中引入分割稠密監(jiān)督、加權(quán)熱力圖監(jiān)督和多種數(shù)據(jù)增強(qiáng)方法,充分挖掘小樣本訓(xùn)練數(shù)據(jù)中的特征信息、消除了模型訓(xùn)練中的量化誤差。同時(shí),他們以模型結(jié)構(gòu)的多樣性為基礎(chǔ)、依托檢測(cè)結(jié)果的統(tǒng)計(jì)特征,創(chuàng)新地提出了關(guān)鍵點(diǎn)一致性估計(jì)算法,從而顯著地提升了關(guān)鍵點(diǎn)檢測(cè)算法準(zhǔn)確性與魯棒性。
據(jù)悉,在此次競(jìng)賽中大放異彩的AutoDL-SA-NAS網(wǎng)絡(luò)結(jié)構(gòu)自動(dòng)化設(shè)計(jì)工具,是基于百度開(kāi)源深度學(xué)習(xí)平臺(tái)PaddlePaddle實(shí)現(xiàn)的,已經(jīng)進(jìn)入預(yù)發(fā)布階段,即將對(duì)外正式開(kāi)源。未來(lái)開(kāi)發(fā)者可以通過(guò)開(kāi)放開(kāi)源的PaddlePaddle平臺(tái),針對(duì)自己算法研發(fā)任務(wù)靈活搜索最佳網(wǎng)絡(luò)結(jié)構(gòu),獲得優(yōu)于人工調(diào)參的模型效果,提高開(kāi)發(fā)效率。此前PaddlePaddle已經(jīng)開(kāi)源了基于AutoDL Design的一系列神經(jīng)網(wǎng)絡(luò),以及使用CIFAR10數(shù)據(jù)在其上訓(xùn)練出來(lái)的一共6個(gè)模型,包括了網(wǎng)絡(luò)結(jié)構(gòu)以及對(duì)應(yīng)的權(quán)重。每一位開(kāi)發(fā)者都可以很容易使用PaddlePaddle以及公開(kāi)的CIFAR10數(shù)據(jù),在這6個(gè)模型上進(jìn)行推理以及模型融合,獲得超過(guò)98%的準(zhǔn)確率。
PaddlePaddle是百度視覺(jué)技術(shù)團(tuán)隊(duì)的主要技術(shù)研發(fā)平臺(tái),是集深度學(xué)習(xí)核心框架、工具組件和服務(wù)平臺(tái)為一體的技術(shù)領(lǐng)先、功能完備的開(kāi)源深度學(xué)習(xí)平臺(tái)。PaddlePaddle在視覺(jué)技術(shù)上有深厚的積累,官方已開(kāi)源覆蓋分類、檢測(cè)、語(yǔ)義分割、OCR、GAN、人體關(guān)鍵點(diǎn)檢測(cè)等類別,基于真實(shí)業(yè)務(wù)場(chǎng)景驗(yàn)證的優(yōu)質(zhì)模型。上個(gè)月,PaddlePaddle重磅發(fā)布了視頻識(shí)別工具集,覆蓋主流實(shí)用的序列建模算法與端到端視頻識(shí)別模型,可一鍵式任務(wù)啟動(dòng),公開(kāi)數(shù)據(jù)集下載,數(shù)據(jù)預(yù)處理,模型訓(xùn)練,模型inference一步到位。
PaddlePaddle還對(duì)深度學(xué)習(xí)模型訓(xùn)練中顯存占用進(jìn)行了專項(xiàng)優(yōu)化。以語(yǔ)義分割Deeplabv3+為例,針對(duì)顯存消耗分析與解決,冗余前向計(jì)算,GPU CPU內(nèi)存交換,使用16位浮點(diǎn)數(shù)等,讓開(kāi)發(fā)者可在相同的計(jì)算設(shè)備上訓(xùn)練更大的模型,還可以在消費(fèi)級(jí)別顯卡上完成訓(xùn)練。
為了進(jìn)一步助力開(kāi)發(fā)者進(jìn)入深度學(xué)習(xí)領(lǐng)域, 基于PaddlePaddle的一站式深度學(xué)習(xí)開(kāi)發(fā)平臺(tái)AI Studio還送出1億元免費(fèi)算力,為普通開(kāi)發(fā)者破除算力桎梏。
PaddlePaddle官方支持模型
百度大腦此次拿下ICME人臉106關(guān)鍵點(diǎn)檢測(cè)比賽冠軍,彰顯了百度深厚的AI技術(shù)實(shí)力,也代表著基于PaddlePaddle的百度視覺(jué)處理技術(shù)將更進(jìn)一步,未來(lái)將持續(xù)為各行各業(yè)賦能,推動(dòng)產(chǎn)業(yè)智能化發(fā)展,為AI領(lǐng)域創(chuàng)造更多可能。
- 4-28· Meta 將于下月開(kāi)設(shè)其首家 Meta Store 零售店
- 8-16· WICC 2021 融云首席架構(gòu)師揭秘RTC和IM全球通信網(wǎng)絡(luò)
- 7-19· WICC2021 召開(kāi)臨近 荔枝最佳實(shí)踐為開(kāi)發(fā)者所期待
- 6-15· 百度AICA今年最后一次招募,提升企業(yè)AI硬核實(shí)力的詳參來(lái)了
- 5-24· TME、網(wǎng)易云牽手索尼:獨(dú)家版權(quán)放開(kāi)?壟斷之憂或并未走遠(yuǎn)
- 4-13· Pico Neo 3 VR 一體機(jī)即將發(fā)布,搭載高通驍龍 XR2
- 4-6· Microsoft Defender for Endpoint現(xiàn)支持Windows 10 on ARM
- 3-8· MediaTek發(fā)布全新4K智能電視芯片,開(kāi)啟AI影音時(shí)代
- 2-25· 蘋(píng)果 microLED 相關(guān)專利有望解決行業(yè)難題:提高顯示屏可靠性和質(zhì)量
- 1-13· 致ClickHouse用戶的一封信