NLP開發者盛宴!百度大腦開放日釋放自然語言處理最新黑科技
作為人工智能理解信息的核心手段,近年來自然語言處理技術(NLP)突破頻頻,并開始往更多垂直場景落地應用。7月31日,百度大腦開放日NLP專場于中關村創業大街的百度大腦創新體驗中心舉行。開放日期間,百度自然語言處理部副總監忻舟分享了NLP領域的開放全景,并重點介紹了智能創作平臺2.0的新特性、PaddleNLP(NLP開源工具與預訓練模型集)、ERINE(知識增強的語義理解框架)等最新技術。活動現場,央視網、國美零售、縱橫文學的相關技術負責人也登臺演講,闡述企業如何借力百度大腦開放的NLP技術能力,實現自身業務的智能化演變。
開發者NLP需求與日俱增 百度大腦致力降低技術門檻
據介紹,百度大腦經過多年深耕,形成了完整的語言與知識技術布局,以知識圖譜為基礎,實現語言理解與語言生成能力,并進一步形成深度問答、對話系統、智能創作、機器翻譯等功能。
活動當天忻舟重點介紹了可持續學習語義理解框架ERNIE 2.0和基于此框架的ERNIE 2.0預訓練模型。ERNIE2.0可通過建模海量數據中的詞、實體及實體關系,學習真實世界的語義知識,目前累計學習超過10億條知識,已在百度眾多產品應用中顯現效果。根據測試對比,ERNIE2.0在16個中英文任務上表現優于BERT和XLNet。
百度大腦工業級NLP開源工具與預訓練模型集PaddleNLP,具備中文詞法分析、文本情感分類等10項NLP應用任務,并且網絡可靈活調整,場景也可高效遷移,具備業內領先的語義表示模型,可實現工業級的靈活應用,它也是當前業內最大的工業訓練集。忻舟以“文本情感分析”為例,現場實操百度大腦NLP工具集,為開發者展示了直觀易用的步驟。
百度大腦一直致力于將行業領先的NLP技術對開發者和產業開放,不斷降低AI應用門檻。目前,百度大腦語言與知識技術擁有最大的多元語義知識圖譜以及最好的中文語義表示模型,可提供30+項技術工具,囊括了文本審核、機器翻譯、語言生成等多項能力,服務方式多樣、靈活、可定制,含有多套場景技術方案。
智能創作平臺2.0推出 AI賦能內容創作
對內容創作者而言,在信息傳播節奏越來越快的當下,內容質量、時效速度、多媒體內容形式等挑戰越來越大。對此,智能寫作功能開始被關注,本次開放日也重點介紹了百度大腦的智能創作平臺2.0。
據了解,百度大腦智能創作平臺于2018年百度世界大會發布,并于今年4月完成能力全面開放的智能創作平臺1.0。在7月初的2019百度AI開發者大會上,智能創作平臺正式升級為2.0版本。對內容創作者而言,智能創作平臺不僅可以化繁為簡,節約時間,更可以通過各種智能服務,提升內容產出的質量與形式。
基于百度領先的自然語言處理、知識圖譜以及大數據技術,智能創作平臺2.0具備熱點發現、熱詞分析、用詞潤色、標題生成、多模態創作、文本審核、文章分類、文章標簽等8大領先技術能力,更有豐富的數據素材支持。
在創作前,智能創作平臺會根據熱點發現與熱詞分析來輔助作者選題,以激發靈感;在創作過程中,標題自動生成、事件脈絡等功能會為作者推薦適合的創作素材;在創作完成后,文本糾錯、詞語潤色、文本審核等功能可為作者進一步提升內容質量,并自動提煉文本的類型與摘要,使內容分發更加精準。
深入融合各行各業 百度大腦NLP成智能化“東風”
作為百度大腦開放AI能力的重要組成部分,百度大腦語言與知識技術已經形成了基礎技術、應用技術、訓練平臺、開源算法在內的完整開放全景圖。熱門應用的技術包括評論觀點抽取、情感傾向分析、文本審核、對話情緒識別等等。同時,在技術與效果領先行業的基礎上,百度大腦也在不斷降低技術門檻讓更多開發者與企業都能用得起來NLP技術,實現自身業務的智能化。
(左起:央視網技術事業群副總經理朱立松、國美零售控股國美管家技術總監高旭、縱橫文學產品總監張皓)
央視網技術事業群副總經理朱立松表示:“當前傳統視頻生產運營面臨著智能化生產 、信息風險管控、內容創新等挑戰,中央電視總臺就人工智能賦能新媒體做出了大量的探索與嘗試,在智能創作、智能分析、智能審核、智能搜索、智能推薦等方面已有成效,其中NLP技術是自動文摘、文本挖掘(文本分類)、信息檢索等功能的基礎。”朱立松還透露,央視網已經與百度合作,共建人工智能媒體研發中心,聯合打造媒體產業人工智能產品。
國美零售控股國美管家技術總監高旭介紹,借助百度大腦NLP的情感傾向分析功能與評論觀點抽取功能,國美上線了“服務評分智能化解決方案”,可自動分析用戶評論并自動處理:“百度大腦在這套智能評分平臺的效果準確率很高,現在國美客服運營人力需求從一天5人降低到3人,負面問題處理率從60%飆升至100%,售后師傅的差評率也整體降低了7%。”
縱橫文學產品總監張皓也肯定了百度大腦NLP對內容產業的價值。在接入了文本審核能力之后,機器初審替代人工評級,審核速度由每人每天60萬字提升到600萬字,并且對于風險內容和問題章節能夠及時處理,只要兩人就能完成。“百度大腦NLP文本審核的優點在于,詞庫、審核力度、監控維度都可以自定義,對內容平臺管理而言相當靈活。”張皓說。
當前,NLP技術作為人工智能重點發展的領域之一,已經在新聞傳媒、電子商務、文化娛樂、金融、法律等行業場景深度落地,而國內人工智能“頭雁”百度正在其中發揮著至關重要的作用。可以想見在百度大腦的賦能推動下,將會有更多的企業與開發者應用NLP技術能力,使自身的產品與服務與人工智能深度融合,為中國的整體產業智能化提供加速度。
- 6-13· 南通開發區:“知產”變資產 創新添動力
- 6-9· 鄭州市開發區優化整合基本完成
- 11-26· 寶可夢開發商 Niantic 獲得 3 億美元新融資:用于構建元宇宙等
- 4-22· 華為開發者日將于 4 月 28 日在廣州舉行,有望公布鴻蒙 OS 更多內容
- 12-24· UOS 開發商統信軟件完成 A 輪 11 億元人民幣融資
- 10-26· 開發者推出在華為手機上安裝谷歌服務的應用:簡單易用
- 9-2· 谷歌正開發下一代筆記本電腦產品:支持 3.5mm 耳機接口,3 個 USB-C 接口
- 5-25· 微信開發 Java SDK:WxJava 3.8.0 正式版本發布
- 3-30· 雷競技LPL春季賽線上賽預測:RNG VS EDG,老牌戰隊再次對陣
- 3-2· 3.8萬開發者齊聚小度助手平臺 新一代對話式操作系統掘金進