共找到2條詞條名為飛槳的結果 展開
  • 詞語
  • 百度深度學習平台

飛槳

百度深度學習平台

飛槳(PaddlePaddle)以百度多年的深度學習技術研究和業務應用為基礎,集深度學習核心訓練和推理框架、基礎模型庫、端到端開發套件、豐富的工具組件於一體。是中國首個自主研發、功能完備、開源開放的產業級深度學習平台。 

目前,飛槳已凝聚超320萬開發者,服務企業12萬家,產生了36萬個模型。飛槳助力開發者快速實現AI想法,高效上線AI業務,幫助越來越多的行業完成AI賦能,實現產業智能化升級。

簡介


官方公布的結果來看,百度飛槳(PaddlePaddle)指出,兆芯科技的ZX-C、ZX-C+、KX-5000、KX-6000、KH-2000、KH-3000系列處理器和CentOS操作系統軟體V7平台上,功能、性能、兼容性、可靠性、穩定性可滿足用戶需求。
擁有自主知識產權、完全獨立生產,關鍵可堪一用的CPU,一直被中國科技產業的所期盼。雖然我們目前離這個目標還有一些距離,但是夢想也正在一步一步被拉進。日前上海兆芯宣布通過了百度飛漿AI框架的認證,可滿足一般應用的需求,完全可堪一用。

發展歷程


● 2018年7月,開源框架 v0.14發布——提供從數據預處理到模型部署在內的深度學習全流程的底層能力支持。官方首次開源CV/NLP/語音/強化學習等10個模型。
● 2018年10月,開源框架 v1.0穩定版本發布——提供更穩定、向後兼容的API,易用性大幅提升。提供 MacOS 下的多種安裝方式,新增對Python 3.5的支持。並開源8個CV、NLP 方向主流模型。
● 2018年11月,開源框架 v1.1發布——支持萬億規模稀疏參數大規模多機非同步訓練。移動端預測新增Mali GPU、Adreno GPU、FPGA等硬體支持。開源5個推薦領域模型,大幅優化CV、NLP模型的訓練速度和顯存佔用。
● 2018年12月,開源框架 v1.2發布——CPU多機非同步訓練升級包括worker非同步併發和IO、通信優化在內多項功能,整體吞吐大幅提升。支持Python 3.6及以上各版本。模型庫新增圖像分類任任務的預訓練模型、語言模型任務新增基於cudnn的LSTM實現、分散式word2vec模型。
● 2019年3月,開源框架 v1.3發布——統一Executor和ParallelExecutor介面,正式發布AnalysisConfig 預測介面,支持計算圖分析、運算元融合等優化;模型庫新增發布飛槳視頻模型庫,提供5個視頻分類經典模型以及適合視頻分類任務的通用骨架代碼;新增支持NLP語義表示BERT模型,支持多機多卡訓練,支持混合精度訓練,訓練速度對比主流實現提升50%+;發布大規模稀疏參數伺服器Benchmark。
● 2019年4月,開源框架 v1.4發布——正式發布模型壓縮工具包PaddleSlim和模型預測服務Paddle Serving,全面提升飛槳部署能力。正式發布視頻分類工具包,覆蓋主流視頻分類模型;正式發布PaddleNLP,工業級中文NLP工具與預訓練模型集。正式發布PaddleHub預訓練模型管理工具,提供包括預訓練模型管理、命令行一鍵式使用和遷移學習三大功能。發布業界領先的超大規模并行能力,包括大規模稀疏參數伺服器解決方案、工業級數據處理、帶寬不敏感訓練能力等。
● 2019年7月,開源框架 v1.5發布——正式發布動態圖Preview版並提供 7個模型動態圖版本官方實現。PaddleHub共提供40+預訓練模型,覆蓋文本、圖像、視頻三大領域八類模型,並全面提升易用性,發布PaddleHub官網。模型壓縮框架PaddleSlim新增基於模擬退火的自動剪切策略和輕量級模型結構自動搜索功能(Light-NAS)。官方模型庫正式發布PaddleDetection物體檢測統一框架、圖像生成庫;升級視頻識別與定位工具集;發布PaddleNLP-Research,包含百度在 NLP 領域近期研究工作。
● 2019年11月,開源框架 v1.6發布——訓練框架進一步優化了速度,完善了顯存優化機制,並支持在框架外部自定義C++/CUDA OP。分散式訓練新增LocalSGD、GEO-SGD等策略,大規模同步訓練、非同步訓練速度繼續提升,並支持K8S + Volcano任務提交。伺服器端預測庫增加C API,並支持版本兼容檢查。發布Paddle Lite,定位高性能、多平台、輕量化的端側預測引擎,並可作為伺服器端預測庫的加速庫。PaddleServing新增超大規模分散式預估服務能力。PaddleSlim強化了量化訓練功能,增加了基於硬體的小模型搜索功能。發布全新Seq2Seq相關API和文本生成模型樣例。語義表示庫新增XLNet預訓練模型;開源EMNLP2019閱讀理解競賽冠軍模型D-NET,同時支持18個不同抽取式閱讀理解數據集打榜。發布飛槳多任務學習庫PALM (PAddLe Multi-task learning),更便捷支持多任務機器學習調研。發布訓練部署端到端的圖像分割庫PaddleSeg。圖像分類新增EfficientNet等43個預訓練模型。PaddleDetection新增2019 Objects365 Full Track冠軍模型、BlazeFace等人臉檢測小模型,行人檢測和車輛檢測的預訓練模型。PaddleVideo新增ActivityNet Challenge 2019奪冠模型,擴展包含video caption、video grounding等模型。發布PaddleSpeech,包含語音識別模型DeepSpeech和語音合成模型 DeepVoice3。PaddleHub新增超參優化Auto Fine-tune功能,並全面提升Fine-tune功能的靈活性和易用性,預訓練模型數量大幅增加。飛槳圖學習框架PGL正式版發布,飛槳深度強化學習框架PARL并行能力進一步提升,支持進化演演算法。Paddle2ONNX和X2Paddle全面升級,飛槳和其他框架的模型互轉更加方便。發布飛槳聯邦學習框架PaddleFL。
● 2020年2月,開源框架 v1.7發布:
訓練框架:增加自動混合精度訓練AMP介面和新控制流介面;優化Tensor使用方式和顯存分配策略;新增支持NVIDIA DALI GPU數據預處理庫;持續優化基礎OP的功能和性能;動態圖的功能進一步完善,性能大幅提升,對Data Independent的動態圖模型提供轉為靜態圖可預測部署模型的功能;框架調試分析功能和易用性全面提升。
預測部署:伺服器端預測庫的Python API大幅優化,新增R語言、Go語言的預測API,並增加相關的使用方法和示例,強化了量化支持能力;Paddle Lite支持無校準數據的訓練后量化方法生成的模型,加強對OpenCL的支持,支持崑崙XPU的預測;模型壓縮庫PaddleSlim重構裁剪、量化、蒸餾、搜索介面,與模型庫充分打通,新增大規模可擴展知識蒸餾框架Pantheon。
分散式訓練:參數伺服器模式下統一了Transpiler半非同步、全非同步和GEO的實現模式,後端實現上統一到Communicator中,前端介面統一到fleet中,通過fleet strategy靈活選擇不同模式;發布大規模分類庫PLSC,通過模型并行支持超多類別的分類任務。
基礎模型庫:發布語音合成庫Parakeet,包括多個前沿合成演演算法;PaddleCV新增14個圖像分類預訓練模型,3D和跟蹤方向模型持續豐富;PaddleNLP的分詞和詞性標註模型支持jieba分詞;PaddleRec增加多任務模型MMoE;模型庫整體增加了廣泛的動態圖模型實現。模型庫整體層次結構做了調整優化。
端到端開發套件:PaddleDetection和PaddleSeg新增大量模型實現及預訓練模型,提升了典型模型的訓練速度和精度,大幅提高模型壓縮和部署能力,使用體驗得到了全面優化;發布ElasticRec推薦排序系統,通過K8S進行部署,支持流式訓練和在線預測服務。
工具組件:PaddleHub新增52個預訓練模型,總數超過100,功能和體驗持續優化;多任務學習框架PALM升級內核,開放API調用,支持更多的任務類型;聯邦學習PaddleFL新增了公開數據集;深度強化學習框架PARL和飛槳圖學習框架PGL也對應版本升級,支持更多功能,開放更多演演算法和基線。
● 2020年5月,開源框架 v1.8發布:
訓練框架:深度優化了命令式編程(動態圖)功能、性能和體驗,特別是增強了動靜轉換的能力,能支持依賴數據的控制流的動態圖實現進行靜態存儲部署,也可以轉為靜態圖模式訓練;Data Loader的功能和梯度裁剪的使用方式進一步優化;聲明式編程模式下多卡運行時fetch不定長Tensor等問題得到解決,混合精度配合重計算顯示出支持大Batch訓練很好的成效。新增了大量API,並新增 ComplexVariable,支持複數張量的表示和常見的複數運算。
預測部署:Paddle Inference 新增CUDA下多線程多流支持、TRT子圖對動態shape輸入的支持,強化量化推理,性能顯著優化;Paddle Serving 全面升級,功能完善,易用性顯著提升;Paddle Lite進一步優化編譯安裝體驗,全面提升對支持晶元的覆蓋度(包括RK、MTK、百度崑崙寒武紀、比特大陸、華為NPU等等)以及對應的模型數量和性能;PaddleSlim量化、裁剪和NAS功能持續強化;發布國內首個開源JavaScript深度學習前端推理引擎Paddle.js,可以幫助用戶實現網頁端深度學習模型部署。
開發套件:全新發布PaddleClas,包含23個圖像分類網路實現,117個圖像預訓練模型,並添加了數據增廣、SSLD蒸餾等輔助策略,以及特色應用案例;PaddleSeg人像分割系列模型全面升級,新增多種遙感相關的策略方案;PaddleDetection、PaddleOCR和語音合成套件Parakeet演演算法覆蓋更全面,速度顯著提升。
工具組件:PaddleHub新增包括一系列視覺預訓練模型在內更多的模型,模型總數120+; PaddleFL發布1.0版本,開源基於Mulit-party Computation (MPC)的聯邦學習,支持橫向、縱向等多個聯邦學習場景;PGL發布業界首個結合語義信息與結構信息的圖神經網路模型ERNIESage;PARL開源工業界首個進化學習應用框架Evokit;全新發布量子機器學習框架量槳Paddle Quantum。
● 2021年3月,開源框架v2.0發布:
編程範式:默認開啟動態圖模式開發和訓練模型,通過動轉靜的方式部署和加速模型訓練。如果需要使用靜態圖編程範式,可以通過paddle.enable_static()來切換到靜態圖模式。
API體系:對API進行了補充,對目錄結構進行了調整,更加易用,詳情請參見API文檔,同時提供高層API簡化使用流程;詳情請參見飛槳高層API使用指南。
框架功能:對數據載入、動態圖執行、OP性能、混合精度訓練、分散式訓練、動靜轉換等進行了功能增強和性能優化。
環境適配:提供了對ARM架構CPU的支持,增加了對Python 3.8、CUDA 10.1/10.2的支持,發布支持CUDA 11的安裝包(experimental),發布支持百度崑崙晶元的安裝包(experimental),詳情請參見官網的開始使用部分。
模型庫及開發套件:飛槳的官方模型庫和套件的絕大部分模型已經升級至飛槳框架2.0.0版本。
PaddleHub:支持2.0動態圖,全面遷移動態圖編程範式,模型開發調試更加方便,Finetune介面更加靈活易用。
PaddleDetection: 支持2.0動態圖,覆蓋檢測方向主流演演算法(PP-YOLO、Faster-RCNN、SOLOv2),支持動靜轉換,打通預測部署,提供了更加模塊化的組網方式。
PaddleClas: 支持2.0動態圖,提供了29個系列的分類演演算法和134個預訓練模型,提供了基於SSLD知識蒸餾的優化方案,將分類模型的精度普遍提升3%以上。
PaddleSeg: 支持2.0動態圖,提供了50+的高質量預訓練模型,支持15+主流分割網路,提供了業界的SOTA模型OCRNet,很好的提升了產品易用性。
PaddleOCR: 支持2.0動態圖,PP-OCR系統、文字檢測模型(DB、EAST、SAST)與文字識別模型(Rosetta,CRNN,StarNet)完成2.0動態圖適配。
PaddleGAN:支持2.0動態圖,所有模型,包括風格遷移、視頻增強、唇形遷移、人臉動漫化等九種模型均基於動態圖開發。
PaddleRec:支持2.0動態圖,免安裝,動靜組網統一,方便用戶的調研和上線,同時整理髮布了推薦系統經典數據集。
PaddleNLP:支持2.0動態圖,提供25+預訓練模型和易用的API方式,提升文本建模效率。
Parakeet:支持2.0動態圖,已發布的聲學模型及聲碼器均良好支持動態圖版本。
PaddleVideo:支持2.0動態圖,包含了視頻分類和視頻動作定位方向模型,包括: TSNTSM、SlowFast、AttentionLSTM、BMN模型以及特色應用預訓練模型VideoTag和FootballAction
AmazonDJL:易用流暢的Java推理介面,支持各類操作系統平台(Mac/Windows/Linux),支持飛槳預訓練模型部署,更多的信息請參考DJL支持Paddle的官方文檔。
● 2021年5月,開源框架v2.1發布:
環境適配: 增加了對Python 3.9、CUDA 11.2的支持;提供了對ROCm平台的支持(experimental);提供了對昇騰AI處理器的支持(experimental);增加了可在百度崑崙晶元上運行的模型數量;詳情請見:開始使用。
分散式訓練:在已有靜態圖的多維混合併行的基礎上,新增動態圖實現。
框架功能:完成了多項功能增強和性能優化,特別的,新增了以下重要功能:
自定義運算元:提供了在框架外部自定義運算元的新方案,簡化了自定義運算元寫法與訓練推理部署流程,詳情請見:自定義外部運算元。
新增inplace操作:新增可降低顯存佔用與提升性能的inplace操作,包括View策略,與12個inplace API。
高層API相關:新增支持混合精度訓練的高層API;新增通過paddle.hub來查看、共享、載入模型。
自動混合精度訓練優化: 優化了混合精度訓練中slice、where、range等多個op的計算性能,提升了在MaskRCNN、ERNIE等模型上的加速效果。
oneDNN下BF16訓練:新增支持了AMP(AutoMixedPrecision) pure_BF16模式; 新增支持了BF16類型的SGD和initializers初始值設定並減小了內存;新增支持了大部分word2vec BF16訓練需要的前向和反向op。
模型庫及開發套件:
PaddleHub: 新增輕量級中文對話模型plato-mini;新增基於VOC數據集的高精度語義分割模型2個,語音分類模型3個;新增圖像語義分割、文本語義匹配、語音分類任務的Fine-Tune能力;新增ONNX和PaddleInference模型格式的導出功能。
PaddleOCR: 開源百度自研端到端文本識別演演算法PGNet(AAAI 2021發表),多語言模型支持種類提升到80+,英文數字模型效果進一步優化。
PaddleDetection: 新增3個業界最廣泛應用的多目標追蹤演演算法:JDE、DeepSort、FairMot,並全面打通預測部署;新發布人體姿態預估演演算法HRNet和HigherHRNet;旋轉框檢測演演算法S2ANet全面打通預測部署;新增PP-YOLO Tiny的移動端部署Demo;支持批量預測。
PaddleX:支持2.0動態圖;新增RestFul API,支持用戶在本地控制遠程伺服器構建深度學習訓練任務;新增PaddleX Deployment模塊,並與飛槳其他開發套件(PaddleClas,PaddleDetection,PaddleSeg等)打通,支持用戶用更少的代碼快速完成C++ Inference部署預測。
PaddleGAN:新增動作驅動模型First Order Motion,支持單人及多人臉部動作遷移;新增視頻超解析度模型EDVR,發布視頻修復的複合解決方案。
PaddleSeg:新增全景分割場景,其中Anchor-Free演演算法PanopticDeepLab業界SOTA;高精度的人像分割模型humanseg升級為動態圖版,並顯著優化邊緣鋸齒問題;新增10中學習率策略;新增Weighted Cross Entropy Loss,針對樣本類別不均衡場景優化效果顯著;部署能力進一步完善,新增移動端部署和Web部署,並支持添加后處理運算元(argmax/softmax)。
PaddleClas: 新增RexNet、MixNet、ViT和DeiT部署模型;增加面向不同能力開發者的中文文檔;更新whl安裝包。
PaddleNLP: 新增千言等特色中文數據集,及NLP數據處理通用API;新增XLNET、ERNIE、RoBERTa、ALBERT、GPT、Unified_Transformer等中文預訓練模型;新增知識關聯WordTag、語義解析Text-to-SQL、語義匹配SimNet、文本圖學習ERNIE-Sage、情感分析SKEP、通用對話PLATO、小樣本學習P-Tuning等應用場景;新增Transformer解碼模塊,支持高性能推理。
PaddleRec: 新增召回模型MIND,升級PLE, FFM等5個模型到2.0API和支持動態圖;新增可視化支持,引入VisualDL;支持開源工具Milvus用於向量存儲和召回服務,並提供教程;新增推薦系統公開數據集12個;支持單機多卡,多機多卡等多GPU訓練環境;支持inference預測庫和serving部署能力;支持Perf的DNN、DeepFm、Wide&Deep的Benchmark功能;新增完善動轉靜,預測部署,可視化等文檔。
Parakeet:新增音色克隆功能;集成VisualDL實現可視化分析。
PaddleHelix:全面從靜態圖升級到動態圖。新增2個新應用:分子生成和藥物聯用;新增6個新模型:蛋白質化合物親和力預測2個,分子生成3個,藥物聯用1個;新增多個數據集和升級基礎模塊;修復已知bug。
Paddle Quantum:新增量子數據編碼模塊,支持量子核方法的模擬,並提供相關教程;增加新的雜訊模型,模擬真實量子計算環境;新增多個雙量子比特門,包括離子阱量子計算設備原生門;新增列印電路功能,方便查看電路結構及參數;新增變分影子量子學習(AAAI 2021發表)、旅行商問題等多個教程。
Paddle Lite:提升opt和推理庫體積壓縮的易用性;支持armv8.2 FP16指令計算;大幅提升OpenCL相關計算性能;新增支持Intel FPGA。
Paddle Serving:集成開源框架2.1 inference;支持FP16和INT8的低精度推理;通過Kubernetes部署Serving服務;新增安全網關與Serving協同部署;X86 + XPU環境部署Serving服務。
Paddle.js: 完善WebGPU/NodeGL後端; 新增Float16模型格式及WebGL Pack加速功能;新增運算元OP總數達到43個;封裝數據處理API,引入numjs。

技術優勢


● 開發便捷的深度學習框架
飛槳深度學習框架基於編程一致的深度學習計算抽象以及對應的前後端設計,擁有易學易用的前端編程界面和統一高效的內部核心架構,對普通開發者而言更容易上手並具備領先的訓練性能。飛槳自然完備兼容命令式和聲明式兩種編程範式,默認採用命令式編程範式,並完美地實現了動靜統一,開發者使用飛槳可以實現動態圖編程調試,一行代碼轉靜態圖訓練部署。飛槳框架還提供了低代碼開發的高層API,並且高層API和基礎API採用了一體化設計,兩者可以互相配合使用,做到高低融合,確保用戶可以同時享受開發的便捷性和靈活性。
● 超大規模深度學習模型訓練技術
飛槳突破了超大規模深度學習模型訓練技術,領先其它框架實現了千億稀疏特徵、萬億參數、數百節點并行訓練的能力,解決了超大規模深度學習模型的在線學習和部署難題。此外,飛槳還覆蓋支持包括模型并行、流水線并行在內的廣泛并行模式和加速策略,率先推出業內首個通用異構參數伺服器架構和4D混合併行策略,引領大規模分散式訓練技術的發展趨勢。
● 多端多平台部署的高性能推理引擎
飛槳對推理部署提供全方位支持,可以將模型便捷地部署到雲端伺服器、移動端以及邊緣端等不同平台設備上,並擁有全面領先的推理速度,同時兼容其它開源框架訓練的模型。飛槳推理引擎支持廣泛的AI晶元,特別是對國產硬體做到了全面的適配。
● 產業級開源模型庫
飛槳建設了大規模的官方模型庫,演演算法總數達到270多個,包含經過產業實踐長期打磨的主流模型以及在國際競賽中的奪冠模型;提供面向語義理解、圖像分類、目標檢測、圖像分割、文字識別(OCR)、語音合成等場景的多個端到端開發套件,滿足企業低成本開發和快速集成的需求。飛槳的模型庫是圍繞國內企業實際研發流程量身定製打造的產業級模型庫,服務企業遍布能源、金融、工業、農業等多個領域。

工具組件


AutoDL
飛槳自動化深度學習工具,旨在自動網路結構設計,開源的AutoDL設計的圖像分類網路在CIFAR10數據集正確率達到 98%,效果優於目前已公開的10類人類專家設計的網路,居於業內領先位置。(數據來源:內部測試10種網路分別為:vgg_15_BN_64、vgg_16、resnet_32、resnet_56、resnet_110、resnet_v2_bottleneck_164、wide_resnet、densenet_BC_100_12、resnet_29_8x64d、shake_shake_64d_cutout,實際結果可能受測試環境影響而在一定範圍內變化,僅供參考)
PARL
飛槳深度強化學習框架PARL,在2018、2019、2020奪得強化學習挑戰賽三連冠。具有高靈活性、可擴展性和高性能的特點。實現了十餘種主流強化學習演演算法的示例,覆蓋了從單智能體到多智能體,離散決策到連續控制不同領域的強化學習演演算法支持。基於GRPC機制實現數千台CPU和GPU的高性能并行。 
PALM
飛槳多任務學習框架PALM,一個靈活、通用且易於使用的NLP大規模預訓練和多任務學習框架,旨在快速開發高性能NLP模型的上層框架。使用PALM可以非常輕鬆靈活的探索具有多種任務輔助訓練的“高魯棒性”閱讀理解模型,基於PALM訓練的模型D-Net在EMNLP2019國際閱讀理解評測中奪得冠軍。 
PaddleFL
飛槳聯邦學習框架PaddleFL,研究人員可以很輕鬆地用PaddleFL複製和比較不同的聯邦學習演演算法,便捷地實現大規模分散式集群部署,並且提供豐富的橫向和縱向聯邦學習策略及其在計算機視覺自然語言處理、推薦演演算法等領域的應用。此外,依靠著飛槳的大規模分佈 式訓練和Kubernetes對訓練任務的彈性調度能力,PaddleFL可以基於全棧開源軟體輕鬆部署。 
PGL
飛槳圖學習框架PGL,業界首個提出通用消息并行傳遞機制,支持百億規模巨圖的工業級圖學習框架。PGL基於飛槳動態圖全新升級,極大提升了易用性,原生支持異構圖,支持分散式圖存儲及分散式學習演演算法,覆蓋30+圖學習模型,包括圖語義理解模型ERNIESage等。歷經大量真實工業應用驗證,能夠靈活、高效地搭建前沿的大規模圖學習演演算法。 
Paddle Quantum
量槳Paddle Quantum,飛槳量子機器學習框架,提供量子優化、量子化學等前沿應用工具集,常用量子電路模型,以及豐富的量子機器學習案例,幫助開發者便捷地搭建量子神經網路,開發量子人工智慧應用。 
PaddleHelix
飛槳螺旋槳生物計算框架PaddleHelix,開放了賦能疫苗設計,新葯研發,精準醫療的AI能力。在疫苗設計上,PaddleHelix的LinearRNA系列演演算法相比傳統方法在RNA摺疊上提升了幾百上千倍的效率;在新葯研發上,PaddleHelix提供了基於大規模數據預訓練的分子表示,助力分子性質預測,藥物篩選,藥物設計等領域;在精準醫療上,PaddleHelix提供了利用組學信息精準定位藥物,提升治癒率的高性能模型。
PaddleHub
飛槳預訓練模型應用工具PaddleHub,覆蓋文本、圖像、視頻、語音四大領域超過200個高質量預訓練模型。開發者可以輕鬆結合實際業務場景,選用高質量預訓練模型並配合Fine-tune API快速完成模型驗證與應用部署工作。適用於個人開發者學習、企業POC快速驗證、參加AI競賽以及教學科研等多種業務場景。 
PaddleX
飛槳全流程開發工具PaddleX,以低代碼的形式支持開發者快速實現深度學習演演算法開發及產業部署。提供極簡Python API和可視化界面Demo兩種開發模式,可一鍵安裝。針對CPU(OpenVINO)、GPU、樹莓派等通用硬體提供完善的部署方案,並可通過RESTful API快速完成集成、再開發,開發者無需分別使用不同套件即可完成全流程模型生產部署。可視化推理界面及豐富的產業案例更為開發者提供飛槳全流程開發的最佳實踐。 
VisualDL
飛槳可視化分析工具VisualDL,以豐富的圖表呈現訓練參數變化趨勢、模型結構、數據樣本、高維數據分佈、精度召回曲線等模型關鍵信息。幫助用戶清晰直觀地理解深度學習模型訓練過程及模型結構,進而實現高效的模型調優、並將演演算法訓練過程及結果分享。 
PaddleCloud
飛槳雲上任務提交工具,能夠幫助您一鍵發起深度學習任務,為您提供快速打通雲上計算資源通道,支持您快速發起單機/分散式飛槳核心框架訓練任務,致力於推動AI應用更廣泛地落地。

開發套件


ERNIE
飛槳語義理解套件, 基於持續學習語義理解預訓練框架,使用多任務學習增量式構建預訓練任務,支持各類訓練任務的Fine-tuning,保證極速推理的Fast-Inference API,兼具靈活部署的ERNIE Service和具備輕量方案的ERNIE Tiny系列工具集。 
PaddleClas
飛槳圖像分類套件PaddleClas,目的是為工業界和學術界提供便捷易用的圖像分類任務預訓練模型和工具集,打通模型開發、訓練、壓縮、部署全流程,輔助其它高層視覺任務組網並提升模型效果,助力開發者訓練更好的圖像分類模型和應用落地。 
PaddleDetection
飛槳目標檢測開發套件PaddleDetection,旨在幫助開發者更快更好地完成檢測模型的訓練、精度速度優化到部署全流程。PaddleDetection以模塊化的設計實現了多種主流目標檢測演演算法,並且提供了豐富的數據增強、網路組件、損失函數等模塊,集成了模型壓縮和跨平台高性能部署能力。目前基於PaddleDetection已經完成落地的項目涉及工業質檢、遙感圖像檢測、無人巡檢等多個領域。 
PaddleSeg
飛槳圖像分割套件PaddleSeg,覆蓋了DeepLabv3+、OCRNet、BiseNetv2、Fast-SCNN等高精度和輕量級等不同方向的大量高質量分割模型。通過模塊化的設計,提供了配置化驅動和API調用等兩種應用方式,幫助開發者更便捷地完成從訓練到部署的全流程圖像分割應用。 
PaddleOCR
飛槳文字識別開發套件PaddleOCR,旨在打造一套豐富、領先且實用的OCR工具庫,開源了基於PP-OCR實用的超輕量中英文OCR模型、通用中英文OCR模型,以及德法日韓等多語言OCR模型。並提供上述模型訓練方法和多種預測部署方式。同時開源文本風格數據合成工具Style-Text和半自動文本圖像標註工具PPOCRLable。 
PaddleGAN
飛槳生成對抗網路開發套件PaddleGAN,集成風格遷移、超解析度、動漫畫生成、圖片上色、人臉屬性編輯、妝容遷移等SOTA演演算法,以及預訓練模型。並且模塊化設計,以便開發者進行二次研發,或是直接使用預訓練模型做應用。 
PLSC
飛槳海量類別分類套件PLSC,為用戶提供了大規模分類任務從訓練到部署的全流程解決方案。提供簡潔易用的高層API,通過數行代碼即可實現千萬類別分類神經網路的訓練,並提供快速部署模型的能力。 
ElasticCTR
飛槳個性化推薦開發套件ElasticCTR,可以實現分散式訓練CTR預估任務和基於Paddle Serving的在線個性化推薦服務。Paddle Serving服務化部署框架具有良好的易用性、靈活性和高性能,可以提供端到端的CTR訓練和部署解決方案。ElasticCTR具備產業實踐基礎、彈性調度能力、高性能和工業級部署等特點。 
Parakeet
飛槳語音合成套件,提供了靈活、高效、先進的文本到語音合成工具,幫助開發者更便捷高效地完成語音合成模型的開發和應用。

企業版


飛槳企業版針對企業級需求增強了相應特性。包括提供更全面和強大的功能、更易用的可視化界面,預置更豐富的場景模型,提供更強化的安全許可權管理等。
相對於同類平台而言,飛槳企業版具有自主可控的底層飛槳開源框架支持,預置百度積累的大規模數據訓練而成的高精度預訓練模型,全面支持安全高效的公有雲和可靈活支持私有化或本地部署。數據更安全、部署更靈活、訓練精度更高、集成更便捷,讓各類企業享受高質量的一站式AI開發服務。
飛槳企業版包含EasyDL零門檻AI開發平台和BML全功能AI開發平台:
● EasyDL:面向企業AI應用開發者,提供零門檻、內置端到端自動化訓練機制、多場景的高精度模型定製平台。
● BML:l 面向企業演演算法工程師,提供功能全面、預置豐富的網路和模型、可靈活定製和被深度集成的AI開發平台。

應用落地


飛機複合材料結構件超聲圖像損失檢測
● 項目背景
隨著國產大飛機ARJ21C919等型號研製推進,中國商飛北研中心承擔的航空複合材料許用值試驗和疲勞門檻值試驗日趨加重,對試驗件的無損檢測和損傷檢測需求逐漸增加。但由於無損檢測過程中缺陷評定對檢測人員的專業知識有依賴性強,設備開放程度低、檢測數量大等問題,人工缺陷評定速度已成為制約型號任務進度的瓶頸。
● 應用方案
針對項目落地面臨的數據量少、應用場景複雜、檢測精度要求高,以及AI開發能力薄弱等問題,商飛北研中心利用百度飛槳PaddleSeg開發套件順利完成了複合材料檢測演演算法的開發。首先,開發人員使用PaddleSeg集成的數據增強工具,結合航空複合材料超聲圖像數據的特徵,輕鬆完成了數據大規模擴張;然後,通過對PaddleSeg官方提供的預訓練模型U-Net和Deeplabv3進行訓練、測試和多維度結果分析,選用了跟業務場景更契合的經典模型U-Net完成語義分割;最後,利用PaddleSeg提供的完善的配置文件,非常便捷快速地完成了部署上線。
● 應用效果
流程完成了智能化改進后,全流程用時僅5.3分鐘,檢測工時減少71%,準確率提升至95%,單批次試驗人工成本減少21.63萬元。有效減少了檢測人員工作量,極大地縮短了複合材料超聲檢測時長,有效加速了型號研製迭代速度,實現了勤儉研製大飛機的企業目標
動力電池高精度質量檢測
● 項目背景
作為動力電池製造龍頭企業,寧德時代新能源科技股份有限公司動力電池產量大、質檢嚴,僅新能源車領域需要檢測的參數就超過了3000個。為了保證電池品質,寧德時代要求產品線上的電池達到缺陷漏檢率小於1DPPB、單張產品圖像缺陷檢測平均時長<2ms檢測標準。但動力電池缺陷種類複雜且差距小,想要通過傳統質檢方法達到安全生產要求,需要耗費大量的人力財力:一條流水線就需要十幾個質檢工人,而且不同的生產線標準不一樣,需要人工逐個確認。
● 應用方案
為了解決產業難點,寧德時代通過百度飛槳深度優化過的PP-YOLO和ResNet系列演演算法,提升了演演算法精度;通過調整預測Batch,採用多線程數據預處理、優化數據內存拷貝時間等策略,提升了檢測精度及預測效率,使其充分適應實際生產需求。
● 應用效果
採用電池質量智能化檢測后,部分工序已經運用人工智慧演演算法進行升級,整體產品檢測相較於原本的傳統檢測演演算法過殺率降低了66.7%,缺陷漏檢率小於1DPPB。演演算法泛化能力和在多產線上進行遷移部署的效率也得到了全面提升。不僅進一步保障了寧德時代的動力電池質量,也在一定程度上實現了低成本高效復用經驗,大大降低了產線研發成本
5G智能園區車輛行為識別
● 項目背景
隨著物聯網設備連接和交互能力的大幅提升,園區車輛管理能力再次成為物流行業的主要瓶頸。採用傳統的本地化監控系統,不僅監控位置不直觀、無法雲端觀看,還需要配備高頻次的人工巡檢。異常處理時間長、作業效率低、人工失誤不可避免。
● 應用方案
京東物流運用飛槳PaddleDetection、PaddleSeg和PaddleSlim等開發套件,設計了一套完備的CV監控方案,實現了車輛智能化管控。通過目標檢測和OCR來識別車牌、檢測車輛(進入/離開園區),並針對貨運車輛車牌形態多樣化,採取數據增強方式確保樣本覆蓋現有業務場景。在用目標跟蹤和狀態識別來監控車輛狀態的任務場景中,針對遇到的問題,研發團隊將多路攝像頭數據在訓練階段就混入了單模型的訓練數據中,提高了目標跟蹤過程的精確度;在狀態識別過程中,充分考慮時序特徵,提高了最終的識別精確度。
● 應用效果
升級為可遠端高清直播、可自動分析異常的智能化監控系統后,京東物流的車牌識別率大幅提升,人員、場站、生產、監控、巡檢五大領域管理能力實現了全面提升,迎來了從“被動型傳統管理”到“主動型智能管控”的巨大轉型,降低了人工誤差的同時,有效提升了作業效率。
支持海量用戶需求的大規模分散式推薦系統
● 項目背景
OPPO自2018年起開始大舉進軍網際網路業務,創立了信息流、信息流廣告、應用商店、遊戲中心、商業中心等諸多業務線,並迅速積累了大量的用戶和數據。由於業務規模的急劇擴張, OPPO原來在單機上搭建的訓練系統不具備處理大規模數據和訓練大型推薦系統的能力,嚴重製約了網際網路的業務發展,急需更好的框架體系來滿足業務方對於模型訓練速度、效果指標增長的需求。
● 應用方案
基於飛槳的能力對應用商店進行了升級:採取高性能數據讀取介面Dataset完成大規模數據的讀取;採用基於參數伺服器的大規模CPU分散式的全非同步訓練模型,以較低的資源消耗來訓練海量的數據以及極大的稀疏參數。
● 應用效果
● 性能強:全非同步大規模訓練集群規模,業務模型訓練速度提升效果顯著;
● 參數規模大:Embedding規模&模型擴大數倍;
● 效果好:在多個場景(廣告,信息流等),線上關鍵指標提升效果顯著;
● 性價比高:參數伺服器訓練,大幅度減少內存開銷。
南網科技
機器人安全巡檢
● 項目背景
電能從生產到消費要經過發、輸、變、配、用五大環節,任何一個環節出問題,都會影響到電能的正常供應。其中,輸變電是電能通過電網傳輸的重要部分。電力巡檢的核心工作內容,就是對輸變電設備進行運維,以確保其正常工作,保障電力系統的安全運行和電能的穩定供應。
● 應用方案
南方電網電力科技股份有限公司的技術攻關團隊引入飛槳開源深度學習框架,利用飛槳團隊實現的高性能目標檢測演演算法YOLOv3及語義分割演演算法U-Net,使機器人面向表計的深層次特徵提取能力大大提高,突破了環境因素的制約,方法的準確率和魯棒性顯著提升,在表計目標檢測、示數讀取等方面的效果尤為顯著。
● 應用效果
在基於飛槳的錶盤檢測及錶盤分割項目中,錶盤檢測的最高mAP達到了0.9857,總體的讀數±2°誤差內準確率高達99.01%。藉助深度學習賦能的變電站智能裝備(機器人),人工巡檢耗時大幅減少。原來需要6小時才能完成的巡檢工作現在只需花10分鐘進行讀數複核即可,實現了基於准實時自動巡檢的變電站智能運維。
度小滿
金融風控建模
● 項目背景
網際網路金融快速發展,每天在平台上會發生數以萬計的借貸、還款等行為。傳統人工處理不僅對從業審核人員要求非常高,而且效率、審核標準的統一性也無法保證。傳統的風控建模技術是基於小樣本的監督學習,依賴於特徵挖掘,需要耗費大量人力且依賴個人經驗;傳統技術對於小樣本的文本類數據處理往往缺乏上下文的理解,未能提取其重點,導致對用戶的理解出現偏差。
● 應用方案
百度自研知識增強語義理解框架ERNIE,充分利用海量數據和飛槳多機多卡高效訓練優勢,通過深度神經網路與多任務學習等技術,持續學習海量數據和知識,助力各NLP任務效果顯著提升。目前,百度對外發布基於該框架的ERNIE 2.0預訓練模型,該模型累計學習10億多知識,刷新16個中英文NLP任務效果。
在度小滿風控場景中,利用ERNIE對業務信息進行語義層面深度建模,結合風控少量訓練數據進行精細Fine-tune,在較短的時間內即可完成風控模型的收斂並且具備更好的泛化能力。
● 應用效果
度小滿金融風控模型KS相對提升約6.35%,AUC相對提升超過1.55%,用戶排序優化約 21.5%。
三行科技
自動財報解析系統
● 項目背景
對項目標的主體公司的風險評估是金融機構開展業務的起點,而標的公司財務數據分析是量化評估業務風險的基礎。三行公司發現採用傳統人工的方式進行財務數據分析,不僅會耗費高額的人力成本,而且人工錄入效率低、錯誤率高等特點,更是會給業務帶來不可預知的風險和損失。但想通過機器識別代替人工也並非易事,項目面臨著開發困難、精度要求高等一系列難題。
● 應用方案
三行科技藉助飛槳開源深度學習平台的PaddleOCR工具輕鬆完成了審計報表(股票債券市場公開披露的掃描版)的文字識別。首先,基於U-Net模型對錶格線進行檢測,劃分出可見橫豎線和不可見橫豎線;然後,基於FastText進行科目標準化,解決報表科目表述不一致的問題;最後,通過CRNN解碼過濾無效字元,進一步提升精度(如有印章可先利用Noise2Noise去除)。
● 應用效果
三行科技藉助PaddleOCR開發的文字識別演演算法,在文字檢測召回率上較之前演演算法提升5%,檢測速度提升30%,實現財務報表科目和金額的高效識別,成功完成了財務數據的結構化存儲,為後續多項業務過程提供數據基礎。
連心醫療
基於CT/MRI多模態影像的鼻咽癌GTV勾畫
● 項目背景
腫瘤治療中,醫生需要親自勾畫病灶區域(即靶區)來進行精準放療,這一步驟決定了放療質量的60%。但這一工作通常需要基於不同部位的50-200張不等的CT或MRI二維影像中勾畫出三維立體靶區,不同的醫生會因為主管評價標準的差別使得勾畫範圍的結果差異較大,給這一步驟增加了許多不確定性,導致診療效率低下。
● 應用方案
連心醫療基於飛槳語義分割套件PaddleSeg中的U-Net語義分割網路開發了基於CT和MRI多模態影像的鼻咽癌病灶靶區自動勾畫系統,基於放療醫生勾畫的CT/MRI多通道影像建立數據集,採用圖像裁剪和增強等預處理方法提升數據集的質量,採用假陰假陽的后處理抑制,最後採取邊緣檢測得到勾畫結果。
● 應用效果
項目完成後,系統的精度達到醫生勾畫水平,並可以快速自動地勾畫出三維靶區,提供更精準的放療規劃方案,輔助放療臨床醫生高效診療。
更多案例
1.智能農業
耕地地塊提取
傳統對遙感圖像的處理,依賴於大量擁有遙感專業背景的人工使用專業軟體進行分析。衛星遙感影像數據存在畫幅巨大、肉眼解析度低、對識別人員專業要求能力高等問題,且人工標註需要大量重複勞動,非常費時費力,枯燥無味。
中科賽諾(北京)科技有限公司基於飛槳的自動農耕地塊提取系統,可快速自動獲得農耕用地邊境及面積,從而達到進行有效的估產並輔助相關其它農事活動。應用飛槳 Deeplab V3實現地塊面積提取準確率達80%以上,對作物長勢、作物分類、成熟期預測、災害監測、估產等工作進行高效輔助,大大減少了傳統人力的投入。
桃子分揀機
傳統農業生產過程中,桃子採摘后需要人工根據其品質進行篩選,質量無法得到保證的同時還耗費大量的人工和時間成本。
智能桃子分揀機集成了圖像分類模型,將桃子智能分類模型訓練、機械自動化採集樣本數據,完成桃子分揀自動化。提升桃子分揀準確率至90%以上;節省90%人力成本,每年為桃農直接節省近3萬元。(數據來源:內部測試結果,實際結果可能受測試環境影響而在一定範圍內變化,僅供參考。節省費用估算公式為人工勞務單日費用*工人數-設備成本開銷)
2.智能工業
碩橙機器聽診大師
碩橙將飛槳用於機器設備雜訊識別,實現了設備生產量的實時統計,並評估設備的運行狀態。對於生產量統計,先將雜訊分解為多個維度的機械運動特徵量,然後截取一定長度的數據,送入一個深度神經網路,特徵量波形識別為機械設備的動作,從而實時判斷設備的生產量。
對於運行狀態的評估,仍然是先將雜訊分解為多個維度的機械運動特徵量,然後根據前述生產量統計應用得到的生產周期,將一個生產周期內的全部特徵量構建成一個在高維空間中的分佈,並根據歷史記錄尋找絕大部分樣本集中的區域包絡面,最後使用One class SVM方法對每一次生產周期進行評分,實時給出整體運行狀態評價。
3D智能抓取機器人
矩視智能研發的缺陷檢測系統在飛槳的AI Studio環境下,將飛槳提供的圖像檢測模型與自主研發的演演算法相結合,對鍵槽軸心外觀齒部冷鍛傷類型缺陷進行檢測,保證缺陷檢測系統準確率的同時,大大提升了圖像處理的速度。每齒輪檢測時間<300ms/幀,連續運行100次,誤判率≦1%。
瓷器及地板表面質量檢測
北京奇想天外科技有限公司,智能硬體解決方案商,應用飛槳目標檢測模型,在廣東松發陶瓷股份有限公司的瓷器生產質檢線上,實現了5類缺陷的檢測,在15%誤識率的基礎上,實現了90%檢出率,比傳統人眼識別,效率提升了20%。
(數據來源:內部測試結果,實際結果可能受測試環境影響而在一定範圍內變化,僅供參考)
精諾鋼鐵熔煉生產工藝優化
合金熔煉的過程中,合金元素會根據爐內溫度、熔煉時間等因素髮生無法用機理進行判斷和解釋變化,傳統合金熔煉環節大多由有經驗的師傅進行補料,需要多次實驗和調整,廢料廢時。
精諾數據基於百度深度學習平台飛槳,研發了IAPBOA演演算法,利用歷史配料數據建模,實現智能化計算。通過機器學習優化企業個性化配料方案,最終達到生產質量和生產成本的有效平衡點,從而指導熔煉生產,減少對經驗的依賴,達到提升熔煉效率、節省原材料的效果。
3.智能城市
樓宇設備智能管理
樓宇設備工況運行調控依賴人工, 而運維專業水平不齊,運行效率不高,導致能源浪費、無法及時根據外界環境變化來調整系統輸出,樓宇內用戶體驗不好。
百度科技園將基礎運行積累的大數據與深度學習演演算法結合起來,提高了機電系統運行效率,完善日常保養策略,提供故障預警、保養提醒功能,實現智能運營。目標樓宇日均節電20%+,年節電約100萬度,節約電費30%+,有效提升樓宇運營效率。
AI控煙
在2018年世界無煙日,百度科技園發起AI控煙公益項目,由百度工程師用飛槳的目標檢測模型成功識別下沉廣場的吸煙者,在廣場大屏幕給吸煙者實時發送健康提示。該項目基於百度飛槳開源平台的深度學習能力,對數萬張吸煙動作圖片進行了43次深度學習模型訓練,可實現對吸煙動作的識別,通過視頻監控的數據從人群中識別出正在吸煙的人,將其圖像提取並標註保存。
4. 智能零售
生鮮進貨量智能預測
由於生鮮產品保質期極短,需要豐富的進貨經驗才能降低貨物過期報損率,然而店長經驗參差不齊,無法保證準確預估全部店鋪的進貨量。
通過利用商超生鮮的歷史銷售數據,從位置、時段、節假日、天氣等維度,提取出多個影響銷量的條件,使用DNN神經網路到建立銷量預測模型,比店長預測更為準確,整體報損降低30%+、模型進貨凈利潤較店長進貨提升約20%。
智慧購物解決方案(以圖搜商品)
隨著消費網際網路流量紅利的逐漸殆盡,移動網際網路的主戰場轉向產業網際網路,家居行業3D數字化進程高歌猛進,行業開始沉澱下了大量的與真實商品對應3D模型數據,如何應用真實商品的3D數據的多維度特點,來改善消費者的購物體驗具有重要意義。但如今,線下實體店仍然佔據部分銷售額,線上流量無法直接轉化成消費行為是行業中的一大痛點。如何將線上線下的優勢結合,優化資源配置,快速實現線下家居實體業的進化,成為家裝企業發展的重中之重。次元視界應用Faster R-CNN模型實現2D圖像的特徵提取,再生成3D模型,達到了模型輪廓識別準確率達到89%,FPR降低了32%,顯著的提升了應用效果。
5.智能推薦
智能招聘——簡歷職位智能匹配系統
雲腦科技使用飛槳搭建的Gated Model(GQM),是基於CNN、DSSM、C-DSSM等演演算法的文本匹配模型。GQM在上述模型架構的基礎上,優化了全局語義特徵的提取,以及查詢文本於候選匹配文本的語義特徵交互,進而達到更快速、單文本上下文特徵提取範圍更廣、文本對語義特徵交互優化、同時高準確匹配的效果。綜合企業需求與求職者的簡曆數據,實現企業與求職者雙方需求的高效率匹配。項目現運用於雲腦的合作夥伴實習僧的項目中,實現面試邀約成功率提升5倍。(數據來源:內部估算結果,計算方式一定時間內使用簡歷職位智能匹配系統後面試邀約平均成功率除以使用簡歷職位智能匹配系統之前的面試邀約平均成功率)
6.智能製造
智能零件分揀機
零部件的質量,決定了工業裝備的整機性能。但是,由於小零件的數量龐大,人工執行質量檢測與分揀的效率低、成本高,迫切需要引入智能機器對人力替代。在此背景下,領邦智能面向市場推出了智能零件分揀機。
領邦基於百度深度學習平台飛槳訓練CNN分類網路模型,讓分揀機能夠自動學習良品和缺陷品的分類特徵,並對工件圖像實時做出自動判別與分類。智能分揀機能夠高效、準確識別零件種類與問題,檢測速度可達20ms/件。機器可以在精度上與人工檢測持平,同時在質檢速度上大幅提升。根據測算,一台檢測機器可以代替十多位熟練質檢工人,能夠幫助企業降低15%的生產成本。另外,分揀機的應用具有較好的拓展性,可支持數十種形狀各異、高精密的小零件分揀。
7.智能醫療
甲狀腺結節圖像智能識別與輔助診斷系統
整合醫生專家的診斷邏輯,基於飛槳平台構建深度學習模型,對標註好的甲狀腺結節圖像進行訓練,抽取圖像特徵,從而判定甲狀腺結節的良惡性,實現甲狀腺圖像智能識別系統,輔助醫生進行診斷。
智能醫療輔助診斷系統(AIMADS)
AIMADS可用於常見皮膚病和腦腫瘤的輔助診斷,用戶可通過在客戶端上傳患處圖片到伺服器,伺服器端通過本團隊設計的診斷演演算法在飛槳平台對上傳數據進行分析,在 APP 中顯示診斷結果。
8.趣味生活
2018年7月,小度猜拳手通過使用深度卷積神經網路技術訓練出能夠識別用戶出拳結果的模型,該模型可以識別石頭、剪刀、布的手勢。在用戶出拳過程中,系統會不斷採集用戶的手勢圖片,通過飛槳實時預判人的出拳概率。
9.社科類
全球瀕危語言典藏--土家語翻譯系統
當前學術界意識到了瀕危語言問題的重要性,積極倡導各國語言學家對本國語言、尤其是瀕危語言加以關注,並採取具體的行動進行口語記錄、語言典藏。2003年英國倫敦大學開展了對全球瀕危語言進行深度典藏的國際項目,2004年中國開始參與到項目之中,中國社會科學院民族學與人類學研究所徐世璇教授作為中國參與國際瀕危語言典藏項目的負責人人,負責包括土家語的保存等重要項目。社科院利用飛槳實現了針對土家語預料的標音及意譯,演演算法準確率已經達到了約70%,達到人工標註水平,且效率提高了幾個數量級。在當前全球瀕危語言保護工作中起到了重要作用。
以上所有數據來源:內部測試結果,實際結果可能受測試環境影響而在一定範圍內變化,僅供參考。

社區與生態


開發者社區
PPDE | 飛槳開發者技術專家計劃 
飛槳開發者技術專家計劃(PaddlePaddle Developers Experts)是飛槳社區為開發者提供的榮譽認證體系,支持開發者踐行開源理念,引領技術潮流,共建繁榮社區,通過技術成長與社區貢獻進階,開發者可以成長為PPDE、高級PPDE及資深PPDE,並且享受多樣頂級權益:
● 專享服務權益:專人技術支持,技術大賽輔導等,助力技術成長與項目落地
● PPDE大禮包:PPDE成員專享的神秘禮包,包含一系列個人身份認證與禮品
● 個人品牌打造:PPDE專屬身份認證、網頁展現、項目宣傳及相關活動擔任主講
● 官方活動主推:Wave Summit及百度其他技術峰會講師邀約
● 技術大咖交流:獲得與技術大咖面對面交流的機會
● PPDE Club:定期與飛槳產品技術團隊面對面交流需求,對產品提出意見建議
● 全球技術遊學:贊助前往國際國內頂會,作為百度開發者代表進行交流
● 頂級項目支持:贊助具有重大科研價值或社會公益價值的項目
PPDE計劃迄今已有100多位成員,此計劃面向全球應用飛槳的技術極客、開源項目貢獻者、高校教授、技術博主、暢銷書作家等發出邀請,只要滿足以下3項條件之一,即可提交申請:
技術成果:應用飛槳產出至少2篇優質技術文章或視頻教程;或應用飛槳產出並開源至少4個優質項目;或在GitHub為飛槳至少提交過4次PR
開源實踐:樂於為飛槳開源社區的發展貢獻力量,成為至少2次線上/線下技術分享的主講人,積極為其它成員答疑解惑
其它:包括不限於在實際場景中落地飛槳技術並開源項目、應用飛槳參加大賽取得優異成績並將項目開源、寫作飛槳應用實踐相關暢銷書籍、在高校開設飛槳相關課程等
飛槳領航團 | 已覆蓋29個省市,130+高校 
飛槳開發者的興趣社區,為開發者們提供豐富的本地技術沙龍、Meetup及線上交流平台。飛槳領航團已建立150個社群,覆蓋29個省級行政區,133個高校。歡迎開發者們加入領航團,結實更多本地技術同好,共建開源社區,共享開源成果與快樂。
● 官方學習資料:實時提供飛槳最新的學習資料及直播課程等
● 最新技術資訊:實時提供產業落地案例、產品功能升級、產業動態等一手資訊
● 線上線下活動:組織豐富的線上線下活動,包括黑客馬拉松、圓桌論壇,技術大咖交流、開發者meetup等
● 技術支持:為開發者的項目開發提供官方團隊及社區的技術支持
PP SIG | 飛槳特別興趣小組
通過開放的社區形式與全球的開發者共同構建一個開放、多元和架構包容的生態體系。目前已建立的PP SIG包括計算機視覺、推理部署、工具效率組件等多個技術方向等。
飛槳博士會 | 100+博士已加入 
中國深度學習俱樂部,助力會員交流前沿科技,拓展行業高端人脈
● 核心開發者交流圈:飛槳博士會成員皆為博士及以上學歷,具備深度學習多年研究和實踐經驗
● 線下高端技術沙龍:定期舉辦,百度核心研發工程師主講深度學習前沿技術,與會員研討最新研發成果
● 科研合作資源支持:博士會員如在科研中使用飛槳,可優先獲得 GPU算力、飛槳研發團隊技術支持等
● 商業生態優先合作:博士會員所在科研院所或企業如有合作需求,可優先享有飛槳商業合作諮詢服務、飛槳研發團隊技術支持等特權
百度AI競賽 | 以賽引才、以賽促用、以賽興業
飛槳承辦了80餘場國內外大型AI賽事。賽題方向覆蓋人工智慧技術前沿領域,致力於打造全球領先的AI賽事,聚才興業,推動智能經濟發展。
飛槳開放多年辦賽先進經驗,提供一站式專業辦賽服務支持,誠邀各機構、公司、院校等合作夥伴,共同舉辦具有影響力的AI賽事。
● 專業辦賽服務支持:開放豐富辦賽經驗,提供一站式比賽管理平台,包括賽事發布、在線組隊、自動化評測及排名更新等功能,助力主辦方實時監控比賽數據,掌握比賽動向。
● GPU算力支持:飛槳AI Studio提供在線開發環境,比賽專屬Tesla V100 GPU算力補貼,破除選手算力桎梏。
● 百度系全棧流量曝光:專業賽事宣傳服務,社群定向開發者邀約,最大化賽事影響力。
● 技術支持及人員線上培訓:飛槳技術專家坐鎮指導,提供全流程辦賽技術支持;資深比賽隊員在線分享大賽經驗。
企業服務
AICA-首席AI架構師培養計劃 | 閉門小班,為中國產業界培養高端複合型AI人才
專註於深度學習產業落地應用,與百度最有經驗的AI專家閉門學習、研討,助力企業跨越鴻溝
● 頂尖師資:百度深度學習T10+架構師面對面深度交流,培育極其稀缺的產業+AI複合型人才
● 案例剖析:剖析百度AI業務及生態夥伴企業中,業務與深度學習結合的典型案例,舉一反三
● 經驗解鎖:授課老師、指導專家、助教三師制全程指導,解鎖百度核心業務中深度學習落地的關鍵技術
● 產業創新:企業AI項目一對一研討,助力企業形成AI方法論,解決實際業務問題,挖掘智能化新機遇
AI私享會 | 深入行業,定向研討,產研專家交流碰撞的高端沙
聚合產業精英與AI技術專家,破解行業技術難題,洞察未來發現機遇
● 高端圓桌:限量邀請領域內優質企業,與行業大咖面對面深度溝通
● 行業聚焦:每場主題討論所在行業面臨典型挑戰與機遇
● 問題剖析:針對落地難題,各方技術專家深度解惑
● 資源整合:產業上下游企業資源打通,共創行業AI新機遇
AI快車道 | 支持10000家企業智能化升級
詳解行業場景AI應用所必需的深度學習技術方案,助力企業領跑新基建
● 行業案例:匯聚行業場景真實案例,在多個案例的通用性和差異性中萃取行業技術經驗
● 技術詳解:結合飛槳產業級AI開發工具,詳細解讀深度學習開發全流程的技術方法和性能優勢
● 即學即用:深度學習,簡單開發,通過課程講解+答疑交流+課件材料深入淺出的指導快速開發
● 全國巡迴:過去2年已完成8個城市30餘場線下課程,2021將繼續開展高頻次的城市交流
飛槳技術夥伴計劃 | 全方位賦能夥伴企業深度學習技術能力提升,共享AI未來
以技術賦能為宗旨,產業落地為目標,助力合作夥伴客戶規模化落地
● 聯合研發:共同打造行業深度學習技術方案,提高項目交付質量
● 專項支持:合作夥伴專人對接,重要項目技術專家專項支持
● 官方推廣:優秀夥伴及案例可獲得飛槳官網等多平台展示推廣機會
● 業務支持:優質創業企業給予上下游產業資源、戰略投資等方面的資源支持
教育生態
深度學習7日打卡營
通過7日短平快的在線打卡學習,幫助開發者快速掌握深度學習技術
● 內容最新:結業最新技術與熱點話題,開發最前沿的實戰課程
● 專業講師:百度官方認證的深度學習佈道師授課
● 形式多樣:直播、打卡、比賽、PK等多重激勵,專治拖延症
飛槳官方深度學習集訓營
通過3-4個月的系統學習,助力開發者零基礎入行深度學習
● 權威講師:大佬坐鎮,百度核心架構師全程直播教學
● 系統課程:零基礎入門到實戰,涵蓋CV、NLP、推薦系統等應用領域
● 實戰導向:全實戰教學、手把手敲代碼,首發百度特色實戰案例
豐富在線實戰課程
包含5000+小時AI深度學習實戰課程,不同開發者輕鬆找到匹配的學習路徑
● 課程全面:內容覆蓋Python、機器學習、深度學習等全體系的AI實戰課程
● 實戰導向:視頻+文檔+代碼,免安裝的在線實訓環境,免費GPU資源
● 測評考試:部分課程包含測評考試功能,實時掌握自身學習成果
飛槳啟航計劃:攜手高校、破浪前行
● 預計總投入5億元
● 深度合作高校院所500所
● 聯合打造5000人專業教師隊伍
● 聯合培養50萬AI未來人才
AI人才產教融合培養方案
飛槳在人工智慧技術以及行業深入探索,力爭為高校提供一套涵蓋教學體系、教學大綱、教學方案、教材、教學教研產品等完整的、全流程、全體系的AI人才產教融合培養方案。著力為推進高校快速建立人工智慧專業及人工智慧人才培養和就業提供生態環境,包括教學、科研、人才拓展、應用場景等多個方面的服務體系,涵蓋機器學習、計算機視覺、自然語言處理、語音識別等多個領域,將項目應用開發和教學科研緊密結合,打造覆蓋人工智慧全行業的高質量複合型、創新型、應用型人才。
高校教學支持計劃
提供四位一體的課程共建方案,支持200+高校開設人工智慧課程
● 師資培訓:新工科聯盟第一個深度學習師資培訓班,技能全方位提升
● 開課禮包:全套課程體系、課件PPT、實踐案例、教學視頻、專業教材
● 實踐平台:免安裝的實踐環境,完善的班級管理功能,免費的GPU資源
● 協同育人:支持高校實踐創新、教學創新,基金累計發放超過200萬元
飛槳高校深度學習師資培訓班
在教育部指導下,百度飛槳與全國重點高校聯合打造的深度學習師資培養計劃
● 師資培養:已開辦15期師資培訓班,培養了2000+名深度學習專業教師
● 實踐導向:高強度代碼實踐,教師技術水平72小時飛躍式提升
● 教學研討:開課思路與教學法研討,從輸入到輸出,解鎖高校AI教學新思路
企業師資入駐
派駐企業師資,融入企業育人實踐,貫穿學生成長全過程。通過開設特色實踐課程、提供高質量的實踐及前沿指導,將產業理念、技術、資源整合到培養體系、課程及實訓中,最大程度共享及優化配置產教資源,培養高素質和具有產業應用視角的創新人才。
高校相關賽事
面向高校,飛槳組織開展了多項“國字頭”重要賽事,以下賽事均已被列入中國高等教育學會“全國普通高校大學生競賽排行榜”,包含教育部高等學校自動化類專業教學指導委員會主辦,清華大學承辦的“全國大學生智能汽車競賽”,由全國高等學校計算機教育研究會主辦,浙江大學、百度公司聯合承辦的“中國高校計算機大賽—人工智慧創意賽”(簡稱C4), 由工業和信息化部、教育部、江蘇省人民政府共同主辦的 “中國軟體杯”大學生軟體設計大賽,以北京語言大學為法人單位主辦的“中國大學生計算機設計大賽”(簡稱4C)等。
此外,還有西安交通大學國際大數據競賽、百度之星開發者大賽等熱門賽事,每年均會吸引海內外多所名校學子共同參與!
AI Studio教育版
提供領先的教學管理與實訓平台,深入促進實踐型AI人才培養
● 在線教學環境:雲端集成免安裝,在線聯網,便捷易用
● 免費算力支持:CPU/GPU 資源免費提供,降低高校開課門檻
● 內置教學實驗:豐富教學實驗案例,從入門到進階,一應俱全
● 實用教學管理:完備實用的教學管理功能,助力專業課堂教學
深度學習工程師能力認證
2018年,百度聯合深度學習技術及應用國家工程實驗室、中國軟體行業協會,共同發布中國深度學習工程師能力評估標準。2019年3月,百度向社會開放“深度學習工程師”認證考試,並提供相應的學習解決方案。
2020年,為了助力深度學習工程師的職業發展,百度飛槳和Linux Foundation開源大學合作推出國內首個深度學習工程師聯合認證。本次聯合認證全稱為 Certified Open Source Officer & Deep LearningEngineer Associate,從名稱上可以看出,本次雙認證不僅注重開發者在深度學習方面的技術能力,也對開發者的開源基本能力提出了一定的要求。現已開通人才招募“綠色通道”,通過認證的開發者將獲得認證標籤並被納入AI專項人才庫,百度AI技術崗位可以免筆試應聘,相關生態合作企業技術崗位也可優先錄用。
國家工程實驗室
2017年2月,國家發展和改革委員會正式批複,由百度牽頭聯合清華大學、北京航空航天大學、中國電子技術標準化研究院、中國信息通信研究院,共同籌建深度學習技術及應用國家工程實驗室。飛槳依託深度學習技術與應用國家工程實驗室,與國內多家科研機構及高校合作研發的深度學習技術,為深度學習研究者、企業和開發者提供功能豐富的開源深度學習平台。
WAVE SUMMIT深度學習開發者峰會
WAVE SUMMIT深度學習開發者峰會由深度學習技術及應用國家工程實驗室與百度聯合主辦,會上,來自百度、英特爾、華為、清華大學、北京航空航天大學等公司及高校的科學家及人工智慧專家共同探討深度學習時代的技術方向及產業前景,同時,深度學習平台飛槳發布多項新特性及服務,為深度學習開發者提供利器。
億元算力支持計劃
2019年4月23日,在首屆WAVE SUMMIT 2019深度學習開發者峰會上,百度宣布了AI Studio算力支持計劃,開放價值近億元人民幣的免費算力資源,助力開發者成功。免費算力主要以兩種模式提供,第一種是一人一卡模式,V100的訓練卡包括16G的顯存,可達2T的存儲空間。另外一種是遠程集群模式,飛槳提供高性能集群,供開發者免費使用,登陸AI Studio即可使用。 

所獲榮譽


2020年8月15日,百度和華為共同完成的項目"飛槳產業級深度學習技術與平台"榮獲2019年度中國電子學會科學技術獎科技進步一等獎。 
2020年9月,百度飛槳獲2020年服貿會“科技創新服務示範案例”。