北大DAIR實驗室宣布:通用黑盒優化系統OpenBox開源發布
近日,由北京大學崔斌教授數據與智能實驗室( Data and Intelligence Research LAB, DAIR)開發的通用黑盒優化系統 OpenBox 開源發布!
相比于 SMAC3,Hyperopt 等現有開源系統,OpenBox 支持更通用的黑盒優化場景,包括多目標優化,帶約束優化場景等。在 25 個 LightGBM 調參任務上,OpenBox 在 7 個對比系統中取得了平均 1.25 名 (average rank) 的優異成績。
相關論文已經被 KDD 2021 錄用,"OpenBox: A Generalized Black-box Optimization Service"。
研究背景
近年來,人工智能與機器學習備受關注,越來越多企業使用機器學習模型解決實際問題,如人臉識別、商品推薦等。在應用機器學習模型的過程中,模型超參數的選擇對模型性能有著至關重要的影響,因此超參數優化問題成為了機器學習的重要挑戰之一。超參數優化作為典型的黑盒優化問題,對于優化目標不存在具體表達式或梯度信息,且驗證代價較大。其目標是在有限的驗證次數內,盡快找到全局最優點。除超參數優化外,黑盒優化還擁有著廣泛的使用場景,如自動化 A/B 測試、數據庫參數調優、處理器架構和芯片設計等。
現有開源的黑盒優化系統往往存在以下問題:
1)使用場景有限。由于系統基于某個特定算法,一些系統只能支持單目標或是無約束的優化問題;
2)性能不穩定。基于優化問題中“no free lunch”定理,現有系統中特定的算法無法在所有任務中表現出色;
3)有限的可擴展性。現有系統無法有效利用歷史任務的結果以及分布式的驗證資源。
針對這些問題,北京大學 DAIR 實驗室 AutoML 項目組開發了一個名為“OpenBox”的輕量級黑盒優化系統,針對通用的黑盒優化場景,內置豐富的優化算法,并提供高效的并行支持,幫助用戶“open the box”,解決棘手的黑盒優化問題。
項目 Github 開源地址:https://github.com/PKU-DAIR/open-box
OpenBox 設計思路
為了解決現有系統上述的問題,OpenBox 在設計上支持以下系統特性,包括:
多目標優化:同時優化多個不同(甚至相互沖突)的目標,例如同時優化機器模型準確率和模型訓練/預測時間等。
帶約束條件優化:最優化目標的同時,要滿足(黑盒)條件,例如保證模型延遲不能高于某個閾值等。
多類型參數輸入(FIOC):系統需要對多種待優化參數類型提供支持,主要為 FIOC,即浮點型、整型、序數型、類別型四類參數。例如超參數優化中,SVM 模型核函數用類別型表示,如果單純用整型代替序數型或類別型參數,將對參數附加額外的序關系,不利于模型優化。
遷移學習:優化任務之間可能存在一定相關性,例如過去可能在不同數據集上進行過相同模型的調參。基于這種觀察,系統需要能夠利用過去優化的知識加速當前優化任務的執行效率。
分布式并行驗證:內置算法支持并行運行,并且系統能夠有效利用給定的分布式資源。
作者將現有系統對上述特點的支持情況總結如上 (其中△表示不支持通用場景)。從表格中不難看出,現有開源黑盒優化系統無法支持特定的使用場景,而 OpenBox 能夠提供完整的支持。
上圖展示了 OpenBox 的并行架構,包含五個主要組件。服務主機 (ServiceMaster) 負責節點管理、負載均衡和錯誤恢復。任務數據庫 (Task Database) 保存所有任務的狀態。建議服務器 (Suggestion Server) 為每個任務生成新配置。REST API 在用戶/工作者和建議服務器之間建立了橋梁。驗證工作者 (Evaluation Worker) 由用戶提供和擁有。
OpenBox 內置大量優化組件,其中優化算法包括貝葉斯優化,遺傳算法等,如下圖所示:
北大 DAIR 實驗室推出開源高效的通用黑盒優化系統 OpenBox
為簡化用戶的使用門檻以及提高系統在各問題上的性能,OpenBox 默認采用一種自動選擇優化算法的策略,根據輸入參數類型,目標個數,約束個數選擇合適的優化算法。用戶也可基于自身需求,在系統推薦的基礎上自行選擇優化策略。更多 OpenBox 的特性請參考開源文檔:
https://open-box.readthedocs.io/zh_CN/latest/overview/overview.html
目前 OpenBox 已在快手、阿里巴巴集團等企業落地部署與使用。
OpenBox 性能驗證
1、收斂效果對比
為體現 OpenBox 在通用黑盒優化問題上的性能,系統針對單/多目標,無/有約束,共 4 種場景對比 OpenBox 與現有算法與系統在優化數學函數上的效果,實驗效果如下四圖所示。可以看出在不同的優化場景中,OpenBox 相較現有系統都有較為顯著的收斂效果提升。
2、端到端效果對比
針對實際場景,Openbox 以表格分類的機器學習任務為例,與現有開源系統 BoTorch,GPGlowOpt,Spearmint,HyperMapper,SMAC3,Hyperopt 進行對比。為保證公平性,Openbox 使用串行方式執行任務,并匯報調參結果在測試集上的準確率。以下展示使用 LightGBM 與 LibSVM 兩個模型在 25 個 OpenML 公開數據集上的調參結果平均排名。值得注意的是,由于 LibSVM 的搜索空間復雜且包含條件選擇,OpenBox 僅與支持復雜空間定義的 SMAC3 以及 Hyperopt 進行對比。
可以觀察到 OpenBox 在兩個模型調參中均獲得了優異的性能。具體來說,OpenBox 在 Lightgbm 調參中排名中位數為 1.25,在 LibSBM 調參中為 1.50,體現了 OpenBox 相比其它開源系統在超參數優化任務中的優勢。
(a) AutoML 任務 LightGBM 優化結果
(b) AutoML 任務 LibSVM 優化結果
3、并行性能對比
OpenBox 支持高效的并行優化算法,使得在達到相同的優化效果的前提下,所需要的時間代價大幅降低。下圖展示了使用 OpenBox 中并行優化算法在 LightGBM 調參任務上的提升,使用的數據集為公開數據集 optdigits 。其中“Sync”表示同步并行,“Async”表示異步并行,“-n”表示并發度。
可以觀察到,相比串行優化(Seq-1),并行能夠帶來很大程度上提升搜索效率。其中最顯著的提升來自于并發度為 8 的異步優化算法,在達到與串行方法相同的優化結果時僅使用 1/80 的時間預算,也即實現 7.5× 的加速比。(理想加速比為 8×)
更多關于 OpenBox 的實驗結果,請參考 OpenBox 論文:
https://arxiv.org/abs/2106.00421
OpenBox 使用示例
目前 OpenBox 支持主流平臺(Linux、macOS、Window)使用。用戶只需在代碼中定義空間,給出目標函數,構造優化器即可運行。以下以一個簡單的多目標帶約束問題為例:
首先,我們需要 import 必要的組件:
接下來,我們定義一個包含兩個連續變量的搜索空間:
隨后,我們給出一個簡單的以上述兩個變量為輸入的目標函數。這個目標函數包含兩個目標以及兩個約束:
最后我們定義一個優化器,傳入指定的參數后,只需調用 run () 即可開始優化。
除了上述包調用的方法,OpenBox 還支持用戶通過接口訪問服務,從服務端獲取推薦的參數配置,在本地執行參數性能驗證,并通過訪問網站頁面,可視化監視與管理優化過程。
完整的示例以及更多的使用場景,歡迎參考 OpenBox 官方文檔:
https://open-box.readthedocs.io/zh_CN/latest/
論文地址:https://arxiv.org/abs/2106.00421
項目 Github 地址:https://github.com/PKU-DAIR/open-box
歡迎大家關注點贊!
參考文獻
[1]Yang Li, Yu Shen, Wentao Zhang, Yuanwei Chen, Huaijun Jiang, Mingchao Liu, Jiawei Jiang, Jinyang Gao, Wentao Wu, Zhi Yang, Ce Zhang, Bin Cui. "OpenBox: A Generalized Black-box Optimization Service." Proceedings of the 27rd ACM SIGKDD international conference on knowledge discovery and data mining. 2021.
[2] Bergstra, James, et al. "Algorithms for hyper-parameter optimization." Advances in neural information processing systems 24 (2011).
[3] Snoek, Jasper, Hugo Larochelle, and Ryan P. Adams. "Practical bayesian optimization of machine learning algorithms." Advances in neural information processing systems 25 (2012).
[4] Hutter, Frank, Holger H. Hoos, and Kevin Leyton-Brown. "Sequential model-based optimization for general algorithm configuration." International conference on learning and intelligent optimization. Springer, Berlin, Heidelberg, 2011.
[5] Balandat, Maximilian, et al. "BoTorch: A framework for efficient Monte-Carlo Bayesian optimization." Advances in Neural Information Processing Systems (NeurIPS) (2020).
[6] Knudde, Nicolas, et al. "GPflowOpt: A Bayesian optimization library using tensorflow." arXiv preprint arXiv:1711.03845 (2017).
[7] Golovin, Daniel, et al. "Google vizier: A service for black-box optimization." Proceedings of the 23rd ACM SIGKDD international conference on knowledge discovery and data mining. 2017.
[8] Nardi, Luigi, David Koeplinger, and Kunle Olukotun. "Practical design space exploration." 2019 IEEE 27th International Symposium on Modeling, Analysis, and Simulation of Computer and Telecommunication Systems (MASCOTS). IEEE, 2019.
[9] Falkner, Stefan, Aaron Klein, and Frank Hutter. "BOHB: Robust and efficient hyperparameter optimization at scale." International Conference on Machine Learning. PMLR, 2018.
相關閱讀
-
地產、基建板塊走強,中證1000指數ETF(159633)成交金額已超5.7億,北辰實業、中華企業、鴻路鋼構集體大漲
截至發稿,中證1000指數ETF(159633)跌0 77%,場內交投活躍,成交金額
2023-06-08 -
今日看點:港股通醫藥ETF(513200)成交金額已超7500萬,國藥控股、威高股份、石藥集團飄紅
截至發稿,港股通醫藥ETF(513200)微跌0 11%,成交金額7522萬元;重倉
2023-06-08
精彩推薦
閱讀排行
相關詞
- 段林希簡介_段林希是誰 焦點觀察
- csgo第一次開箱子怎么開?csgo新號開箱子好出金嗎?
- 今日看點:港股通醫藥ETF(513200)成交金額已超7500萬,國藥控股、威高股份、石藥集團飄紅
- csgo開箱子還是直接買?csgo箱子需要買嗎?
- 《自由籃球》選秀賽季全新上線 泰山喬商店好禮派發 全球熱資訊
- 天天熱議:《跑跑卡丁車》竹片持續放送中 個人RP賽回歸
- csgo游戲內如何開箱子?csgo每個箱子都能開出什么?
- 人民銀行:長期堅持穩健貨幣政策 中國金融周期相對穩健
- 【全球快播報】喝咖啡真的能提神嗎
- 每日精選:淘寶賣家的基本義務是什么啊_淘寶賣家的基本義務是什么
- 周小川:上海國際金融中心建設著力點應放在資本市場主力產品上|焦點滾動
- csgo有什么開箱網站?csgo開箱網站是什么原理?
- 再次震蕩?游戲ETF(159869)盤中一度跌超4%
- 地產、基建板塊走強,中證1000指數ETF(159633)成交金額已超5.7億,北辰實業、中華企業、鴻路鋼構集體大漲
- csgo開箱子出什么?csgo一天掉幾個箱子?
- 《星辰變》第五季第十五集:白鳳和白馨下線,引發觀眾共鳴和熱議
- csgo開箱網站打不開是怎么回事?csgo開箱網站有什么用?
- 世界快訊:邊緣計算市場規模將達4450億美元,邊緣AI打開行業想象空間!奧拓電子兩連板
- 通訊:“中國為我打開機遇之門”——一個洪都拉斯青年的中國情緣
- thinkpadt480藍屏怎么解決 環球觀天下
- 全球時訊:中國星辰|中國人登月如何實現?
- csgo網站開箱流程是怎樣的?csgo哪個網頁可以開箱?
- 環球熱資訊!hticons.dll丟失如何自動修復
- csgo開箱子哪個好?csgo最保值的箱子是什么?
- 飛豬:端午出游預訂節奏大幅提前 跨省游訂單占比近9成
- csgo怎么打開箱子?csgo哪里買箱子鑰匙最便宜?
- 外星襲擊什么時候出 公測上線時間預告
- 哪些方法可以還原sd卡內的數據_熱點
- csgo每天免費開箱方法是什么?csgo開箱出金概率高嗎?
- 如何修復缺少fwbase.dll文件的問題
- csgo開箱子機制是怎樣的?csgo箱子對應刀清單
- F4藍屏代碼出現應該采取什么應對方法
- 燉雞的做法大全視頻教程(燉雞的做法大全) 播資訊
- csgo開箱子推薦哪一個?csgo怎么賣箱子?
- csgo幸運開箱網有哪些?csgo開箱網站可以提刀嗎?
- 重慶市長壽區五部門聯合開展互聯網危險化學品專項治理行動|世界實時
- 江西省新余市持續開展“三項行動”夯實消費品質量基礎|天天熱門
- csgo如何免費開箱?csgo開箱一定要錢嗎?
- 諾基亞c500有wifi功能嗎(諾基亞c500) 觀速訊
- 英雄機長劉傳健護航 成都大運會火種飛赴北京_天天觀察
- 全球視訊!隨著天空變成紅色 《暗黑4》的宣發變得像是真的
- 藝術 | 外交頂流京劇《白蛇傳》你看過嗎?
- 全球即時看!南航倫敦至北京大興直飛航線正式開通
- csgo開箱子秘訣是什么?csgo開哪個箱子劃算?
- 電腦啟動時藍屏出現字母是否與驅動有關_世界觀熱點
- 意義非凡的愛地希:展現新一代ADC藥物的卓越療效
- 全球今熱點:【2023高考】考點內外“雙保障” 他們每天為高考“服務”近10小時
- csgo開箱價格是多少?csgo開什么箱子容易出刀?
- 價格跌至前低,創業板成長ETF(159967)連續7天獲資金 環球關注
- 世界簡訊:明星三缺一2005百度云(明星三缺一2006)
- 充滿算計!日美澳在南太鋪光纜,日媒炒“抗衡中國影響力”|當前通訊
- AI醫療大模型MedGPT發布,醫藥ETF(512010)成_天天快資訊
- 海南核電自備碼頭改造圓滿完成工程竣工驗收
- 無人機巡視、紅外測溫…… 上海電力“設備主人”護航高考
- 河南已收獲小麥7506.8萬畝,約占全省種植面積的88%
- 每日看點!上月房企融資數據繼續“縮水” 6月份約349億債券到期
- 我想完美的皮膚官網在哪下載 最新官方下載安裝地址
- csgo開箱歌曲有哪些?csgo開箱沙雕音樂分享
- csgo開箱教學來了 csgo可以免費開箱嗎?
- 彈幕射擊游戲《彈幕無限3》將于6月13日登陸PS4|世界觀點
- 廈門外貿自主品牌培育入選外貿新業態優秀實踐案例
- csgo開箱攻略有哪些?csgo開箱子能賺錢嗎?
- 環球即時看!廣東自貿試驗區八年固定資產投資超1萬億
- 中國專家最新研究證實:腸癌相關標準治療方案非普遍適用|全球熱消息
- 世界通訊!生存游戲《浩劫前夕》發布全新預告視頻 將重新上架Steam
- 北交所上市公司邁入“200+”時代
- 全球熱推薦:護航“平安高考” 大興安嶺市場監管部門在行動
- 《原子之心》發布首個DLC敵人前瞻預告 今年夏季發售
- 廣西來賓市市場監管局開展藥品不良反應監測有成效
- 四川省遂寧市蓬溪縣市場監管局開展“兒童用品安全行”主題宣傳活動-要聞速遞
- csgo開箱秘籍是什么?csgo開箱小技巧了解一下
- 報道:雙星新材董秘回復:短期波動受到多種因素影響,因堅定自身而努力發展,公司持續深耕新材料發展,積極調整產品結構
- 雙星新材董秘回復:公司一直在不斷優化產品結構,對普膜產品持續結構調整
- 貝云科技“點亮”倫敦設計雙年展 LUZENSE探索“情緒照明”
- csgo能不花錢開箱子嗎?csgo一周可以掉落幾個箱子?
- 《影子武士3:最終版》發布新版本更新 改善整體視覺效果
- 云南:總投資1916.75億元,141個新項目完成簽約|全球熱資訊
- csgo開箱子網址有哪些?csgo能在手機上開箱子?
- 焦點報道:2023中國·天門服裝電商產業峰會將召開
- 海泰新光董秘回復: 公司第一代產品沒有在市場上進行大量推廣,這是與公司的產品和市場定位有關|熱點在線
- csgo可以去哪開箱?csgo公認最好的開箱平臺介紹
- 事關耕地紅線!浙江推進“進出平衡” ,嚴控一般耕地轉為其他農用地
- 焦點簡訊:金橋信息(603918)6月8日14點41分觸及漲停板
- 祥生醫療董秘回復: 祥生醫療主營業務為超聲醫學影像設備研發、制造和銷售
- 環球速看:海南昌江一濕地公園首次記錄到六只紫水雞幼崽同框
- csgo開箱子鑰匙如何獲得?csgo怎么得到箱子?
- 無人機巡視、紅外測溫…… 上海電力“設備主人”護航高考 快消息
- 全球關注:港元拆息普遍上升 一周及兩周利率結束六連跌
- 中國科傳(601858)6月8日14點44分觸及跌停板|環球滾動
- csgo手機開箱子可行嗎?csgo開哪個箱子劃算?
- 《麥登橄欖球24》Steam頁面上線 游戲暫不支持中文
- *ST京藍(000711)6月8日14點44分觸及漲停板 每日消息
- 法國反對北約在日本設立辦事處
- csgo開箱見金必中嗎?csgo良心開箱網站分享
- 焦點快看:廣東:向海圖強 激發藍色經濟新動能
- 上海市歷史博物館與俄羅斯國家歷史博物館簽訂友好合作備忘錄
- 河北井陘:保護古村風貌 留住鄉愁古韻
- 日播時尚(603196)6月8日14點35分觸及漲停板
- 泉峰汽車: 公司控股股東及一致行動人自公司上市以來從未減持公司股票|全球訊息
- csgo全球開箱網站有哪些?csgo開箱靠譜嗎?
- 每日熱議!75年后,新疆考古第一人黃文弼《羅布淖爾考古記》嶄新再版
- 天天新消息丨星火成炬 | 此去,桃李滿天下!
- 第七屆平遙國際電影展面向全球征集華語劇本項目 天天快報
- 全球熱文:洪都拉斯總統特別助理:期待訪華增進雙邊關系
- “新歌唱新疆”巡演首場在烏魯木齊舉辦
- 四書五經指什么 四書五經指什么生肖?
- 深圳陽光整形美容醫院怎么樣_是三甲醫院嗎
- 手機評測排名2022:不同價位段中的最佳選擇
- 海泰新光董秘回復: 謝謝您對公司的持續關注,也感謝您對公司的理解和支持-播報
- csgo開箱回本率是多少?csgo開箱微信支付在哪里?
- 向海圖強!海洋經濟“揚帆遠航”-今日熱搜
- csgo開箱梗是什么?csgo怎么批量開箱?
- 每日看點!更寬敞!我國新一代載人飛船可坐7人,將實現回收技術
- 微信群待辦怎么發 微信群待辦怎么發起-天天微速訊
- csgo開箱玄學有哪些?csgo開箱看見金了必出嗎?
- Win11永劫無間藍屏出現應該如何應
- 霧霾藍連衣裙配什么鞋子 霧霾藍連衣裙搭配什么鞋子-世界訊息
- 深圳友華普惠眼科怎么樣 手術案例效果證明一切_全球實時
- 每日熱文:通訊:“中國為我打開機遇之門”——一個洪都拉斯青年的中國情緣
- csgo開箱多少錢一個?csgo開箱模擬器推薦
- 日本民眾舉行抗議活動 反對政府排放核污染水入海_環球時快訊
- 離婚協議書的格式 離婚協議書的格式怎樣寫圖片
- 潘功勝:中國堅持穩健的貨幣政策是金融周期相對穩健的原因-短訊
- 全球要聞:普通話手抄報內容大全_普通話手抄報內容精選
- CPU藍屏一進系統就重啟該如何解決
- 熱點評!公安部交管局公布近期三輪車肇事肇禍典型交通事故案例
- 海南司機 今日高考英語聽力考試期間途經考點禁止鳴笛-世界視點
- 長三角鐵路端午小長假預計發送旅客1500萬人次
- 妄想山海營地怎么升級(妄想山海營地如何升級) 環球即時看
- 什么是新零售的前端表象(新零售的表現形式)
- 怎樣快速去黑眼圈_怎么去除黑眼圈|世界聚看點
- api-ms-win-core-bicltapi-l1-1-0.dll文件丟失如何修復?|熱點在線
- xmllite.dll文件被破壞怎么辦|天天微動態
- 一公頃等于多少平方千米_等于0.01平方分米
- 星球神偷官網在哪下載 最新官方下載安裝地址
- 今日熱搜:和平精英第十周任務怎么完成 任務完成技巧方法詳解
- “國企領導牽手門”最新進展:牽手門涉事女子已被停職并接受調查
- 如何解決msprivs.dll報錯丟失問題 環球熱頭條
- 前沿資訊!英語四級多少分及格_英語四級簡介
- 靈顯第一季_關于靈顯第一季介紹 焦點日報
- 國服csgo如何開箱?csgo國服開箱方法介紹
- 河南省開封市龍亭區市場監管部門就定量包裝茶葉過度包裝問題開展專項檢查和行政指導
- 天天速讀:安徽省市場監管局推進法治政府建設結碩果
- 7b藍屏怎么解決
- 新知青_關于新知青簡介
- 深圳思莉醫療美容門診部怎么樣 真實情況在線獲取-全球播報
- 新石器_關于新石器簡介 環球熱點
- csgo去哪開箱?csgo新人玩家開箱攻略
- 端午假期火車票6月8日開售,年輕人尋找下一個“淄博”
- 視焦點訊!童年好詞好句好段_童年好詞好句好段總結