深度神經網絡徹底升級了計算機視覺模型的表現
只要是成熟且完成度較高的技術,慢慢就不會被大家當做智能來看待了。
比如我問身邊的老母親老父親老阿姨們,手機指紋解鎖、手寫輸入、地圖導航、游戲NPC、美顏相機等等是不是人工智能,他們紛紛流露出了質疑的小眼神兒:
這么常見樸素不做作,怎么能是AI呢,最起碼也得挑戰一下那些看起來不可能完成的任務吧,比如能撒嬌的智能客服,360度旋轉跳躍閉著眼的機器人,掃一眼就能看病的大白,動不動就血虐人類的智能體什么的。
行……吧……如此看來,最“危險”的要數計算機視覺了。
估計再過不久,人臉識別、看圖識物、假臉生成,就要被“開除”出AI的隊伍了。
近年來,深度神經網絡徹底升級了計算機視覺模型的表現。在很多領域,比如視覺對象的分類、目標檢測、圖像識別等任務上,深度神經網絡(Deep Neural Network,DNN)完成的比人類還要出色,相關技術解決方案也開始頻繁出現在普通人的生活細節之中。
這就夠了嘛?并沒有!視覺模型表示自己除了在圖像任務里很好用,非圖像任務也是一把好手。
前不久,深度學習開發者,Medium知名博主 Max Pechyonkin在其博客中,介紹了將視覺深度學習模型應用于非視覺領域的一些創造性應用。
咱們就通過一篇文章,來了解一下求生欲極強的視覺模型是如何在其他領域發光發熱的吧。
生活不易,DNN賣藝
由于有遷移學習和優秀的學習資源,DNN在計算機視覺領域的應用落地遠超于其他任務類型。
加上各種開放平臺和公開的預訓練模型加持,任何人都可以在數天甚至數小時內,將視覺深度學習模型應用于其他領域。
兩年前,就有外國農民開發出了自動檢測黃瓜的智能程序,北京平谷的桃農也用上了自動檢桃機。
背后的技術邏輯也很容易理解:先選用一個簡單的卷積神經網絡(CNN)模型(可以在開放平臺上輕松地找到),將各種帶有標簽的圖片扔進去,跑出一個baseline,主要是為了確定數據集是否合適,圖像質量和標簽是否正確,需不需要調試等等。
OK以后,就可以投喂處理過的圖像數據集了,一般圖像越多、標注質量越高,模型的性能和準確率就越好。
聽起來是不是學過高中數學就能搞定?
既然技術門檻并不高,其應用范圍自然也就被無限延伸。面對很多非視覺類的原始訓練數據,視覺模型也表示“不慫”。
其中有幾個比較有意思的應用案例:
1.幫石油工業提高生產效率
石油工業往往依賴于一種名叫“磕頭機”的設備開采石油和天然氣,通過游梁活動讓抽油桿像泵一樣將油從地下輸送到表面。高強度的活動也使抽油機極容易發生故障。
傳統的故障檢測方式是,邀請非常專業的技術人員檢查抽油機上的測功計,上面記錄了發動機旋轉周期各部分的負載。通過卡片上的圖像,判斷出哪個部位出現故障以及需要采取什么措施來修復它。
這個過程不僅耗時,而且只能“亡羊補牢”,無法預先排除風險。
而石油公司正在試驗,將視覺深度學習應用到故障檢測中。
貝克休斯(Baker Hughes)公司就將測功計轉換成圖像,然后作為數據集傳給ImageNet預訓練好的模型中。結果顯示,只需采用預訓練好的模型并用新數據對其進行微調,機器自動檢測故障的準確率就達到了93%,進一步優化則接近97%!
(左側是輸入圖像,右側是故障模式的實時分類。系統在便攜設備上運行,分類時間顯示在右下角)
應用了視覺算法訓練出來的新模型,不需要等待專業人員的排期和診斷,就可以自行判斷絕大多數故障并立即開始修復。聽起來是不是很棒很奈斯?
2.幫金融網站進行在線風控
金融網站與欺詐團伙的斗智斗勇,往往是一場“道高一尺魔高一丈”的技術軍備競賽。想要區分訪問者是普通客戶還是潛在風險客戶,僅僅依靠IP過濾、驗證碼等互聯網技術顯然不夠了。
但如果金融網站的系統能夠根據鼠標使用模式來識別用戶行為,就能夠預先規避欺詐交易的發生。要知道,欺詐者使用電腦鼠標的方式是獨一無二而且非常異常的。
但如何得到一個深度學習鑒別模型呢?Splunk就將每個用戶在每個網頁上的鼠標活動轉換為單個圖像。用不同的顏色編碼代表鼠標移動的速度,紅點和綠點則代表使用了鼠標鍵。這樣,就得到了大小相同、且能夠應用圖像模型的原始數據了。
Splunk用了一個由2000張圖片組成的訓練集,進行了2分鐘的訓練后,系統就能識別出普通客戶和非客戶,準確率達到80%以上。
對于某個特定用戶,系統還能夠判斷出哪些是用戶自己發出的,哪些是模仿的。這次只用了360張圖片就訓練出了78%左右的準確率。麻麻再也不用擔心我的理財賬戶被盜了。
3.通過聲音檢測進行動物研究
2018年10月,谷歌的研究人員使用視覺CNN模型對一段錄音進行了分析,檢測到了其中座頭鯨的聲音。
他們將音頻數據轉換成了視頻譜,一種表示音頻頻率特征的圖像。
然后使用了Resnet-50架構來訓練這個模型。有90%的鯨魚歌聲音頻被系統正確歸類。而如果一首錄音是鯨魚的,也有90%的幾率它會被貼上正確的標簽。
這項研究成果可以用來跟蹤單個鯨魚的運動、歌曲的特性、鯨魚的數量等。
同樣的實驗也適用于人類語音、工業設備錄音等等。使用類似librosa這樣的音頻分析軟件,就可以用CPU生成時頻譜。
至此,可以總結一下視覺深度學習模型“跨次元”應用的基本操作了:
1.將原始數據轉換成圖像;
2.使用預訓練的CNN模型或從頭訓練一個新模型進行訓練。
由此得到一個能夠解決非視覺問題的新模型。
開腦洞才是最難的
當然,上述都是作者分享的一些已經在實踐中取得成效的應用,我們還可以將其應用于很多有趣、有意義的場景之中。前提是,能夠找到一種將非視覺數據轉換成圖像的方法。
比如兒童餐食的健康問題,僅靠學校食堂和家長自學營養學顯然不是一個足夠效率、且能大規模推廣的辦法。
利用視覺模型,可以對餐盤的自動掃描與檢測,對圖像中的餐食特征和瑕疵點進行提取,以此推測出餐盤和飲食的潔凈度是否合格,營養搭配是否符合基本要求。
再比如,通過智能攝像頭將零售商超中的人群分布和動線轉化為圖像,進行分析和檢測,可以判斷出不同社區的需求和消費特征,從而有針對性地進行選品和陳設,進一步提升坪效。或者是通過汽車行駛軌跡來預測和優化不同時段的路況及定價。
總而言之,目前計算機視覺模型早已從實驗室和科學家案頭,幫助越來越多的現實問題尋找解決方案。
由此也可以看出,在AI落地中并不缺成熟、可落地的算法,大開腦洞的創造力才是最難的。
當然也有隱患
作為一個負責任的“AI吹”,故事顯然不能在“AI好AI妙AI呱呱叫”中戛然而止。
雖然計算機視覺表現出了極大的適應性,但在實際應用時,有一些缺點是其本身也沒有解決的, 這也導致很長一段時間內,圖像識別、生成等應用還能被當做展示人工智能的神奇能力而被夸耀著。
首先,是視覺神經網絡對于圖像變化和背景過于敏感。無論是轉換非視數據,還是直接訓練原始圖片,機器視覺的處理邏輯都是將圖像轉換為系統可理解的“數字”,再進行對比和識別。因此,將背景和變化等噪音識別成其他物體也就不足為奇了。
(在照片中增加不同的物體,會影響照片中原有的猴子的識別結果)
既然是通過視覺模型進行訓練,那就需要大量有標注的高質量數據,而在現實應用中,一些非圖像的原始數據,比如用戶鼠標習慣、零售店動向等等,包含了多個維度、不同數量的數據點,不僅標記數據集的工作耗時耗力,而且訓練這些龐大的數據也需要大量的GPU資源。
但遺憾的是,受標注質量、模型準確率、專業領域知識等影響,最終的成果在真實世界中的體驗也可能非常糟糕。想要讓商業機構冒著投資打水漂的風險進行嘗試,恐怕還有很多工作要做。
更何況,視覺深度模型并不是一種放之四海而皆準的解決方案,有些任務是難以進行視覺化標注,或者實現成本很高的,短時期內也只能望AI興嘆了。
總而言之,視覺深度學習模型的成熟和非視覺場景的試探,給AI開發帶來了新的故事和想象力,比起千箱一面的智能語音、人手一個的人臉識別,更令人驚喜,實用性也值得期待。
不過本質上講,一切技術問題最后都是經濟學問題。只要不計成本,總能搞得出來。《三體》中,秦始皇不也用三千萬大軍搞出了能計算太陽運行軌道的人形計算機隊列嗎?
這也和如今的人工智能產業現狀悄然重合,技術不是關鍵性問題,沒錢又不會搞工程的項目,就別讓AI背鍋了吧……
相關閱讀
精彩推薦
閱讀排行
相關詞
- 美國社交電商再起波瀾:TikTok商城開張,Meta卻要閉門做生|今日快看
- 世界快資訊:上海再保險“國際板”正式啟動
- 特別好評RPG游戲《恐怖的世界》 完整版10月19日上線|環球精選
- 易會滿:持續加大對偽私募、地方交易場所等重點領域風險的整治
- 十元店重回巔峰:新窮人與日本1990s
- 每日快報!教育股震蕩走低 國新文化跌超8% 榮信文化跌逾7%
- 全球快訊:央行潘功勝:人民幣債券具有良好的投資組合分散化價值
- 國產大飛機開啟常態化商業運行:C919帶動產業鏈一起飛 市場規模有望達萬億元量級
- U盤安裝系統時藍屏怎么解決 全球頭條
- ROG藍屏后該采取什么解決方法來重啟 世界快報
- 中國地震局:國家地震烈度速報與預警工程已完成主體建設任務 焦點訊息
- win10啟動就藍屏是怎么回事 全球熱點
- 環球頭條:華碩筆記本acpi藍屏該如何解決
- 世界最資訊丨打擊違規銷售作弊器材行為 海南省市場監管部門多措并舉為高考中考保駕護航
- 每日熱議!永劫無間藍屏死機應該如何處理
- KMODE藍屏出現應該如何處理 全球觀熱點
- 攜程集團發布2023年第一季度財報
- 甘肅省華亭市東華鎮市場監管所開展農村夏季食品安全專項檢查_環球熱資訊
- 深圳市市場監管局總部經濟審批服務“全市通辦”正式落地
- 解碼開化(一) 文旅產業:從“高看一眼”“棋高一招”到“煥然一新”
- 第五屆京津冀石墨烯大會在北京房山舉辦,加速三地產業鏈深度融合
- 高考期間海南天氣如何?未來兩天多云有雷陣雨 焦點速讀
- 別被“蚊蠅通殺”迷了眼
- 啥是海洋?直播帶你一起看 天天快看點
- 內羅畢:低碳和電動交通載具展 天天觀速訊
- 環球播報:斯諾克新星趙心童為涉賭遭禁賽道歉
- 《沙石鎮時光》:1.0版本發售日期公布!通過“塑造你的未來”預告片為前方的秘密和危險做好準備 世界獨家
- 關注眼健康亟須全社會行動起來
- 哈利波特魔法覺醒怎么尊享眉色 尊享眉色方法攻略 環球速看
- 甘肅省華亭市市場監管局多舉措保障中高考期間食品安全 環球新動態
- 第19屆深圳文博會人氣旺 每日快報
- 甘肅省嘉峪關市市場監管局鏡鐵分局全力保障高考期間食品和特種設備安全
- 河北沙河:太行古村落煥發新活力_天天快播
- 世界百事通!晉陜峽谷遇奇石
- “共建首都跨境電商新生態”系列活動在京啟動 每日熱門
- 環球看熱訊:漢字工坊上班不帶飯怎么過 找出9個公司吃的答案分享
- 甘肅省張掖市新墩市場監管所“三力齊發”加強中高考期間特種設備安全保障_環球熱推薦
- 快消息!小心,這種眼疾易盯上上班族
- 眼藥水怎樣使用才正確
- 當前訊息:機器人:公司基本實現了35kg以下新款機器人減速器的國產化替代
- 華菱鋼鐵:鋼材產品在新能源新材料領域需求前景將持續向好-天天通訊
- 今早發布!雷雨!_天天即時
- 全球快報:云頂之弈s9暗影島格溫陣容攻略 s9賽季暗影島格溫陣容搭配
- 江蘇“智造”夯牢實體經濟“家底”
- 加拿大野火煙塵飄至美國 部分地區被煙塵籠罩
- 【環球時快訊】文字玩出花無法原諒怎么過 無法原諒十二處細思極恐在哪
- 環球快播:百億授信!民生銀行與協鑫集團達成全面戰略合作
- 前5月外貿保持穩定增長 制造業轉型升級塑造出口新動能
- 簡訊:江蘇油田頁巖油累產突破4萬噸
- 讓城市成為“開放的藝術館”(金臺隨筆) 視點
- 易會滿:適時出臺資本市場進一步支持高水平自立自強的政策措施 全球報道
- 【全球聚看點】河南麥收進度過八成 夏播已完成近五成
- 今起,在錫啟幕!
- 兩大國際組織上調中國2023年經濟增長預期
- 仲景食品:公司產品以國內銷售為主 出口業務占比較小-每日速看
- 天天速遞!U盤裝系統進入PE藍屏該采取什么解決方法
- 充滿算計!日美澳在南太鋪光纜,日媒炒“抗衡中國影響力” 焦點熱門
- 重點聚焦!力箭一號火箭的專屬發射工位長什么樣?
- 袁明輝:拍攝下來記錄下來用自然攝影留住那些美好
- 掃碼支付已在國內迅速發展普及 刷掌支付是否還有市場前景
- “去風險”成脫鉤新馬甲
- 環球微資訊!360qpesv.sys導致藍屏該采取什么解決方法
- 【新要聞】北海市海城區地角街道轄區率先完成第二季度食品安全“兩個責任”包保工作
- 國家開發銀行前5個月發放交通領域貸款2687億元
- 當前視點!帶火原料藥企,馬斯克加持的“減肥神藥”又火了
- 什么是股份制企業?股份制企業和私營企業的區別有哪些?
- 怎么才能正確安裝python39.dll
- 全球連線|對兩國合作機遇充滿期待——洪都拉斯各界熱議中國駐洪使館開館
- 蘭州新區召開第二季度落實食品安全“兩個責任”推進會議
- 民泰銀行紹興分行創新產品助共富系列① | 動產融資業務,為民播下“共富”希望-世界實時
- 【世界快播報】我國外貿連續4個月保持正增長
- 偷渡罪一般判多少年?偷渡人員怎么正規回國?
- 吉利雷達以“真乘用化”撬動市場,5月銷售1016臺創歷史新高 焦點資訊
- 故意傷害致人死亡如何處罰?故意傷害致死賠償多少?
- “6·6”全國愛眼日公益講座在京舉辦
- 上古諸神:卡牌對戰官網在哪下載 最新官方下載安裝地址 環球熱推薦
- 天天頭條:電腦中缺失alrsvc.dll文件應該怎么處理
- 贍養費標準是什么?不給贍養費最嚴重的后果有哪些?
- 只允許跟院方合作民營救護車輛進入?醫院回應
- 涉案金額959萬元!海口曝光9家定點醫療機構
- 世界快播:如何解決電腦端丟失rasmans.dll提示問題
- 微資訊!江西省新余市市場監管局:強化建材質量監管 守牢質量安全防線
- 【快播報】警惕“負首付”騙貸
- 財產稅有哪些稅種?所得稅和財產稅的區別有哪些?
- 高考第二天部分地區已公布查分時間 勝利在望,加油少年!|全球快看點
- 青海省海西州四項措施為“中高考”保駕護航_每日看點
- 嫖娼拘留多少天?初次涉黃拘留幾天?
- 青海省市場監管局發布中高考期間食品安全消費提示 天天熱門
- 浙江金華婺城區:天然富硒,“硒”望之旅
- mtfutils.dll缺失如何恢復
- 忘了車限號開了一天罰多少錢?鄭州限行免罰有幾次機會?
- 焦點快播:網紅化妝大師官網在哪下載 最新官方下載安裝地址
- 動態:量子密鑰分發攻防研究獲重要進展
- 什么是違法所得?違法所得和非法財物的區別有哪些?
- 仙跡之九州神劍官網在哪下載 最新官方下載安裝地址|今熱點
- 工程預付款是怎么規定的?工程預付款為什么要扣回?
- 種一顆牙便宜多少錢?海南打出種植牙降價“組合拳”
- 勞動合同法第38條是什么內容?公司不辭退故意調崗怎么賠償?
- 無證駕駛怎么處罰?無證駕駛會被馬上拘留嗎?
- 當前時訊:生存冒險游戲《血清》新預告 擁有4人合作模式
- 天天觀熱點:嶺南街道構建“一網二聯三隊伍”服務模式,為社區長者健康保駕護航
- 通信業全力保障高考|莘莘學子逐夢未來 通信業全力護航
- 焦點觀察:華為品質寬帶智能運維系統榮獲CAICT光接入網L3.5等級認證
- 青海省啟動“企業商業秘密保護能力提升服務月”活動-天天速看
- 黑龍江省北安市市場監管局著力打造“幫您辦”服務品牌|動態焦點
- 非遺 | 高校留學生走進安徽文旅扶點-環球通訊
- 今日快看!FPS游戲《無畏契約》國服今日終測 刪檔充值返利
- 環球最新:黑河聯通多措并舉提升廉潔文化教育質效
- 每日視點!語文名師點評AI高考作文:百度搜索AI伙伴優于New Bing、ChatGPT
- 國家金融監督管理總局李云澤:正式啟動上海再保險“國際板”-環球快看點
- 全球報道:重慶油菜喜獲豐收 總產量實現連續16年增長
- 冒險游戲《血清》發布實機視頻 支持簡體中文 四人聯機
- 全力保障高考通信暢通,重慶電信在行動!_環球速讀
- 《無人深空》發布季節性更新“奇點”預告視頻 現已正式上線-環球微速訊
- 世界殿堂級名團重返中國舞臺 瑪莎·葛蘭姆現代舞團盡展風采 觀速訊
- 上海移動獲得DC-Tech數據中心智能建造最高等級認證 當前快訊
- 戴爾電腦開機后藍屏重啟應該怎么應對
- 電視劇《照亮你》在都市類型中鋪展新的敘事面向 世界要聞
- 黑白琴鍵抒寫長三角風情 全球新要聞
- 上海世紀出版、米哈游、東方明珠新媒體上榜
- 電腦提示vcomp140.dll文件丟失的解決方法|環球新要聞
- 世界今熱點:切實保護金融消費者合法權益
- 全球快報:電腦藍屏nv1ddmkm.sys怎么辦
- “拆樓”式裝修必須叫停
- 世界今日訊!李云澤:下好風險前瞻防控先手棋,以更加主動態度應對風險隱患
- 湖北館展品超5000件:五大“重器”顯實力 五類“非遺”溢楚風_今日看點
- 國家金融監督管理總局李云澤:監管體制改革是金融改革的重要一環 天天快資訊
- 公安部交管局公布近期三輪車肇事肇禍典型交通事故案例
- 網傳重組人生長激素進浙江集采 長春高新連夜召開電話會回應
- 當前通訊!傳記文學《靈魂的旋律:我的父親劉熾》:再現作曲家劉熾藝術人生
- 全球微頭條丨歡樂家的椰子“野心”:去年椰子汁飲料營收超8億,今年加碼投資
- 騰勢D9車型5月銷量11005輛,環比增長約9.6%
- 兩部門:舉辦全國和美鄉村籃球大賽(村BA)
- 最新資訊:Win10 watchdog.sys藍屏該采取什么解決方法
- 世界視訊!《神仙道3》神闕風物志第五章詳細通關攻略
- 全球凈零技術制造競爭全面展開 時訊
- 海口江東新區盛泰仕家安居房項目預計10月底全面封頂
- 刀具等特殊商品退貨難郵寄,如何解?
- 如何解決提示cnbbr332.dll丟失報錯問題
- 【小康頭條】高考第二天,這些話想對你說......_世界微速訊
- 全球新消息丨國家醫保局:1-4月基本醫療保險基金總收入11403.13億元,同比增長8.1%
- 攜程集團發布2023Q1財報:凈營收92億元 同比增長124%
- 茶園里開“茶話會” 專家齊獻“金點子” 當前視訊
- 《崩壞星穹鐵道》訪問篩查拍照位置大全
- 樹立安全“紅線”意識 筑牢安全生產防線_天天快資訊
- 每日熱文:安徽省休寧縣市場監管局開展中高考考點周邊藥械安全專項檢查
- 醫院只允許有合作的民營救護車輛進入?調查結果來了
- 海口江東新區快速通道項目啟動首聯鋼梁吊裝作業-環球速看料
- 世界要聞:加拿大野火持續蔓延 美東多地被濃煙籠罩
- 評論 | 傳統中國畫教育的時代價值挖掘|世界最新