Facebook近日宣布開放Detectron,即該公司基于深度學(xué)習(xí)框架的計算機視覺對象檢測算法平臺。
Facebook近日宣布開放Detectron,即該公司基于深度學(xué)習(xí)框架的計算機視覺對象檢測算法平臺。該公司表示,開放項目的動機在于加速計算機視覺研究,F(xiàn)acebook團隊正在使用該平臺開發(fā)各種應(yīng)用,包括增強現(xiàn)實技術(shù)。
在我最近的一篇文章中,詳細介紹了增強現(xiàn)實如今面臨的三大挑戰(zhàn),其中的實時對象分類是最大的障礙之一:
要讓計算機視覺理解“杯子”的含義,而不是僅僅看到一個形狀,這是一個不容小覷的問題。所以這么多年來,我們在AR演示作品中總會看到人們把基準(zhǔn)標(biāo)記附加到對象身上,以實現(xiàn)更細致的追蹤和交互。為什么會如此困難呢?第一個挑戰(zhàn)在于分類。杯子有數(shù)千種形狀、大小、顏色和紋理。有些杯子擁有特殊的屬性和特殊的用途(如燒杯),也就是說不同的杯子的使用場合和背景也有所不同。想象一下,編寫這么一個可以幫助計算機理解上述所有概念的算法是多大的挑戰(zhàn)。你也可以想象,編寫一個向計算機解釋杯子和碗之間區(qū)別的代碼是多么地困難。
該文章還指出,“深度學(xué)習(xí)”有可能是實時對象分類的其中一種解決方案——這種學(xué)習(xí)涉及“訓(xùn)練”計算機去解讀它所看到的事物,而不是人工去編寫檢測程序。本周,F(xiàn)acebook已經(jīng)正式開源了他們的對象檢測算法,這可能會加速能進行實時對象分類的系統(tǒng)的開發(fā),從而讓增強現(xiàn)實發(fā)揮真正的功效。
如果沒有對特定環(huán)境進行預(yù)編程,與我們周圍世界進行交互的增強現(xiàn)實將需要對我們附近的情況有粗略了解。比方說,如果你正戴著一款A(yù)R眼鏡,你希望把烤箱的溫度投影到烤箱上方,同時在冰箱上方投影出已經(jīng)快要吃完的食物,這時AR眼鏡將需要了解烤箱和冰箱的形狀。由于烤箱和冰箱涵蓋的形狀、樣式以及擺放位置都不盡相同,這將成為一項極具挑戰(zhàn)性的任務(wù)。
在深度學(xué)習(xí)算法的鏡頭下,對象分類是什么樣子的
Facebook的人工智能研究團隊與其他相關(guān)團隊一直在研究,如何利用深度學(xué)習(xí)來幫助計算機解決對象檢測的問題,而這一基于Caffe2深度學(xué)習(xí)框架的對象檢測算法就叫作Detectron。在正式托管至GitHub后,現(xiàn)在任何人都可以自行嘗試。Facebook希望,Detectron開源后能幫助世界各地的計算機視覺研究人員進行新的嘗試,并不斷改進最新的技術(shù)。
該項目的GitHub頁面上寫道:“Detectron旨在為對象檢測研究提供高質(zhì)量、高性能的代碼庫。Detectron的設(shè)計十分靈活,能夠支持新研究的快速實施與評估。”
算法可以檢測視頻輸入,并能夠猜測出構(gòu)成場景的離散對象?!皺z測和識別人類與物體的交互作用 (Gkioxari et al)”等研究項目已經(jīng)在使用Detectron了,并以其為基礎(chǔ)來了解人類在特定環(huán)境中利用物體作出的行為。這是向正確的方向邁出的一步,以幫助計算機理解我們正在做的事情,從而能夠為忙碌的我們提供有價值的信息。
除了人工智能研究之外,Detectron還被用于Facebook的其他內(nèi)部團隊;Facebook在Detectron的開源聲明中寫道:“各支團隊正在利用這個平臺來為各種應(yīng)用進行定制模型訓(xùn)練,其中也包括增強現(xiàn)實和社區(qū)完整性研究?!?/p>
目前尚不清楚具體是哪支團隊正在把Detectron用于增強現(xiàn)實,不過很可能就是Oculus。早在F8大會期間,Oculus的首席科學(xué)家Michael Abrash就曾探討過,增強現(xiàn)實將如何并于何時徹底改變我們的生活。
文章編輯:CobiNet(寧波)
本公司專注于電訊配件,銅纜綜合布線系列領(lǐng)域產(chǎn)品研發(fā)生產(chǎn)超五類,六類,七類線,屏蔽模塊,配線架及相關(guān)模塊配件的研發(fā)和生產(chǎn)。
?2016-2019寧波科博通信技術(shù)有限公司版權(quán)所有浙ICP備16026074號