為了能讓機器看懂世界 阿里云破了一個世界紀錄
5月18日,全球權(quán)威機器視覺算法測評平臺KITTI的世界紀錄再此被刷新。來自中國的科技公司阿里云將其車輛檢測的準確率拉升至90.46%。車輛檢測被認為是實現(xiàn)無人駕駛的關(guān)鍵技術(shù),***挑戰(zhàn)。
(阿里巴巴iDST團隊以90.46%的準確率奪得KITTI***)
據(jù)了解,此次重大技術(shù)突破是由阿里巴巴iDST視覺計算研究員華先勝領(lǐng)導(dǎo)的團隊完成。他們提出了基于區(qū)域融合決策和上下文相關(guān)的多任務(wù)深度神經(jīng)網(wǎng)絡(luò),用于復(fù)雜場景下的車輛檢測任務(wù),重點解決其中多視角,多姿態(tài)以及車輛遮擋等問題。
在網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計上,團隊利用反卷積操作提高了小目標的召回率,同時拼接了多層特征以融合低層的局部信息和高層的語義信息,提高了邊框定位的準確率。在訓(xùn)練過程中,還借鑒了GAN(生成對抗網(wǎng)絡(luò))中的對抗訓(xùn)練模式。
華先勝表示,“現(xiàn)在我們已經(jīng)將這樣的技術(shù)集成到阿里云ET當(dāng)中,并在城市大腦中得以應(yīng)用。它能夠幫助城市大腦準確的看懂車流信息,快速的做出全局性判斷”。華先勝是視覺識別和搜索領(lǐng)域的***權(quán)威學(xué)者,曾獲選國際電氣與電子工程協(xié)會院士(IEEE Fellow)、美國計算機協(xié)會ACM杰出科學(xué)家。
城市大腦是包括阿里云在內(nèi)的13家企業(yè)聯(lián)合杭州市政府發(fā)起的項目,旨在構(gòu)建一個城市級的人工智能中樞,讓城市能夠與人類友好互動。這其中分析視頻是城市大腦獲取信息的關(guān)鍵。
以交通治理為例,通過這項技術(shù),城市大腦通過普通攝像頭就可以感知復(fù)雜路況下車輛的運行狀態(tài)和軌跡,對這些數(shù)據(jù)進行實時分析。基于此,進行多種智能交通優(yōu)化。在視頻數(shù)據(jù)處理規(guī)模上,全球罕有。
在視覺計算領(lǐng)域的持續(xù)攻堅,是阿里巴巴“NASA”計劃的一部分。該計劃聚焦于機器學(xué)習(xí)、芯片、IoT、操作系統(tǒng)、生物識別等核心領(lǐng)域,他們希望能解決10年、20年后的困難。此前,已在光量子計算機、全浸沒液冷服務(wù)器等方面取得重大進展。
KITTI是目前國際上***的自動駕駛場景下的計算機視覺算法評測數(shù)據(jù)集,可以用于評測目標檢測等計算機視覺技術(shù)在復(fù)雜真實環(huán)境下的性能。KITTI包含市區(qū)、鄉(xiāng)村和高速公路等場景采集的真實圖像數(shù)據(jù),有大量的微小目標、欠曝和過曝、多種視角變化以及各種遮擋情況。