對人類來說,不僅可以用眼睛“看”周圍環(huán)境中的事物,而且可以“認(rèn)識和理解”這些事物,對這些事物形成“認(rèn)識和決策”?,F(xiàn)在,國辰科技的技術(shù)人員正試圖讓AI也這樣做。從人類三維視覺出發(fā),三維視覺智能已經(jīng)成為人工智能研究和應(yīng)用的一個(gè)熱點(diǎn)領(lǐng)域
說到機(jī)器視覺,我們對許多基于人類多種感官的人工智能技術(shù)并不陌生。其中,視覺感知是一個(gè)非常重要的部分。機(jī)器視覺中的許多技術(shù)已經(jīng)在工業(yè)上得到了很好的應(yīng)用,隨著應(yīng)用的深入,越來越多的機(jī)器視覺技術(shù)進(jìn)入了“三維視覺智能”階段。我們的眼睛不僅要看的清楚,知道的東西,而且要走進(jìn)場景,真實(shí)地感受三維世界中的場景,就像我們在場景中一樣。這就需要三維空間感知和認(rèn)知能力的智能,即三維視覺智能。三維視覺智能將計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺等領(lǐng)域的技術(shù)與傳統(tǒng)的人工智能、學(xué)習(xí)、大數(shù)據(jù)等相結(jié)合
讓機(jī)器人不僅能看到,還能理解,機(jī)器人安裝LMI(利用結(jié)構(gòu)光獲取三維模型信息的主動(dòng)傳感器)掃描螺桿,可以獲得目標(biāo)物體的全方位三維數(shù)據(jù)。機(jī)器人規(guī)劃自己的掃描路徑,直到最終獲得完整的三維模型。
不僅要獲得場景的完整三維數(shù)據(jù),而且還要認(rèn)識每個(gè)物體到底是什么,要去理解場景里的每個(gè)物體,獲取物體的語義信息。同樣的道理,認(rèn)知的過程必須形成一個(gè)閉環(huán),機(jī)器人的實(shí)時(shí)決策能不能根據(jù)現(xiàn)有的三維數(shù)據(jù)對這個(gè)物體進(jìn)行識別。如果不可以,就要走到新的角度去獲取數(shù)據(jù)。
讓機(jī)器人具備決策和執(zhí)行力,替人類完成更多工作
通過三維視覺與人工智能技術(shù)的結(jié)合,我們讓機(jī)器人更加智能化與功能化,讓機(jī)器人做更多人在現(xiàn)實(shí)生活中能夠做的事。機(jī)器人具備現(xiàn)場自主決策和執(zhí)行的能力,比如在工業(yè)流水線上可以幫助組裝配件,物流場景中搬箱子等。這樣的應(yīng)用,涉及到非常精細(xì)化的技術(shù),比如準(zhǔn)確高效的運(yùn)動(dòng)規(guī)劃,還有各種各樣的控制,智能的執(zhí)行等。