資料來源:光州科學(xué)與技術(shù)學(xué)院
韓國光州科技學(xué)院(GIST)的一個研究小組創(chuàng)造了一種方法,使人工智能(AI)視覺系統(tǒng)能夠更好地識別那些雜亂無章地放在一起、可能不完全可見的物體。
GIST的副教授Kyoobin Lee和博士生Seunghyeok Back以及他們在該大學(xué)的研究團隊,著手創(chuàng)建一個能夠識別和分類雜亂場景中物體的人工智能系統(tǒng)。該團隊很快發(fā)現(xiàn),機器人視覺系統(tǒng)需要大量的物體數(shù)據(jù)集,以便能夠識別不完全可見的物體。
Back說:"我們期望機器人能夠識別和操縱它們以前沒有遇到過的或被訓(xùn)練過的物體,然而,在現(xiàn)實中,我們需要一個一個地手動收集和標(biāo)記數(shù)據(jù),因為深度神經(jīng)網(wǎng)絡(luò)的泛化能力高度依賴于訓(xùn)練數(shù)據(jù)集的質(zhì)量和數(shù)量。"
通常情況下,當(dāng)人工智能遇到一個由許多雜亂的物體組成的場景時,系統(tǒng)會嘗試僅根據(jù)其可見的部分來識別每個項目。Lee和Back決定采取不同的方法,而是教人工智能識別每個物體的幾何形狀,這樣它就能推斷出它看不到的物體的哪些部分。
教會人工智能這樣做需要一個更小的數(shù)據(jù)集,即包含深度信息的45,000張照片的現(xiàn)實合成圖像。當(dāng)人工智能看到一個場景時,它開始通過挑選出感興趣的物體來理解它,然后將該物體分割成一個 "可見掩碼 "和一個 "調(diào)和掩碼"。
比較現(xiàn)有的方法和研究者識別部分被遮擋物體的方法。|來源:光州科技學(xué)院
在對場景進行分割后,人工智能使用了一個分層遮擋建模(HOM)方案。該方案將可能被遮擋的特征組合按其可能存在的程度進行排序。該團隊針對三個基準(zhǔn)測試了其HOM方案,發(fā)現(xiàn)它達到了最先進的性能。
Back說:"以前的方法只限于檢測特定類型的物體,或者只檢測可見區(qū)域而不明確推理被遮擋的區(qū)域。相比之下,我們的方法可以像人類視覺系統(tǒng)一樣推斷出被遮擋物體的隱藏區(qū)域。這能夠減少數(shù)據(jù)收集工作,同時提高復(fù)雜環(huán)境下的性能。"
該研究小組的成果在2022年IEEE國際機器人和自動化會議上被接受。
2025-04-08 08:51
2025-04-07 12:08
2025-04-07 12:07
2025-04-07 12:06
2025-04-07 09:52
2025-04-07 09:49
2025-04-07 09:43
2025-04-03 09:11
2025-04-03 08:56
2025-04-03 08:51