目標(biāo)檢測(Object Detection)的任務(wù)是找出圖像中所有感興趣的目標(biāo)(物體),確定它們的類別和位置,是計(jì)算機(jī)視覺領(lǐng)域的主要問題之一。由于各類物體有不同的外觀、形狀和姿態(tài),加上成像時(shí)光照、遮擋等因素的干擾,目標(biāo)檢測一直是計(jì)算機(jī)視覺領(lǐng)域相當(dāng)有有挑戰(zhàn)性的問題。隨著深度學(xué)習(xí)的不斷發(fā)展,目標(biāo)檢測的應(yīng)用愈加廣,現(xiàn)已被應(yīng)用于農(nóng)業(yè)、交通和醫(yī)學(xué)等眾多領(lǐng)域。與基于特征的傳統(tǒng)手工方法相比,基于深度學(xué)習(xí)的目標(biāo)檢測方法可以學(xué)習(xí)低級和高級圖像特征,有更好的檢測精度和泛化能力媒體人被認(rèn)為是被ChatGPT取代的高危職業(yè)之一。陜西AI智能智能方案
隨著大模型時(shí)代到來,模型參數(shù)呈指數(shù)級增長,達(dá)到萬億級別。大模型逐漸從支持單一模態(tài)和任務(wù)發(fā)展為支持多種模態(tài)下的多種任務(wù)。在這種趨勢下,大模型訓(xùn)練所需算力巨大,遠(yuǎn)超單個(gè)芯片的處理速度,而多卡分布式訓(xùn)練通信損耗巨大。如何提高硬件資源利用率,成為影響國產(chǎn)大模型技術(shù)發(fā)展和實(shí)用性的重要前提。成都慧視推出的AI訓(xùn)練平臺SpeedDP就可以通過大量的數(shù)據(jù)注入,讓AI進(jìn)行不斷的模型訓(xùn)練,不斷地深度學(xué)習(xí)能夠讓AI更加聰明,為目標(biāo)檢測、目標(biāo)識別提供幫助。開發(fā)AI智能算法SpeedDP進(jìn)行圖像標(biāo)注時(shí)的特點(diǎn)是快。
近年來,人們越來越認(rèn)識到深入理解機(jī)器學(xué)習(xí)數(shù)據(jù)的必要性。不過,鑒于檢測大型數(shù)據(jù)集往往需要耗費(fèi)大量人力物力,它在計(jì)算機(jī)視覺領(lǐng)域的廣泛應(yīng)用,尚有待進(jìn)一步開發(fā)。通常,在物體檢測中,通過定義邊界框,來定位圖像中的物體,不僅可以識別物體,還能夠了解物體的上下文、大小、以及與場景中其他元素的關(guān)系。同時(shí),針對類的分布、物體大小的多樣性、以及類出現(xiàn)的常見環(huán)境進(jìn)行了解,也有助于在評估和調(diào)試中發(fā)現(xiàn)訓(xùn)練模型中的錯誤模式,從而更有針對性地選擇額外的訓(xùn)練數(shù)據(jù)。
我們教一個(gè)小孩識物的時(shí)候,比如“蘋果”,首先要讓他反復(fù)的看到“蘋果”,他便能認(rèn)識“蘋果”;他可能會認(rèn)錯,把“梨”認(rèn)成“蘋果”,這個(gè)時(shí)候應(yīng)該幫他指出來。小孩看到的“蘋果”越多,辨識的能力就越強(qiáng)。基于深度神經(jīng)網(wǎng)絡(luò)的人工智能,讓機(jī)器具備理解的能力,基本過程就像教一個(gè)小孩認(rèn)蘋果一樣。首先要有大量的數(shù)據(jù),比如“蘋果”的圖片;同時(shí),要增加大量機(jī)器會認(rèn)錯的“負(fù)樣本”,比如“梨”的圖片;然后經(jīng)過一個(gè)深度神經(jīng)網(wǎng)絡(luò),反復(fù)學(xué)習(xí),然后獲得一個(gè)有效的識別模型。對于快消商品的識別,我們不僅要認(rèn)出一個(gè)瓶子包裝,還要認(rèn)出是一瓶酸奶還是啤酒;不僅要認(rèn)出酸奶,還要認(rèn)出是哪個(gè)品牌的酸奶,甚至是哪個(gè)口味和規(guī)格。要讓機(jī)器能夠準(zhǔn)確識別成千上萬的快消商品SKU,是一項(xiàng)極其龐大而復(fù)雜的AI工程。AI自動圖像標(biāo)注平臺SpeedDP。
要解決小目標(biāo)難以追蹤的這個(gè)難題,慧視光電的算法工程師給出了小目標(biāo)識別算法的方案,通過加強(qiáng)目標(biāo)特征、數(shù)據(jù)增廣、放大輸入圖像、使用高分辨率的特征、設(shè)計(jì)合適的標(biāo)簽分配方法,以讓小目標(biāo)有更多的正樣本、利用小目標(biāo)所處的環(huán)境信息或者其他容易檢測的物體之間的關(guān)系來輔助小目標(biāo)的檢測。此外,利用自研的深度學(xué)習(xí)算法開發(fā)平臺,通過不斷的深度學(xué)習(xí),能夠讓AI更加精細(xì)的識別目標(biāo)。這個(gè)方法在瑞芯微RK3588、RV1126、RK3399pro等系列圖像跟蹤板上得到了較好地驗(yàn)證。因此,將這個(gè)算法用在無人機(jī)高空識別領(lǐng)域,完全能夠彌補(bǔ)傳統(tǒng)算法的不足,達(dá)到更加穩(wěn)定鎖定跟蹤的目的。機(jī)器人是AI發(fā)展后的一個(gè)重要載體。陜西AI智能智能方案
人工智能和機(jī)器學(xué)習(xí)的數(shù)字施工工具,可以提供準(zhǔn)確和精確的測量。陜西AI智能智能方案
圖像識別以圖像處理為基礎(chǔ),是指以圖像為對象所開展的各種處理性工作,包括編碼、壓縮、復(fù)原及分割等。圖像處理過程中,以圖像輸入后,一般情況下也會通過圖像形態(tài)進(jìn)行輸出。在圖像識別過程中,將處理后的圖像輸入,一般情況下輸出類別與圖像結(jié)構(gòu)分析。也就是說,圖像識別是一個(gè)自原始圖像到物體類型的過程,原始圖像經(jīng)過圖像處理后,抽取特征并加以分類對比,以圖像樣本庫資源作為對比分析的參考依據(jù),然后確定物體類型。從本質(zhì)上來講,可以將圖像識別看作是對圖像分類與描述進(jìn)行研究的過程。在圖像識別過程中,在對圖像中物體進(jìn)行檢測分離之后,將物體特征提取出來,以形狀、紋理特征等作為提取對象,一般將圖像處理融入到圖像特征提取環(huán)節(jié)中。待對比分析明確物體類型后,從結(jié)構(gòu)層面上對圖像進(jìn)行分析。陜西AI智能智能方案