云南自主研發(fā)圖像識別模塊解決方案

來源: 發(fā)布時間:2024-08-22

隨著AI的快速發(fā)展,對應(yīng)的軟硬件也得到了快速的普及,蘋果公司已經(jīng)推出了新一代的具有AI功能的系列產(chǎn)品,Intel也推出了具有AI能力的新一代芯片。無論是無人機(jī)用吊艙產(chǎn)品還是邊海防用轉(zhuǎn)臺產(chǎn)品,如果前端沒有具有AI能力的圖像處理板卡或智能跟蹤設(shè)備,沒有高性能的AI算法,很難在激烈的競爭中獲得優(yōu)勢。特別是針對一些特定場景或特定目標(biāo)的檢測跟蹤性能提升,圖像算法工程師的壓力與日俱增。按照傳統(tǒng)的做法,需要經(jīng)過數(shù)據(jù)采集、人工標(biāo)注、模型訓(xùn)練、模型部署、效果評估等流程。無人機(jī)小吊艙可以采用慧視RK3399圖像處理板實(shí)現(xiàn)遠(yuǎn)程目標(biāo)鎖定。云南自主研發(fā)圖像識別模塊解決方案

圖像識別模塊

YOLO系列算法是目標(biāo)識別領(lǐng)域很重要的技術(shù)之一,因?yàn)樾阅軓?qiáng)大、消耗算力較少,一直以來都是實(shí)時目標(biāo)檢測領(lǐng)域的主要范式。該框架被***用于各種實(shí)際應(yīng)用,包括自動駕駛、監(jiān)控和物流等行業(yè)的目標(biāo)識別。自今年2月YOLOv9發(fā)布以后,近期,清華又推出了YOLOv10,作為計算機(jī)視覺領(lǐng)域的突破性框架,具備實(shí)時的端到端目標(biāo)檢測能力,通過提供結(jié)合效率和準(zhǔn)確性的強(qiáng)大解決方案,延續(xù)了YOLO系列的傳統(tǒng)。據(jù)悉,YOLOv10在各種模型規(guī)模上都實(shí)現(xiàn)了SOTA性能和效率。例如,YOLOv10-S在COCO上的類似AP下比RT-DETR-R18快1.8倍,同時參數(shù)數(shù)量和FLOP大幅減少。與YOLOv9-C相比,在性能相同的情況下,YOLOv10-B的延遲減少了46%,參數(shù)減少了25%。貴州RV1126開發(fā)板圖像識別模塊供應(yīng)商慧視光電開發(fā)的慧視AI圖像處理板,采用了國產(chǎn)高性能CPU。

云南自主研發(fā)圖像識別模塊解決方案,圖像識別模塊

要解決這個難題,慧視光電的算法工程師給出了小目標(biāo)識別算法的方案,通過加強(qiáng)目標(biāo)特征、數(shù)據(jù)增廣、放大輸入圖像、使用高分辨率的特征、設(shè)計合適的標(biāo)簽分配方法,以讓小目標(biāo)有更多的正樣本、利用小目標(biāo)所處的環(huán)境信息或者其他容易檢測的物體之間的關(guān)系來輔助小目標(biāo)的檢測。此外,利用自研的深度學(xué)習(xí)算法開發(fā)平臺,通過不斷的深度學(xué)習(xí),能夠讓AI更加精細(xì)的識別目標(biāo)。這個方法在瑞芯微RK3588、RV1126、RK3399pro等系列圖像跟蹤板上得到了較好地驗(yàn)證。因此,將這個算法用在無人機(jī)高空識別領(lǐng)域,完全能夠彌補(bǔ)傳統(tǒng)算法的不足,達(dá)到更加穩(wěn)定鎖定跟蹤的目的。

無人機(jī)吊艙除了在安防巡檢、應(yīng)急救援等領(lǐng)域有應(yīng)用前景外,隨著2024上半年低空經(jīng)濟(jì)的大力發(fā)展,吊艙迎來了又一大應(yīng)用市場。利用無人機(jī)載物運(yùn)輸,具有便利高效的特點(diǎn),它能夠彌補(bǔ)傳統(tǒng)運(yùn)輸?shù)牟蛔?,提高交通運(yùn)輸?shù)男屎挽`活性,能夠有效連接城區(qū)與郊區(qū)、城與城之前的資源互送,做到資源的協(xié)調(diào)調(diào)配。低空經(jīng)濟(jì)以無人機(jī)為載體,載動物品進(jìn)行低空運(yùn)輸,這個過程中就可以用到無人機(jī)吊艙,慧視無人機(jī)吊艙內(nèi)置攝像頭+AI圖像處理板,能夠清晰獲得無人機(jī)前方畫面,在運(yùn)輸時能夠?qū)崿F(xiàn)避障等操作?;垡暪怆婇_發(fā)的VIZ-GT07D三軸雙光慣性穩(wěn)定吊艙,集成了640×512高分辨率紅外相機(jī)、1300萬像素的全高清可見光相機(jī)和陀螺穩(wěn)定平臺。超小的體積和重量,攜行方便,無論是白天還是夜間,都能夠獲取清晰的視頻畫面,為無人機(jī)運(yùn)輸提供便利。精確的遠(yuǎn)程打擊可以采用慧視Rk3399圖像處理板。

云南自主研發(fā)圖像識別模塊解決方案,圖像識別模塊

校園安全不僅關(guān)乎孩子們的安全,還關(guān)乎整個社會的發(fā)展。我們需要給孩子們一個安全的學(xué)習(xí)環(huán)境!基于這樣的共識,成都慧視就推出了校園安全的守護(hù)方案。在校園各個角度安裝AI攝像頭,這類攝像頭搭載了慧視光電開發(fā)的Viztra-LE034等圖像處理板,內(nèi)置高精度的目標(biāo)識別跟蹤算法,能夠增加校園內(nèi)安全管理的預(yù)警能力。AI攝像頭由各視頻監(jiān)控點(diǎn)和視頻報警設(shè)備組成,其中各監(jiān)控點(diǎn)利用視頻監(jiān)測、采集重要場所發(fā)生異常情況的信息和其他有效信息,并控制攝錄系統(tǒng)快速采集圖像信息;所有這些視頻可以通過數(shù)據(jù)傳輸系統(tǒng)傳輸給視頻報警系統(tǒng),通過視頻分析算法進(jìn)行分析、篩選、分類整理、完成設(shè)定的配置和報警相應(yīng)的功能。成都慧視有工業(yè)級板卡RK3588.云南自主研發(fā)圖像識別模塊解決方案

慧視RK3588圖像跟蹤板支持圖像識別模塊識別目標(biāo)(人、車)。云南自主研發(fā)圖像識別模塊解決方案

IDEA研究院團(tuán)隊(duì)推出了GroundingDINO? 1.5,它能夠?qū)崿F(xiàn)端側(cè)實(shí)時識別。在圖像和文本的語義理解上表現(xiàn)出色,能夠快速、準(zhǔn)確地根據(jù)語言提示檢測和識別圖像中的目標(biāo)對象。作為當(dāng)前性能比較好的開集檢測模型,GroundingDINO? 1.5Pro可以幫助構(gòu)建海量的具有物體級別語義信息的多模態(tài)數(shù)據(jù),從而有效地助力多模態(tài)大模型的訓(xùn)練。它可以將長文本描述中的短語與圖像中的具體對象或場景精確匹配,以增強(qiáng)AI對視覺內(nèi)容和文本之間關(guān)系的理解。目前,成都慧視利用AI圖像處理板和YOLO算法來實(shí)現(xiàn)對物體的實(shí)時監(jiān)測,其中,開發(fā)的Viztra-HE030圖像處理板采用了瑞芯微全新一代高性能芯片RK3588,擁有四大四小八核處理器,算力水平能夠達(dá)到6.0TOPS,在我司定制多種視頻接口后,可實(shí)時對目標(biāo)進(jìn)行識別或者人為的的鎖定,同時可以根據(jù)輸出目標(biāo)的靶量信息,對目標(biāo)進(jìn)行實(shí)時跟蹤。云南自主研發(fā)圖像識別模塊解決方案