北理工團(tuán)隊(duì)在紅外弱小集群目標(biāo)檢測(cè)領(lǐng)域取得新突破
發(fā)布日期:2025-09-11 供稿:光電學(xué)院 攝影:光電學(xué)院
編輯:盛筠 審核:李家方 閱讀次數(shù):
近日,北京理工大學(xué)光電學(xué)院許廷發(fā)教授科研團(tuán)隊(duì)在紅外弱小集群目標(biāo)檢測(cè)方面取得新的進(jìn)展,針對(duì)紅外成像時(shí)序信息利用不足、弱小集群目標(biāo)信噪比低、背景復(fù)雜等核心難題,科研團(tuán)隊(duì)提出了一步式Transformer檢測(cè)方法,研究成果以 “OSFormer: One-Step Transformer for Infrared Video Small Object Detection” 為題,發(fā)表于國(guó)際計(jì)算機(jī)視覺(jué)與圖像處理領(lǐng)域頂級(jí)期刊《IEEE Transactions on Image Processing》(TIP,CCF-A 類(lèi)),TIP是電氣與電子工程師協(xié)會(huì)(IEEE)旗下的圖像處理領(lǐng)域頂級(jí)學(xué)術(shù)期刊,被中科院SCI大類(lèi)分區(qū)評(píng)為一區(qū)TOP期刊,并被中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)推薦為A類(lèi)期刊。論文第一作者為北京理工大學(xué)秦昊林博士研究生,通訊作者為許廷發(fā)教授和李佳男長(zhǎng)聘副教授。
提出的一步式Transformer檢測(cè)范式(OSFormer)結(jié)構(gòu)如圖1所示。該范式將視頻序列轉(zhuǎn)換為立方體格式數(shù)據(jù),通過(guò)單次推理完成多幀同步分析;設(shè)計(jì)可變尺寸補(bǔ)丁注意力(Varied-Size Patch Attention,VPA)模塊,解決特征細(xì)粒度與計(jì)算成本的矛盾;集成多普勒自適應(yīng)濾波器,分離運(yùn)動(dòng)目標(biāo)信號(hào)與背景噪聲干擾。

圖1. OSFormer結(jié)構(gòu)圖
通過(guò)在不同紅外數(shù)據(jù)集上驗(yàn)證,該方法實(shí)現(xiàn)了城市、山地等復(fù)雜背景下對(duì)低空無(wú)人機(jī)單目標(biāo)和集群目標(biāo)的精準(zhǔn)檢測(cè),如圖2、圖3和圖4所示。將方法拓展至可見(jiàn)光模態(tài),OSFormer 仍展現(xiàn)出優(yōu)異的性能。

圖2. OSFormer在A(yíng)ntiUAV數(shù)據(jù)集上的檢測(cè)效果

圖3. OSFormer在InfraredUAV數(shù)據(jù)集上的檢測(cè)效果

圖4. OSFormer在UAVSwarm數(shù)據(jù)集上的檢測(cè)效果
該方法突破了紅外弱小集群目標(biāo)檢測(cè)技術(shù)瓶頸,有效解決了 “時(shí)序信息利用、小目標(biāo)特征捕捉、背景噪聲抑制” 三大核心問(wèn)題,提供了高效精準(zhǔn)的技術(shù)方案。研究成果對(duì)未來(lái)
論文詳情:Haolin Qin, Tingfa Xu, Yuan Tang, Fengxiang Xu and Jianan Li. 2025. OSFormer: One-Step Transformer for Infrared Video Small Object Detection. IEEE Transactions on Image Processing, doi: 10.1109/TIP.2025.3598426.
論文鏈接:https://ieeexplore.ieee.org/document/11130659
論文第一作者簡(jiǎn)介:
秦昊林,2022級(jí)北京理工大學(xué)博士研究生,師從許廷發(fā)教授,主要研究方向?yàn)橹悄苣繕?biāo)探測(cè)、圖像處理技術(shù)。在高水平期刊IEEE TIP、IEEE TNNLS、IEEE TGRS及頂會(huì)CVPR等發(fā)表論文16篇,其中第一作者7篇。入選首屆中國(guó)科協(xié)青年人才托舉工程博士生專(zhuān)項(xiàng)計(jì)劃,獲得全國(guó)光學(xué)與光學(xué)工程博士生學(xué)術(shù)聯(lián)賽全國(guó)百?gòu)?qiáng)。
論文通訊作者簡(jiǎn)介:
李佳男,北京理工大學(xué)光電學(xué)院,長(zhǎng)聘副教授,博士生導(dǎo)師,主要研究方向?yàn)楣怆姵上衲繕?biāo)多維探測(cè)與感知技術(shù)研究。連續(xù)兩年入選全球前2%頂尖科學(xué)家(2023、2024年)。以第一或共同第一作者發(fā)表論文20篇,包括IEEE TPAMI論文5篇;以通訊作者發(fā)表論文60余篇。其中,3篇論文入選ESI高被引,2篇一作論文單篇引用超千次,谷歌學(xué)術(shù)總引用5600次。主持國(guó)家自然科學(xué)基金、工信部高質(zhì)量發(fā)展專(zhuān)項(xiàng)(課題)等項(xiàng)目10項(xiàng)。入選中國(guó)科協(xié)、北京市科協(xié)青托。獲得地理信息科技進(jìn)步二等獎(jiǎng)(序2),中國(guó)圖象圖形學(xué)學(xué)會(huì)優(yōu)博,王大珩學(xué)生光學(xué)獎(jiǎng)等。指導(dǎo)學(xué)生獲得反無(wú)人機(jī)跟蹤挑戰(zhàn)賽國(guó)際冠軍等競(jìng)賽獎(jiǎng)項(xiàng)10余項(xiàng)。研究成果應(yīng)用于“中國(guó)天眼”、礦產(chǎn)開(kāi)發(fā)遙感監(jiān)測(cè)等領(lǐng)域。
許廷發(fā),博士,教授/博導(dǎo),國(guó)家一級(jí)重點(diǎn)學(xué)科“光學(xué)工程”學(xué)科責(zé)任教授,光電成像技術(shù)與系統(tǒng)教育部重點(diǎn)實(shí)驗(yàn)室主任,北京理工大學(xué)重慶創(chuàng)新中心副主任。近年來(lái)帶領(lǐng)其科研團(tuán)隊(duì)圍繞光電成像探測(cè)與識(shí)別、計(jì)算成像和人工智能等領(lǐng)域不斷深化研究。主持承擔(dān)國(guó)家自然科學(xué)基金委重大科研儀器研制項(xiàng)目等40余項(xiàng)。在國(guó)際、國(guó)內(nèi)等系列期刊發(fā)表學(xué)術(shù)論文200余篇,其中被SCI/EI收錄120余篇。以第一發(fā)明人申請(qǐng)國(guó)家發(fā)明專(zhuān)利87項(xiàng),已授權(quán)和公示45項(xiàng)。獲省部級(jí)科技進(jìn)步二等獎(jiǎng)等獎(jiǎng)項(xiàng)3項(xiàng)。指導(dǎo)研究生獲得中國(guó)圖象圖形學(xué)學(xué)會(huì)優(yōu)秀博士學(xué)位論文,二人次獲得王大珩高校學(xué)生光學(xué)獎(jiǎng),三人次獲得全國(guó)光學(xué)與光學(xué)工程博士生學(xué)術(shù)聯(lián)賽全國(guó)百?gòu)?qiáng),獲得中國(guó)高等教育博覽會(huì)“校企合作 雙百計(jì)劃”典型案例和重慶英才創(chuàng)新創(chuàng)業(yè)示范團(tuán)隊(duì)等榮譽(yù)稱(chēng)號(hào)。
分享到:
