【寧夏大學(xué)新聞中心訊 信息工程學(xué)院】近日,信息工程學(xué)院劉昊教授團(tuán)隊(duì)在國(guó)際權(quán)威期刊《IEEE Transactions on Image Processing》(簡(jiǎn)稱(chēng)TIP)分別刊發(fā)了題為《HeadDiff: Exploring Rotation Uncertainty with Diffusion Models for Head Pose Estimation》和《Consensus-Agent Deep Reinforcement Learning for Face Aging》的學(xué)術(shù)論文(中科院SCI一區(qū)TOP,最新影響因子是12.0,中國(guó)計(jì)算機(jī)學(xué)會(huì)認(rèn)定CCF A類(lèi))。劉昊教授為通訊作者,2022級(jí)碩士研究生王耀興和2021級(jí)碩士研究生林靈分別為第一作者。上述2項(xiàng)成果獲得國(guó)家自然科學(xué)基金面上項(xiàng)目、寧夏科技廳重點(diǎn)研發(fā)計(jì)劃和寧夏自然科學(xué)基金優(yōu)秀青年項(xiàng)目的資助。
論文《HeadDiff: Exploring Rotation Uncertainty with Diffusion Models for Head Pose Estimation》致力于解決頭部姿態(tài)估計(jì)任務(wù)(預(yù)測(cè)給定圖像中人臉的方向)中旋轉(zhuǎn)表示的不確定性問(wèn)題。由于直接在歐幾里得空間與流形空間之間建模面臨極大挑戰(zhàn),該研究設(shè)計(jì)了一種概率回歸擴(kuò)散模型來(lái)估計(jì)頭部姿態(tài),有效解決了在自然環(huán)境中捕捉到的面部圖像旋轉(zhuǎn)方面的不確定性問(wèn)題。區(qū)別于傳統(tǒng)的圖像映射至姿態(tài)方法,所提出的模型通過(guò)擴(kuò)散過(guò)程保證了姿態(tài)旋轉(zhuǎn)的準(zhǔn)確性,并持續(xù)迭代優(yōu)化映射過(guò)程。首先,所提模型將頭部姿態(tài)估計(jì)問(wèn)題構(gòu)建為一個(gè)逆擴(kuò)散過(guò)程,采用了在流形上進(jìn)行漸進(jìn)去噪的采樣方法,將不確定性大幅分解成更小的中間步驟以深入挖掘。此外,模型引入了各向同性高斯分布,以編碼旋轉(zhuǎn)表示中的不連續(xù)信息。在最后階段,模型通過(guò)引入周期一致性約束學(xué)習(xí)了面部最近鄰關(guān)系,從而在應(yīng)對(duì)在野外條件下人臉面部形狀變化的同時(shí)確保姿態(tài)估計(jì)的魯棒性。在多個(gè)頭部姿態(tài)數(shù)據(jù)集上的廣泛實(shí)驗(yàn)結(jié)果證明,在無(wú)需輔助數(shù)據(jù)的情形下,所提方法優(yōu)于現(xiàn)有的頂尖技術(shù)。

原文鏈接:https://ieeexplore.ieee.org/document/10462910
論文《Consensus-Agent Deep Reinforcement Learning for Face Aging》致力于解決人臉老化任務(wù)(模擬面部外觀(guān)隨時(shí)間的變化)中缺乏同一身份下不同年齡數(shù)據(jù)的問(wèn)題?,F(xiàn)有模型通常使用年齡組之間的映射來(lái)訓(xùn)練,這使得大多數(shù)現(xiàn)有的老化方法難以準(zhǔn)確捕捉個(gè)體身份與老化特征之間的對(duì)應(yīng)關(guān)系,導(dǎo)致生成與真實(shí)老化外觀(guān)不匹配的人臉。該研究重新標(biāo)注了CACD2000數(shù)據(jù)集,并提出了一種共識(shí)智能體深度強(qiáng)化學(xué)習(xí)方法來(lái)解決上述問(wèn)題。具體來(lái)說(shuō),所提方法定義了兩個(gè)智能體,即老化進(jìn)程智能體和老化個(gè)性化智能體,并將匹配老化特征的任務(wù)建模為馬爾可夫決策過(guò)程。老化進(jìn)程智能體模擬個(gè)體的衰老過(guò)程,而老化個(gè)性化智能體則計(jì)算個(gè)體的衰老外觀(guān)與平均衰老外觀(guān)之間的差異。兩個(gè)智能體通過(guò)協(xié)同合作的形式迭代調(diào)整目標(biāo)老化特征與當(dāng)前身份之間的匹配程度。在四個(gè)面部老化數(shù)據(jù)集的廣泛實(shí)驗(yàn)結(jié)果表明,與當(dāng)前最先進(jìn)的方法相比,所提模型取得了令人信服的性能。

原文鏈接:https://ieeexplore.ieee.org/document/10458950
劉昊及其團(tuán)隊(duì)(計(jì)算機(jī)視覺(jué)與學(xué)習(xí)課題組)長(zhǎng)期從事模式識(shí)別與機(jī)器學(xué)習(xí)方向的研究工作。團(tuán)隊(duì)重點(diǎn)研究從人類(lèi)認(rèn)識(shí)真實(shí)世界過(guò)程中表現(xiàn)出的智能和認(rèn)知伴隨有不確定性獲得啟發(fā),將數(shù)據(jù)的不確定性估計(jì)作為額外的信息有助于模型做出更好的決策。團(tuán)隊(duì)還深入研究人臉數(shù)據(jù)的不確定性估計(jì)和模型魯棒性應(yīng)對(duì)外界復(fù)雜環(huán)境的問(wèn)題,擴(kuò)展了深度學(xué)習(xí)在標(biāo)注數(shù)據(jù)規(guī)模有限條件下的人臉視覺(jué)分析與數(shù)字人臉生成任務(wù)中的應(yīng)用。多項(xiàng)研究成果以寧夏大學(xué)為第一署名單位發(fā)表在中科院SCI一區(qū)TOP期刊IEEE TPAMI、TIP、TIFS、TMM、TCSVT以及中國(guó)計(jì)算機(jī)學(xué)會(huì)CCF A類(lèi)會(huì)議ACMMM、CVPR、AAAI等。
(責(zé)任編輯:楊雯)