国产AV激情无码久久,精品国产YW在线观看,亚洲国产欧美日韩欧美2018,中文字幕一区二区三区在线不卡

中科視語提出工業(yè)異常檢測大模型AnomalyGPT,實現(xiàn)零樣本異常檢測

2024-05-20 10:58   來源: 互聯(lián)網(wǎng)

工業(yè)異常檢測是工業(yè)生產(chǎn)中不可或缺的一部分,然而現(xiàn)有的工業(yè)異常檢測方法通常只能為測試樣本提供異常分?jǐn)?shù),需要人工設(shè)定閾值以區(qū)分正常和異常樣本,這限制了這些方法的實際應(yīng)用場景。此外,現(xiàn)有的大模型在圖像理解方面展現(xiàn)了卓越的能力,但是缺乏特定領(lǐng)域知識,而且對圖像中局部細節(jié)的理解較弱,這導(dǎo)致這些大模型不能直接用于工業(yè)異常檢測任務(wù)。

近日,中科視語和中國科學(xué)院自動化研究所的研究團隊針對該問題提出了異常檢測大模型AnomalyGPT。AnomalyGPT利用大模型的強大語義理解能力,通過精心設(shè)計的圖像解碼器和提示嵌入微調(diào)方法,能夠讓大模型充分理解工業(yè)場景圖像,判斷其中是否含有異常部分并指出異常位置,在少樣本和無監(jiān)督工業(yè)場景中取得了業(yè)內(nèi)最好性能,有利于基礎(chǔ)大模型的行業(yè)落地。

1716173085655016.png

AnomalyGPT為了解決現(xiàn)有大模型缺乏特定領(lǐng)域知識和局部細節(jié)理解較弱這兩個問題,設(shè)計了提示學(xué)習(xí)器和圖像解碼器兩個模塊,對現(xiàn)有的大模型進行訓(xùn)練調(diào)整,方法結(jié)構(gòu)如下圖所示:

1716173141515772.png

1. 圖像解碼器:該模塊參考多模態(tài)大模型的特征對齊思路,通過若干個線性投影層,將圖像編碼器所提取的由淺至深的中層特征與分別代表正常和異常語義的文本特征對齊。該結(jié)構(gòu)能夠提供異常區(qū)域分割的注意力圖,通過將該注意力圖輸入到大模型中,能夠指導(dǎo)大模型關(guān)注圖像中異常概率較高的局部區(qū)域,為大模型提供視覺細節(jié)信息。

2. 提示學(xué)習(xí)器:該模塊包含一個6層的卷積神經(jīng)網(wǎng)絡(luò),用于將圖像解碼器輸出的注意力圖轉(zhuǎn)化為大模型能夠理解的提示嵌入向量,通過提示嵌入的方式對大模型進行微調(diào),可以為大語言模型提供異常檢測所需的領(lǐng)域知識,同時有效避免大模型產(chǎn)生災(zāi)難性遺忘問題。

此外,為了對大模型進行訓(xùn)練,研究團隊還提出來使用基于泊松圖像編輯的異常模擬方法來產(chǎn)生模擬異常數(shù)據(jù),如下圖所示,相比于傳統(tǒng)的剪切拼接方法,泊松圖像編輯模擬產(chǎn)生的異常更加自然,這進一步提高了AnomalyGPT方法的性能。

1716173156899062.png

基于上述方法結(jié)構(gòu),AnomalyGPT研究團隊在兩個最權(quán)威的工業(yè)異常檢測數(shù)據(jù)集 MVTec-AD和VisA上進行了實驗,與現(xiàn)有少樣本異常檢測方法相比,AnomalyGPT取得了業(yè)內(nèi)最先進的性能,實驗結(jié)果如下表所示:

1716173165307901.png

在無監(jiān)督設(shè)置下,AnomalyGPT也取得了業(yè)內(nèi)最高的性能,結(jié)果如下表所示:

1716173176858361.png

下圖展示了AnomalyGPT在一些實例上的異常檢測和定位結(jié)果,與現(xiàn)有的大模型相比,AnomalyGPT在圖像內(nèi)容理解和異常檢測與定位任務(wù)上都具有更好的表現(xiàn):

1716173184754811.png

AnomalyGPT 論文已經(jīng)被人工智能頂級會議 AAAI 2024接收,論文預(yù)印版已發(fā)布于 Arxiv 上,并開源了相關(guān)代碼和演示頁面。

研究團隊認為,現(xiàn)有的大模型在通用領(lǐng)域表現(xiàn)卓越,但是在工業(yè)、醫(yī)學(xué)等專業(yè)領(lǐng)域的表現(xiàn)相對較弱,如何設(shè)計相應(yīng)結(jié)構(gòu)和方法,提高大模型的行業(yè)應(yīng)用能力,是一個值得深入研究的問題。


責(zé)任編輯:Linda
分享到:
0
【慎重聲明】凡本站未注明來源為"大眾時報網(wǎng)"的所有作品,均轉(zhuǎn)載、編譯或摘編自其它媒體,轉(zhuǎn)載、編譯或摘編的目的在于傳遞更多信息,并不代表本站贊同其觀點和對其真實性負責(zé)。如因作品內(nèi)容、版權(quán)和其他問題需要同本網(wǎng)聯(lián)系的,請在30日內(nèi)進行!
網(wǎng)站地圖 關(guān)于我們 免責(zé)聲明 投訴建議 sitemap

未經(jīng)許可任何人不得復(fù)制和鏡像,如有發(fā)現(xiàn)追究法律責(zé)任 粵ICP備2020138440號

<tfoot id="mjdss"><nobr id="mjdss"></nobr></tfoot>
    1. <ruby id="mjdss"><div id="mjdss"></div></ruby>
      <tr id="mjdss"></tr>