天下云科技應用層下的人臉識別(二):人臉庫
2022-10-13 19:31 來源: 互聯(lián)網
本文作者根據(jù)多年人臉識別項目經驗,總結了人臉識別技術在安防、商業(yè)領域應用及產品設計細節(jié),匯總成應用層下的人臉識別系列文章。
本文為系列文章的第二篇,介紹人臉庫的相關內容。人臉庫是人臉識別的基礎,建立人臉庫往往是人臉項目的首要任務,全文圍繞著什么是人臉庫及如何建立人臉庫展開討論。
1. 什么是人臉庫
簡單來講,人臉庫就是人臉數(shù)據(jù)的儲存管理中心,能夠為人臉識別提供比對模板,為抓拍人臉數(shù)據(jù)提供管理空間,為人臉算法檢測提供測試樣本。人臉識別項目是建立在人臉庫的基礎之上,所以人臉識別的首要任務便是是建立人臉庫。
人臉庫按照用途可分為人臉比對庫、人臉抓拍庫、人臉數(shù)據(jù)集,不同類型人臉庫的組成、結構、作用也有所不同,下面將會依次介紹,本文重點討論人臉比對庫。
1.1 人臉比對庫
人臉比對庫主要用于人臉1:N識別,如下圖,人臉1:N是將人臉抓拍照片的人臉特征與人臉庫中所有人臉特征進行逐一比對。
人臉比對庫主要由人臉庫管理、人臉數(shù)據(jù)、人臉庫屬性描述三部分組成,如下圖:
人臉比對庫按照應用場景又可分為四類,分別是黑名單庫、白名單庫、紅名單庫和灰名單庫。
(1)黑名單庫:黑名單指需要重點管控、關注的人員,一般由在逃犯、慣犯、水客、異常行為或是想要重點關注的人員構成。比中黑名單中會產生報警提示,常用于公安追逃;
(2)白名單庫:白名單一般指可信人員,常用于商業(yè)領域中的通行管理,白名單中的人員容許進入通過。例如在樓宇內設置人臉識別門禁,只容許公司內部人員進入,于是可將公司員工設置成白名單,白名單一般不會觸發(fā)報警;
(3)紅名單庫:紅名屬于白名單的拓展應用,用于白名單中需要重點關注展現(xiàn)的人群,如VIP客戶、領導人等,可在識別后進一步分析該人群的行為特點和活動范圍;
(4)灰名單:介于白名單和黑名單之間,是一類具有異常行為的可疑人員,還需要通過更多數(shù)據(jù)分析他們是否是黃牛、小偷、罪犯同伙等。
1.2 人臉抓拍庫
人臉抓拍庫是管理人臉抓拍數(shù)據(jù)的地方,在視頻流或圖片流中凡是能被算法檢測到的人臉都會經過圖像處理形成一張張人臉的抓拍照片及對應的場景照,再將抓拍照片進行數(shù)據(jù)結構化并與其場景照一同保留至人臉抓拍庫中。
抓拍庫的人臉照片會具有性別、年齡、戴眼鏡、胡須、表情、是否戴帽子、是否有遮擋等圖片描述,方便抓拍照片的檢索及深層次人臉數(shù)據(jù)應用。
人臉數(shù)據(jù)分為結構化數(shù)據(jù)和非結構化數(shù)據(jù),人臉結構化數(shù)據(jù)指將原始采集數(shù)據(jù)按照規(guī)則處理,形成具有統(tǒng)一格式,并用數(shù)據(jù)庫二維邏輯表來表現(xiàn)的數(shù)據(jù)。
如下圖:抓拍庫儲存的是結構化數(shù)據(jù),人臉結構化數(shù)據(jù)指原始人臉數(shù)據(jù)經過程序分析和過濾,形成具有統(tǒng)一格式和描述的數(shù)據(jù)儲存在數(shù)據(jù)庫中。
1.3 人臉數(shù)據(jù)集
人臉數(shù)據(jù)集就是用于檢測人臉算法效果和訓練算法的數(shù)據(jù)庫,網上有很多公開的人臉數(shù)據(jù)集可為模型訓練提供數(shù)據(jù)來源。
常見的人臉數(shù)據(jù)集可見下表:
人臉識別
人臉檢測
人臉表情
人臉年齡、性別
2. 如何建立人臉庫
人臉庫中人臉比對庫的建立最為為復雜,這里只討論人臉比對庫的建立過程。
2.1 梳理入庫流程
人臉入庫流程見下圖,人臉數(shù)據(jù)包含人臉特征向量,人臉信息兩部分,它們儲存在數(shù)據(jù)庫不同的表中,注意在刪除人臉庫照片時一定要刪除它對應的特征向量。如果照片質量未達到要求,且沒有更好的照片,可以有強制入庫的選項。
2.2 制定入庫規(guī)則
人臉數(shù)據(jù)的質量關系到人臉比對的效果,盡可能將人臉清晰、正臉、本人近期的人臉照片入庫。在人臉入庫時,產品需要制定入庫規(guī)則來過濾質量不佳、格式不規(guī)范的人臉數(shù)據(jù)。
入庫規(guī)則應該包含:
* 圖片的顏色:可支持彩色及灰度的圖片,要求256灰度圖片;
* 圖片的格式:各類主流圖片格式,例如 bmp/jpg/png等,圖片命名格式統(tǒng)一,如常用的命名“姓名_證件號”;
* 圖片像素:雙眼中心之間的距離大于30像素;
* 圖片尺寸:尺寸大于70X80以上;
* 人臉角度:人臉左右偏轉30度以內,上下偏轉20度以內;
* 入庫圖片大小建議幾十KB~幾百KB之間為宜,但也不能太大,超過1M,會影響入庫和識別的速度。
2.3 設計人臉庫功能、及界面
人臉庫應包含人臉信息的增、刪、改、查等基本功能,人臉庫界面可參見下圖的樣式:
人臉信息可以從客戶端批量導入,客戶端需要提供人臉批量導入模板,批量導入適合小規(guī)模格式統(tǒng)一的數(shù)據(jù)。
當人臉項目中需要入庫數(shù)萬以上的人臉信息,并且人臉數(shù)據(jù)格式并不統(tǒng)一,整理起來很麻煩,這時就需要設計批量入庫工具。
新建的人臉庫需要設定人臉規(guī)模,一般分為<1W、1W-100W、100W-W、>W四個范圍,大庫容進行人臉比對需要更高配置服務器,服務器配置與圖像處理能力的關系將會在后續(xù)文章中詳細討論。
2.4 采集人臉庫數(shù)據(jù)
如果想通過人臉識別技術識別某人,就需要先獲取到該人的人臉數(shù)據(jù),并錄入人臉庫中作為比對模板,那么如何采集人臉庫數(shù)據(jù)呢?采集方式依據(jù)使用場景而定。
公安類項目,人臉數(shù)據(jù)提供方是公安,公安內部有大量的人臉數(shù)據(jù),可通過對接公安信息資源庫來獲取人臉數(shù)據(jù),如下圖為八大公安信息資源庫。
公安的信息資源庫是嚴禁外泄的,對產品的網絡安全及數(shù)據(jù)保密性要求頗為嚴格,在產品設計時需要考慮到相關問題。
臉通行或新零售類項目,一般是用戶配合式采集人臉信息,需要設計人臉信息采集入口,用戶可在微信公眾號、app或PC端進行注冊時上傳人臉信息。
大型商業(yè)類或平安城市項目中,需要設計非配合式采集人臉信息。一般會通過在主要出入口、通道、走廊等地部署的人臉抓拍機,抓拍路人人臉,自動建立該人檔案庫,這里需要用到一人一檔,作者會在后期文章詳細討論。
以上就是系列文章的第二篇-人臉庫的相關內容,后續(xù)將會推出人臉識別系列文章,歡迎大家與我交流圖像識別相關問題。svserve.com
責任編輯:xiaoxiwang
【慎重聲明】凡本站未注明來源為"大眾時報網"的所有作品,均轉載、編譯或摘編自其它媒體,轉載、編譯或摘編的目的在于傳遞更多信息,并不代表本站贊同其觀點和對其真實性負責。如因作品內容、版權和其他問題需要同本網聯(lián)系的,請在30日內進行!
精彩推薦
精彩專題