本模型使用U2net為主要基礎架構,旨在應用於將透過手機拍攝的影像中萃取出稻穗影像並去除背景像素,以作為可進一步分析(如穀粒含水量推估)之預處理方式,由於U2net擅長背景去除的影像語義分割之用途,因此選擇基於此架構訓練去背模型。
下圖由左至右分別為:1.原圖、2.以Grad-CAM繪製模型注意力之熱力圖、3.模型分割後的影像遮罩、4.以遮罩切割原圖之最終結果
1.訓練模型引用U2net架構
@InProceedings{Qin_2020_PR,
title = {U2-Net: Going Deeper with Nested U-Structure for Salient Object Detection},
author = {Qin, Xuebin and Zhang, Zichen and Huang, Chenyang and Dehghan, Masood and Zaiane, Osmar and Jagersand, Martin},
journal = {Pattern Recognition},
volume = {106},
pages = {107404},
year = {2020}
}
2. 稻米穀粒含水量推估模型參考文獻: https://www.mdpi.com/1424-8220/21/17/5875