需提出申請

表面增強拉曼(SERS)蘇丹紅檢測模型

蘇丹紅辨識模型

本專案實作了使用偏最小平方判別分析(PLS-DA)結合 VIP(Variable Importance in Projection)特徵篩選的多類別光譜分類模型,針對蘇丹紅 I\~IV 分類進行訓練與視覺化。支援 .asc.spc 格式,內建交叉驗證、Hamming 準確率評估與多種可視化工具。


模型簡介

此專案包含以下步驟:

  1. 資料預處理:插值與波長/強度歸一化
  2. PLS-DA 分類器:結合 PLSRegressionLinearDiscriminantAnalysis 投影至可判別空間
  3. VIP 特徵選擇:使用 VIP 分數篩選最具鑑別力的特徵點
  4. 準確率評估
  5. 一般分類準確率(Accuracy)
  6. 元素級別多標籤準確率(Hamming Accuracy)
  7. 可視化輸出
  8. VIP 門檻與準確率關係圖
  9. VIP 選中特徵在波長軸的位置標記圖
  10. 2D PLS-DA 分類結果分佈圖

系統需求

  • Python:3.8 以上
  • 記憶體:4GB 以上(建議 8GB+)
  • GPU:非必要(CPU 即可)

安裝方式

建議使用虛擬環境(如 condavenv)。

bash pip install -r requirements.txt

或手動安裝:

bash pip install numpy pandas scikit-learn matplotlib seaborn torch pywt pip install spectrochempy # 若需支援 .spc 檔


資料格式與輸入說明

支援格式:

  • .asc:Tab 分隔的波長-強度純文字格式
  • .spc:由 spectrochempy 讀取的二進位光譜格式

檔名命名規則(自動標籤對應):

III+IV(1比1)-xxx.asc → 蘇丹紅 III:50%, IV:50% 1+2(33%比66%)-xxx.spc → 蘇丹紅 I:33%, II:66%

標籤將自動轉換為 4 維比例向量。


輸入與輸出

輸入:

  • 放置 .asc / .spc 檔案於下列資料夾:
  • remix_data/remix_data_2/remix_data_3/
  • 可自訂 VIP 門檻範圍與最大主成分數

輸出:


使用方式

1. Clone 並安裝依賴套件

bash git clone https://github.com/morristao/PLS-DA_VIP.git !pip install numpy !pip install pandas !pip install torch !pip install torch.nn !pip install torch.optim !pip install matplotlib !pip install pyspectra !pip install PyWavelets !pip install Seaborn !pip install scikit-learn

2. 放置光譜資料

請將 .asc.spc 檔案放至以下資料夾中:

RAMAN remix_data/ remix_data_2/ remix_data_3/

3. 執行 Jupyter Notebook

bash jupyter notebook Project_handout20250616.ipynb

或轉換為 Python 腳本執行:

bash jupyter nbconvert --to script Project_handout20250616.ipynb python Project_handout20250616.py


評估指標

  • Accuracy:整體分類準確率
  • Hamming Accuracy:針對多成分樣本,逐元素是否分類正確的平均值
  • VIP 特徵數:每個門檻下篩選出來的重要特徵數量

參考資源

Data and Resources

基礎工具

  • raman_1dcnn_478k_v3.keraskeras

Additional Info

Field Value
Last Updated June 20, 2025, 12:55 (+0800)
Created August 19, 2024, 14:02 (+0800)

Recommended AI Model

表面增強拉曼(SERS)農藥分類模型-北勢育苗場

更新頻率 定期
瀏覽次數 6223
下載次數 0
Raman-Pesticide-Classification 本專案實作了拉曼光譜多類別分類流程,結合 XGBoost 與 Optuna 超參數最佳化,針對多種農藥樣本進行偵測。支援 .csv 格式光譜資料,內建交叉驗證、混淆矩陣與多種視覺化工具。 專案流程簡介 資料前處理 數值插值:將波長補齊為整數波長點 Min-Max...

表面增強拉曼(SERS)條碼模型

更新頻率 定期
瀏覽次數 53395
下載次數 0
用於預測經過混合的農藥,包含Carbaryl、Fipronil與Thiram等三種農藥 AI模型組成 使用CNN模型架構,搭配捲積核的堆疊,將一維數據的特徵轉換為二維數據,再以二維特徵擷取方式得到更明顯的細節用來預測混合農藥的組成。 輸入格式 本模型輸入格式為經過數據處理的41微峰值統計資料 輸出格式...