文章資訊

MAIA (Medical AI Assistant) 新冠肺炎偵測

新冠肺炎(COVID-19):
2019年12月於武漢發生第一例,新冠肺炎病毒屬冠狀病毒科,為單股RNA正鏈病毒。
此病毒傳染力強,飛沫及接觸傳染,並主要感染下呼吸道,具1-14天潛伏期,徵狀並不明顯,常見為發燒、乾咳、疲累、口鼻感官失調等。目前已知病毒突刺主要接觸黏膜細胞上的ACE2進行細胞膜融合,由此進入細胞中大量複製病毒RNA及蛋白外殼,經高基式體加以組裝並送出胞外進行下一波感染。目前新冠肺炎已大流行傳染,於世界各地群聚感染,因此,新冠肺炎的偵測是刻不容緩的議題。


影像訓練資料集
:
影像來源 影像類別

史丹佛機器學習團隊
CheXpert 資料集
https://stanfordmlgroup.github.io/competitions/chexpert/

 
健康影像

新冠肺炎
Joseph Paul Cohen, COVID-19 image data collection
https://github.com/ieee8023/covid-chestxray-dataset

 
 
新冠肺炎
(+)

 

1. 史丹佛機器學習團隊
CheXpert 資料集
https://stanfordmlgroup.github.io/competitions/chexpert/

2. Chest X-rays tuberculosis from India
https://www.kaggle.com/raddar/chest-xrays-tuberculosis-from-india

 
新冠肺炎(-)

類別: 胸腔X
圖片大小: 298 x 294 – 4248 x 3480

 
 
1.
(上左
) 健康胸腔X來自CheXpert資料集(上右新冠肺炎病患胸腔X光來自github: ieee8023/covid-chestxray-dataset
(下) 非新冠肺炎疾病胸腔X光來自CheXpert資料集與tuberculosis from India    



資料切分訓練及驗證:
資料集 模型訓練
Image/Patients
模型測試
Image/Patients
CheXpert Healthy 4455/4000 1109/1000
CheXpert Disease
Tuberculosis
11260/4000
50/50
2774/1000
25/25
COVID-19 (+) 50/35 22/14

模型內Validation資料由MAIA自動化切分

疾病影像資料依據病人ID進行訓練與檢測資料切分

                

硬體需求:
CPU: i7-8750H  

RAM: 32GB
GPU: RTX-8000*2 96GB
Software: MAIA

 

MAIA核心運算:
深度學習,為機器學習領域之一,從大量資料學習資料與標記之間的關連。
與傳統機器學習不同的是,此技術能有更高的準確率和泛用性。
因此,沐恩生醫團隊開發一套醫學人工智慧助理軟體,其核心為自適化深度學習運算(AutoDL),搭配演算最佳化參數來進行資料建模工作,能在短時間內訓練出高準確度的模型並運用於未來新資料的偵測和預測上。
 
圖2. 

Medical AI Assistant介面展示    

模型評估:

評估指標 AUC Precision Recall Specificity F1 Score Accuracy
檢測結果 0.9500 0.8249 0.8606 0.8926 0.8416 0.8672



圖3.
模型評估於分類健康與疾病胸腔X光影像,模型達到86.7% accuracy、 82.4% precision89.3% recall 89.3% specificity 84.2% f1_score.
*Healthy 為CheXpert資料集中健康胸腔X光影像, Disease 為ChexXpert資料集中疾病胸腔與Tuberculosis胸腔X光影像, COVID-19為新冠肺炎患者胸腔X光影像

結論

MAIA 醫學人工智慧助理,能訓練輸入的胸腔X-Ray影像資料,學習過後產出精準偵測判別是否為新冠肺炎之模型。

史丹佛機器學習團隊 CheXpert 資料集含 14 種病徵 (包括肺炎),證實MAIA能有效分類健康和疾病的影像,並在大型模型下,完成少量新冠肺炎病例的特徵學習及測試驗證,其強大的深度學習效能,能有效輔助醫師迅速偵測影像。


如欲應用於臨床醫學上,仍需藉重專業醫師的診斷與治療,攜手對抗新冠肺炎。