摘要:目的應(yīng)用不同機(jī)器學(xué)習(xí)算法預(yù)測(cè)男男性行為(MSM)人群HIV感染狀況的比較。方法將四種機(jī)器學(xué)習(xí)算法(logistic回歸、神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林和支持向量機(jī))的預(yù)測(cè)結(jié)果和實(shí)驗(yàn)室的檢測(cè)結(jié)果相比較,分類(lèi)性能的評(píng)價(jià)指標(biāo)采用ROC曲線下面積(AUC)、靈敏度、特異度和準(zhǔn)確度(PRE)。結(jié)果四種算法在訓(xùn)練集和測(cè)試集上均具有較理想的分類(lèi)效能,訓(xùn)練集的結(jié)果略好于測(cè)試集。和logistic回歸分析相比較,其他幾種算法均提高了分類(lèi)預(yù)測(cè)效能:神經(jīng)網(wǎng)絡(luò)提高18.4%(AUC:0.909,95%CI:0.903~0.915),隨機(jī)森林提高19.7%(AUC:0.922,95%CI:0.920~0.924),支持向量機(jī)提高22.3%(AUC:0.948,95%CI:0.947~0.949)。其中支持向量機(jī)的分類(lèi)性能最好,分類(lèi)的靈敏度為97.5%,特異度為99.1%,準(zhǔn)確度(PRE)為98.9%。結(jié)論機(jī)器學(xué)習(xí)算法顯著地提高了MSM人群中HIV感染的預(yù)測(cè)效能,可以較準(zhǔn)確地識(shí)別MSM人群中HIV感染者與未感染者,為及時(shí)地提供預(yù)防與治療服務(wù)提供了依據(jù),同時(shí)避免了醫(yī)療資源的浪費(fèi)。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社。
中國(guó)衛(wèi)生統(tǒng)計(jì)雜志, 雙月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅(jiān)持科學(xué)性、學(xué)術(shù)性、先進(jìn)性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:論著、應(yīng)用研究、綜述、教學(xué)研究、專(zhuān)家共識(shí)、專(zhuān)題研究等。于1984年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。