摘要:從基因?qū)用鎸Π┌Y進(jìn)行診斷將有效提高患者的治愈率,但癌癥基因表達(dá)數(shù)據(jù)集通常存在高維、小樣本、高噪聲并且類別不平衡等問題,對此類數(shù)據(jù)進(jìn)行分類是一項具有挑戰(zhàn)性的任務(wù).針對這些問題,提出一種基于差分進(jìn)化的代價敏感Stacking(DE-CStacking)集成的基因表達(dá)數(shù)據(jù)分類算法,采用隨機(jī)森林、K近鄰、樸素貝葉斯作為Stacking集成的初級學(xué)習(xí)器,將代價敏感的支持向量機(jī)作為次級學(xué)習(xí)器,初級學(xué)習(xí)器的輸出類概率和原始特征集作為次級學(xué)習(xí)器的輸入,并采用差分進(jìn)化對這些學(xué)習(xí)器的參數(shù)進(jìn)行優(yōu)化.通過在四個UCI的癌癥基因數(shù)據(jù)上的實驗對比,相對于其他傳統(tǒng)的集成算法,DE-CStacking算法在癌癥基因數(shù)據(jù)上表現(xiàn)出更好的泛化性能.
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社。
小型微型計算機(jī)系統(tǒng)雜志, 月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅持科學(xué)性、學(xué)術(shù)性、先進(jìn)性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:計算機(jī)網(wǎng)絡(luò)信息安全、算法理論、人工智能分布式計算、計算機(jī)圖形與圖像、計算機(jī)應(yīng)用等。于1980年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。