摘要:互聯(lián)網(wǎng)數(shù)據(jù)的爆炸式增長,使得研究熱點更多轉(zhuǎn)向Web內(nèi)容結(jié)構(gòu)化分析。如果將藏語知識以結(jié)構(gòu)化形式表示,那么將會有利于藏語知識的結(jié)構(gòu)化分析和深度挖掘。該文提出了一種優(yōu)化詞向量的GRU神經(jīng)網(wǎng)絡模型進行藏語實體關系抽取的方法。在模型的訓練中,加入了優(yōu)化的詞向量,在傳統(tǒng)的詞向量模型中結(jié)合藏語音節(jié)向量、音節(jié)位置向量、詞性向量等特征對詞向量進一步優(yōu)化,并且選取了藏語詞匯特征和藏語句子特征。實驗證明,通過使用改進詞向量F1值達到了78.43%。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社。
中文信息學報雜志, 月刊,本刊重視學術導向,堅持科學性、學術性、先進性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:綜述、語言資源建設、機器翻譯、信息抽取與文本挖掘、情感分析與社會計算、自然語言理解與生成等。于1986年經(jīng)新聞總署批準的正規(guī)刊物。