面向中文用戶(hù)評論的自動(dòng)化眾包攻擊方法
摘要:面向文本的自動(dòng)化眾包攻擊具有攻擊成本低、隱蔽性強等特點(diǎn),這種攻擊可以自動(dòng)生成大量虛假評論,影響用戶(hù)評論社區的健康發(fā)展。近些年來(lái),有學(xué)者研究面向英文評論社區的文本自動(dòng)化眾包攻擊,但是鮮有針對中文評論社區的自動(dòng)化眾包攻擊的研究,針對這一不足,提出了基于漢字嵌入LSTM模型的中文文本自動(dòng)化生成攻擊方法。通過(guò)訓練由漢字嵌入網(wǎng)絡(luò )、LSTM網(wǎng)絡(luò )和Softmax全連接網(wǎng)絡(luò )組成的多層網(wǎng)絡(luò )模型,并引入溫度參數T構建攻擊模型。實(shí)驗中,從淘寶網(wǎng)的在線(xiàn)用戶(hù)評論中抓取了超過(guò)5萬(wàn)條真實(shí)的用戶(hù)評論數據,驗證所提攻擊方法的有效性。實(shí)驗結果表明,生成的虛假評論可以有效地欺騙基于語(yǔ)言學(xué)分析的分類(lèi)檢測方法和基本文本拷貝檢測等方法,并且通過(guò)大量的人工評估實(shí)驗發(fā)現所生成的文本具有真實(shí)性強、類(lèi)型廣等特點(diǎn)。
注: 保護知識產(chǎn)權,如需閱讀全文請聯(lián)系通信學(xué)報雜志社