基于深度學(xué)習的中文影評情感分析
摘要:隨著(zhù)社交網(wǎng)絡(luò )的興起,更多人選擇在網(wǎng)絡(luò )上發(fā)表自己對影視作品的觀(guān)點(diǎn),這為影視投資人了解觀(guān)眾對電影的反饋提供了更方便的途徑.例如,豆瓣影評中包含了海量用戶(hù)或積極或消極的情感觀(guān)點(diǎn),而分析豆瓣影評的情感傾向能夠輔助投資人進(jìn)行決策,提升作品質(zhì)量.大量數據分析必須借助計算機技術(shù)手段完成,其中情感分析是自然語(yǔ)言處理(natural language processing,NLP)的一個(gè)方向,常用來(lái)分析判斷文本描述的情緒類(lèi)型,因此也被稱(chēng)為情感傾向分析.為了提高影評情感分類(lèi)的準確率,設置了多組對比實(shí)驗來(lái)選擇最優(yōu)參數,比較了當以中文字符向量和詞向量為輸入矩陣時(shí),雙向長(cháng)短期記憶(bidirectional long short-term memory,Bi-LSTM)模型和卷積神經(jīng)網(wǎng)絡(luò )(convolutional neural network,CNN)模型對分類(lèi)準確率的影響.提出了一種以CNN模型為弱分類(lèi)器的Bagging算法,訓練了多個(gè)CNN模型,并采用投票法決定最終的分類(lèi)結果.這種集成的方法減少了單個(gè)模型造成的分類(lèi)偏差,比單一的Bi-LSTM模型的分類(lèi)準確率提高了5.10%,比單一的CNN模型的分類(lèi)準確率提高了1.34%.
注: 保護知識產(chǎn)權,如需閱讀全文請聯(lián)系上海大學(xué)學(xué)報雜志社