基于LDA的航線(xiàn)潛在價(jià)值挖掘模型
摘要:在分析了傳統的主題模型后提出了一種基于LDA的航線(xiàn)潛在價(jià)值挖掘模型。該模型將旅客出行行為的分析劃分成兩個(gè)階段,出行意圖的確定及出行意圖下航線(xiàn)的選擇,并與旅客價(jià)值進(jìn)行融合來(lái)挖掘航線(xiàn)的潛在價(jià)值。出行意圖采用Gibbs sampling方法從旅客出行記錄中獲取,航線(xiàn)則在旅客確定出行意圖后由出行意圖的航線(xiàn)向量獲得,旅客價(jià)值則結合出行中的艙位信息進(jìn)行提取。在中國民航旅客訂票數據集上的實(shí)驗表明,本文模型在2010年和2011年兩個(gè)數據集上獲得的兩組航線(xiàn)潛在價(jià)值序列比pLSI模型和senLDA模型獲得的兩組航線(xiàn)潛在價(jià)值序列都擁有更好的有序相關(guān)性,且在挖掘排名前5的航線(xiàn)潛在價(jià)值時(shí),本文模型在該兩個(gè)數據集上獲得了兩組完全一致的航線(xiàn)潛在價(jià)值序列,表明其在挖掘高潛在價(jià)值航線(xiàn)方面的優(yōu)勢。
注: 保護知識產(chǎn)權,如需閱讀全文請聯(lián)系南京航空航天大學(xué)學(xué)報雜志社