格式:pdf
大小:268KB
頁數:
提出Dirichlet混合多項式(DCM)流形,并利用DCM流形可與正半球流形建立同胚和等距關系的性質,通過拉回映射將正半球流形的測地距離映射為DCM流形的測地距離,從而在DCM流形上建立距離度量,構建統計流形上的Dirichlet混合多項式擴散核和Dirichlet混合多項式倒排文檔頻率(DCMIDF)擴散核.利用WebKB Top4和20 Newsgroups語料庫上進行實驗,DCM流形能比歐氏空間更能準確地描述文本.與多項式核支持向量機算法、,負測地距離核支持向量機算法相比,實驗結果顯示文中基于DCM擴散核和DCMIDF擴散核的支持向量機算法可取得良好的文本分類效果.