自動聚類
自動聚類
自動聚類是基於相似性演演算法的自動聚類技術。
目錄
自動聚類是基於相似性演演算法的自動聚類技術。根據文本內容的相似度,將內容聚合成不同的類別,同時對每一個聚得的類別,給出精確的類別主題詞。系統聚類速度快、精度高,支持中英文聚類,並可根據用戶需求擴展到其他語種。該技術可應用於可視化文獻分析等諸多領域。
自動聚類是一種典型的無指導機器學習方法。它假設不同的類在特徵空間中佔據不同的區域,而且同一類文本佔據同一區域。在特徵空間中每個文本對應一個點,文本聚類的目標就是將文檔集合分成若干類,使得在特徵空間中,同一類的文本對應的點,集聚在一個區域中。也就是使同一類中的文本之間的距離最小。
自動聚類技術的目的,是自動地分析採集過來的所有信息,根據內容概念來把相似的文檔聚類到一起(相關性演演算法),同時完全自動化的生成類別的標題,並提供自動的熱點生成和自動的熱點趨勢分析。