文本分析是什麼

text analytics, text mining

是資料科學的核心重點。

文本分析 (Text analytics) 或稱 文本挖掘／探勘 (Text mining)

OSEMM 模式
Beyond OSEMM : 文本語意世界

一般流程

先拆解文本成為較小的語詞單位。
進行文本的（語意）表徵。
利用表徵來結合機器學習與自然語言處理技術，施行在不同的應用上。

應用

法律文本（法規條文、判決判例、司法解釋、專利語意）：
學術文本：知識軌跡與趨勢 (research stream) 探索
金融文本：法定報表、CFO 聲明
行銷文本：廣告文案、客戶評價與偏好萃取、客服紀錄
醫學文本：病歷、憂鬱語言分析

Previous資料科學的 OSEMN 模式 Next程式處理架構

Last updated 6 years ago