本書規劃
用意是為了實驗室的培訓,以及作為台大基本能力課課程講義。寫作的風格:TL; DR
謝舒凱 & 台大語言學研究所語言處理與人文計算 (LOPE) 實驗室
這個書希望以一種永續協作經營的方式存活。內容貢獻者包括了:曾昱翔、廖永賦、連大成、陳蓓怡、洪漢唐、..............
背景知識
駕馭文本數據的需要
大數據 (Big Data)
的時代,數位資料累積與增長的速度已經遠遠倍增於人類史上的任何階段。搭配著 AI 技術發展的加速,這樣一種鉅量資料風潮,不僅改變了人文社會與自然科學研究的面貌,在各項產業也產生了分析資料輔佐決策的迫切需求。在此背景下,數位素養 (digital literacy) 已經成為現代公 民必須具備的基本素養之一,近年來新興的資料科學家 (data scientist) 更成為當前最為熱門的行業之一。
然而由於數據資料的發展,隨著社交媒體與社會網路的發展,非結構性的文本資料所佔比例已經遠超過結構性的表格性資料,使得文本的語言分析在資料科學發展中的角色顯得愈來愈重要,特別對於人文與社會科學的學生而言,更是開啟了一個結合數位科技與人文關懷的新的發展方向。
本教程的設計,就是在這個動機之下,透過介紹語言學與文本分析知識結合統計計算,希望能夠刺激人文、社會、傳播與其他財務管理、醫學等各領域學生之間的互動協作與學習,培養跨領域的興趣與分析能力。
課程相關訊息
教學影片
Last updated