# 本書規劃

#### 謝舒凱 &  台大語言學研究所語言處理與人文計算 (LOPE) 實驗室 &#x20;

{% hint style="info" %}
這個書希望以一種永續協作經營的方式存活。內容貢獻者包括了：曾昱翔、廖永賦、連大成、陳蓓怡、洪漢唐、..............
{% endhint %}

## 背景知識

駕馭文本數據的需要

`大數據 (Big Data)` 的時代，數位資料累積與增長的速度已經遠遠倍增於人類史上的任何階段。搭配著 AI 技術發展的加速，這樣一種鉅量資料風潮,不僅改變了人文社會與自然科學研究的面貌，在各項產業也產生了分析資料輔佐決策的迫切需求。在此背景下，數位素養 (digital literacy) 已經成為現代公 民必須具備的基本素養之一，近年來新興的資料科學家 (data scientist) 更成為當前最為熱門的行業之一。

然而由於數據資料的發展，隨著社交媒體與社會網路的發展，非結構性的文本資料所佔比例已經遠超過結構性的表格性資料，使得文本的語言分析在資料科學發展中的角色顯得愈來愈重要，特別對於人文與社會科學的學生而言，更是開啟了一個結合數位科技與人文關懷的新的發展方向。

本教程的設計，就是在這個動機之下，透過介紹語言學與文本分析知識結合統計計算，希望能夠刺激人文、社會、傳播與其他財務管理、醫學等各領域學生之間的互動協作與學習，培養跨領域的興趣與分析能力。

## 課程相關訊息

* 課程網站 ([2017](http://loperntu.github.io/lads/); 2018; [2019](https://rlads2019.github.io/))
* [臉書社團](https://www.facebook.com/groups/652099794893097/)
* 教學影片