語言分析與資料科學
  • 本書規劃
  • PART I:基礎知識
    • 導論
    • 語言學
      • 語言的實證研究方法
    • 數學與統計
      • 統計
        • 機率與機率分佈
          • 推論統計
        • 迴歸模型
      • 線性代數
    • 自然語言處理
      • 語料庫
    • 機器學習
      • kNN
      • Probabilistic learning using Naive Bayes
      • 決策樹 Decision Trees
      • 支持向量機 Support Vector Machines
      • 迴歸分析 Regression models
      • 神經網路與深度學習 Neural Network and Deep Learning
      • 關聯規則挖掘 Association Rules
      • k-means 分群 Clusterings
      • 社會網路分析
    • 資料科學的 OSEMN 模式
  • PART II: 文本分析:資料處理、表徵與語意計算
    • 文本分析是什麼
      • 程式處理架構
    • 文本前處理
      • 文本收集
      • 文本清理
      • 自動分詞與詞類標記
      • 文本標記
    • 文本數據探索性分析
    • 文本語意與統計
      • 語意表徵
      • 文本訊息視覺化
      • 文本相似與關聯
    • 文本知識抽取
  • PART III:文本分析:模型應用與專案
    • 文本迴歸預測
    • 文本分類
      • 情緒分析
      • 垃圾訊息偵測
    • 文本自動生成
      • 自動摘要
    • 文本聚類
    • 主題模型
    • 立場、意圖與價值
    • 個人文體風格
    • 文本真實性
      • 重複文本偵測
    • 資料科學報告與部署
  • 附錄
    • R 存活指令
    • Python 存活指令
    • Git and Github 入手
    • Linux 存活指令
    • 正則表示法
    • 參考書目
Powered by GitBook
On this page

Was this helpful?

  1. 附錄

參考書目

Previous正則表示法

Last updated 5 years ago

Was this helpful?

Andrew Bruce and Peter Bruce. 2017. Practical Statistics for Data Scientists. Publisher: O'Reilly Media, Inc.

Tony OjedaRebecca Bilbro, Benjamin Bengfort and . 2018. Applied Text Analysis with Python. Publisher: O'Reilly Media, Inc.

Steven Struhl. 2015. Practical Text Analytics. Publisher: Kogan Page.

I. Feinerer. An introduction to text mining in R. R News, 8(2):19–22, Oct. 2008. .

I. Feinerer, K. Hornik, and D. Meyer. Text mining infrastructure in R. Journal of Statistical Software, 25(5):1–54, March 2008. ISSN 1548-7660. .

J. Li. Rwordseg: Chinese word segmentation, 2012. projects/rweibo/. R package version 0.0-4/r37.

H. Ronggui. rmmseg4j: Chinese word segmentation based on mmseg4j, 2011. URL . R package version 0.1-0/r389.

Dan Toomey. 2014. R for Data Science. Packt Publishing.

Charu C. Aggarwal and ChengXiang Zhai. 2012. Mining Text Data. Springer.

Dan Jurafsky and James H Martin. 2000. Speech & Language Processing. Pearson Education.

Ludovic Lebart, André Salem, Lisette Berry. 1998. Exploring Textual Data. Springer.

Sholom M. Weiss, et al. 2005. Text Mining: Predictive Methods for Analyzing Unstructured Information. Springer.

Sebastien Le and Thierry Worch. 2015. Analyzing Sensory Data with R. CRC Press.

Graham Wilcock. 2009. Introduction to Linguistic Annotation and Text Analytics. Morgan & Claypool.

Sheather 2009. A modern approach to regression with R. Springer.

R 的學習歷程:

http://CRAN.R-project.org/doc/Rnews/
http://www.jstatsoft.org/v25/i05
http://R-Forge.R-project.org/
http://R-Forge.R-project.org/projects/rqda/
https://yongfu.name/2018/01/31/RlearningPath.html