語言分析與資料科學
  • 本書規劃
  • PART I:基礎知識
    • 導論
    • 語言學
      • 語言的實證研究方法
    • 數學與統計
      • 統計
        • 機率與機率分佈
          • 推論統計
        • 迴歸模型
      • 線性代數
    • 自然語言處理
      • 語料庫
    • 機器學習
      • kNN
      • Probabilistic learning using Naive Bayes
      • 決策樹 Decision Trees
      • 支持向量機 Support Vector Machines
      • 迴歸分析 Regression models
      • 神經網路與深度學習 Neural Network and Deep Learning
      • 關聯規則挖掘 Association Rules
      • k-means 分群 Clusterings
      • 社會網路分析
    • 資料科學的 OSEMN 模式
  • PART II: 文本分析:資料處理、表徵與語意計算
    • 文本分析是什麼
      • 程式處理架構
    • 文本前處理
      • 文本收集
      • 文本清理
      • 自動分詞與詞類標記
      • 文本標記
    • 文本數據探索性分析
    • 文本語意與統計
      • 語意表徵
      • 文本訊息視覺化
      • 文本相似與關聯
    • 文本知識抽取
  • PART III:文本分析:模型應用與專案
    • 文本迴歸預測
    • 文本分類
      • 情緒分析
      • 垃圾訊息偵測
    • 文本自動生成
      • 自動摘要
    • 文本聚類
    • 主題模型
    • 立場、意圖與價值
    • 個人文體風格
    • 文本真實性
      • 重複文本偵測
    • 資料科學報告與部署
  • 附錄
    • R 存活指令
    • Python 存活指令
    • Git and Github 入手
    • Linux 存活指令
    • 正則表示法
    • 參考書目
Powered by GitBook
On this page
  • 動機
  • 情緒的語言表達
  • Aspect, entity and their sentiment classification
  • 情緒的語意角色
  • 情緒語言的語用
  • 情緒詞表
  • 訓練與測試語料
  • 進階主題
  • 入門實作
  • R 相關套件

Was this helpful?

  1. PART III:文本分析:模型應用與專案
  2. 文本分類

情緒分析

  • 情緒 (emotion) 是類別 (class) 的概念。

  • 情緒極度 (sentiment polarity) 是連續性數值的概念,只是通常也簡化到三大類別 (負向/中性/正向)。

  • 情緒與語意的關係必須要先想清楚。

  • 立場

  • 偏好

動機

情意處理是

affectual attitude such as frustration, joy, anger, sadness, excitement, and so on.

情緒的語言表達

  • 情緒在各種文本粒度 text granularity (如: SMS messages, chat messages, tweets, product reviews, blog posts, and whole documents 等等)有不同要注意的地方。

  • 語言細節常被忽略

    • 在語言處理上, stop word removal 這個步驟會造成重要訊息的忽略。

  • 要知道想要偵測的對象:speaker\/writer, reader, 還是 one or more entities mentioned in the utterance,如:

    李小姐說謝老師很傷心。

  • 不同讀者在不同情境的反應也不同。

Aspect, entity and their sentiment classification

  • Sentiment Towards Aspects of an Entity:對於餐廳的「服務」和「食物」評價可能不同。

  • 通常做法:訓練語料+監督式機器學習+特徵集

情緒的語意角色

  • The FrameNet frame for emotions.

情緒語言的語用

sarcastic, ironic, or hyperbolic.

情緒詞表

  • 通常會利用手工或自動化產生的 word–sentiment (or valence) association lexicon

    • 快樂 - positive
      難過 - negative
      桌子 - neutral
  • 不同類型的詞表

    • 情緒組合:Lexicons that include sentiment associations for phrases as well as their constituent words are referred to as sentiment composition lexicons (SCLs).

訓練與測試語料

  • (SemEval-2016 shared task competition), Task #6: Detecting Stance from Tweets (Mohammad, Kiritchenko, Sobhani, Zhu, & Cherry, 2016a). 2,914 training instances labeled for stance for the five targets. The test data included 1,249 instances. 免費。

進階主題

  • 同理心 Empathy

  • 理性 vs 感性

  • 人格

(Liu, 2015)

入門實作

R 相關套件

Previous文本分類Next垃圾訊息偵測

Last updated 5 years ago

Was this helpful?

- Extracts sentiment from text using three different sentiment dictionaries.

syuzhet
sentimentr
SentimentAnalysis