語言分析與資料科學
  • 本書規劃
  • PART I:基礎知識
    • 導論
    • 語言學
      • 語言的實證研究方法
    • 數學與統計
      • 統計
        • 機率與機率分佈
          • 推論統計
        • 迴歸模型
      • 線性代數
    • 自然語言處理
      • 語料庫
    • 機器學習
      • kNN
      • Probabilistic learning using Naive Bayes
      • 決策樹 Decision Trees
      • 支持向量機 Support Vector Machines
      • 迴歸分析 Regression models
      • 神經網路與深度學習 Neural Network and Deep Learning
      • 關聯規則挖掘 Association Rules
      • k-means 分群 Clusterings
      • 社會網路分析
    • 資料科學的 OSEMN 模式
  • PART II: 文本分析:資料處理、表徵與語意計算
    • 文本分析是什麼
      • 程式處理架構
    • 文本前處理
      • 文本收集
      • 文本清理
      • 自動分詞與詞類標記
      • 文本標記
    • 文本數據探索性分析
    • 文本語意與統計
      • 語意表徵
      • 文本訊息視覺化
      • 文本相似與關聯
    • 文本知識抽取
  • PART III:文本分析:模型應用與專案
    • 文本迴歸預測
    • 文本分類
      • 情緒分析
      • 垃圾訊息偵測
    • 文本自動生成
      • 自動摘要
    • 文本聚類
    • 主題模型
    • 立場、意圖與價值
    • 個人文體風格
    • 文本真實性
      • 重複文本偵測
    • 資料科學報告與部署
  • 附錄
    • R 存活指令
    • Python 存活指令
    • Git and Github 入手
    • Linux 存活指令
    • 正則表示法
    • 參考書目
Powered by GitBook
On this page
  • 想法的概念
  • 意見的語言表達與文本特徵
  • 言談分析、語用與功能語言學
  • 立場自動偵測
  • 文本呈現的作者意圖
  • 批踢踢立場偵測
  • 批踢踢語料庫
  • 舉例

Was this helpful?

  1. PART III:文本分析:模型應用與專案

立場、意圖與價值

  • 社群網站造就了語言使用、文本閱讀經驗與意見傳播渠道的多元。

  • 我們意見的形成與表達 (forming and framing opinions) 的社會心理機制也不同於以往。

  • 我們在社會媒體的各種活動,也產生不同了的政治運動、運作與效應。

所以用網路或社會媒體的文本來偵測、分類與預測對於特定議題或人物的集體立場分佈,變成了顯學。

想法的概念

  • 立場、態度、意見、觀點、意識形態、信念 | 說服、爭論、想、相信、覺得、以為

先想看看差別在哪,怎麼把這些關鍵字連接起來。
  • Opinions reveal how users feel about an event, a person, or any focus of discussion.

  • 學者版: "A public act by a social actor, achieved dialogically through overt communicative means (language, gesture, and other symbolic forms), through which social actors simultaneously evaluate objects, position subjects (themselves and others), and align with other subjects, with respect to any salient dimension of the socio-cultural field" (Du Bois, 2007).

  • Evaluation, Affect and Epistemicity ("committment") (Englebretson, 2007).

意見的語言表達與文本特徵

  • 形式上,就是短、短、再短一點!

  • 語言學上關於 stance-taking language and\/or linguistic behaviour of arguing 的討論,要關心的是 the lexical and grammatical expression of attitudes, feelings, judgments, or commitment concerning the propositional content of a message (Biber et al,, 1999).

  • 舉例來說,語言特徵中有一個很明顯的,就是言談標誌 (marker).

言談分析、語用與功能語言學

  • I guess, which can be used to initiate an assessment\/assertion and to invite interlocutors to also take a stance, or used in responsive actions to alter the speaker's own previous attitude or assertion (Kӓrkkӓinen, 2007).

「我認為」、「我想」的意思是什麼
  • Use of meta-discourse in writing persuasive texts \/ establishing authority.

簡單講,我們可以利用語言學的分析,了解 how users position themselves and express their attitude on certain issue in online discussions (esp.. in the opinionated context).

立場自動偵測

Reconizing stances in Debates: automatically determining from text whether the author of the text is in favor of, against, or neutral towards a proposition or target.

文本呈現的作者意圖

"I am dying to see the Life of Pi"
我迫不及待要看少年 pi 的奇幻漂流了

"I am looking for a car to replace my old Ford Focus, any suggestions?"

(Liu, 2015)
  • intention mining

批踢踢立場偵測

批踢踢語料庫

  • 每一行潑文受限於 27 個中文字;每則潑文前面可以放推噓標籤。

舉例

Previous主題模型Next個人文體風格

Last updated 5 years ago

Was this helpful?