語言標記與分析指南
CtrlK
  • 背景
  • Part .ONE
    • 預備,開始!
      • 現有標記方式
        • 群眾外包
        • 聘僱工讀生
      • 現有標記問題
        • 素質參差不齊
        • 品質參差不齊
        • 僅能處理簡單標記
        • 標準難建立
      • KYLEANNO 解法
        • 語言背景優勢
        • 素質整齊
        • 專業訓練
      • How are we different?
        • 眾包 vs. 專業
        • 資工 vs. 語言
  • Part.TWO
    • 語言資源與標記
      • 語料庫:反應語言使用
      • 詞庫:語言單位組合知識
      • 知識本體:概念階層
      • 常識庫:世界知識與事實
    • 不同訊息類型的標記
      • 情意標記
        • 情緒極度標記
        • 態度立場標記
  • Part.THREE
    • 標記的流程
    • 標記前的思考
      • 標記的目的
      • 可能的限制
    • 有明確標記主題
      • 標記流程摘要
      • 標記方式
        • 語意標記
        • 句法標記
        • 言談標記
  • Part.FOUR
    • 無明確標記主題
      • 主題類別列表
    • 標記的理論資源
      • 功能文本分析角度
      • 語料庫標記標準
      • 模式語法
    • 標記的工具
      • LOPOTATOR
    • 標記的評估
    • 參考書目
Powered by GitBook
On this page

Was this helpful?

  1. Part.FOUR

標記的評估

標記意見不同是正常的

They don't always agree, and this is a problem for machine learning systems that rely on the annotation for training data. Some types of annotation are straightforward (POS), but semantic annotation is trickier. Word sense annotation , with new sets of tags for every word, is particularly challenging.

PreviousLOPOTATORNext參考書目

Last updated 5 years ago

Was this helpful?