語料分析與程式設計

課程進度

周次 日期 授課內容 作業 補充資料
1 9/12 課程概說與要求 #0: 安裝 Perl 在 Windows 上安裝 Perl 環境
2 9/19

[統計] 母體與抽樣入門觀念 (pp.1-11)

[Perl] I/O、字串、變數、四則運算 (pp.26-35)

#1: 基本輸入/輸出及變數觀念
題目參考答案
民意調查舉隅
3 9/26

[統計] 簡單隨機抽樣、抽樣變異及分布 (pp.12-32)

[Perl] 亂數、純量變數及運算、 結構化控制流程 ifwhile (pp.35-71, 183-185)

亂數應用:交大宿舍分配系統
4 10/3

[Perl] 迴圈及應用 (pp.70-93)

[統計] 抽樣的實際面、相關與因果 (pp.35-50, 65-72, 78-83, 214-217)

[語料] 以 stratified sampling 統計抽樣觀點審視流行的語料庫

#2: 分支及迴路
題目提示參考答案
中研院語料庫BNC
5 10/10 國慶日,放假
6 10/17

[Perl] 循序文字檔 (pp.319-328)、陣列入門 (pp.94-99, 103-104)、 next/last (pp.146-148)

#3: 陣列、檔案處理、regex 應用
題目參考答案
行動研究的爭議
7 10/24

[Perl] 陣列 (pp.103-116)、 foreach (pp.136-139)、 for

[統計] 研究方法、度量、尺度、效度 (pp.102-111, 117-120)

社會科學研究方法概述
8 10/31

[Perl] hash (pp.122-134)

[統計] 度量 (pp.102-129)

效度與傳訊機制
9 11/7

[Perl] regular expression (pp.253-264)、split (pp.298-300)

[語料] #4: Zipf's Law (當作期中考)
題目參考答案
Foundations of Statistical NLP, Ch1
10 11/14

[Perl] 複習 regular expression

[統計] 描述分布 (pp.133-151)、Excel 實作

11 11/21

[Perl] RE 的 greedy/non-greedy mode、anchor

[統計] 分布與統計量、關聯與迴歸 (pp.152-233)、Excel 實作

12 11/28

[Perl] function (Ch.6)

[統計] 假設檢定:從 O.J. Simpson 殺妻案The Daughter of Time 談起

統計革命與發展假設檢定的思路
13 12/5 [語料] collocations:觀念、frequency 法、距離標準差法 期末專題 Part I:collocation
題目:稍待一會兒...
語料The Adventures of Tom Sawyer
提示collocational window
期末專題 Part II:case study
要求:稍待一會兒...
Foundations of Statistical NLP, Ch5
14 12/12

[Perl] 程式提示:collocational window

[語料] collocations:mutual information 法

腦力激盪: mutual information
15 12/19

[語料] collocations:t test 法

CASE STUDY

統計表格
16 12/26 CASE STUDY
17 1/2 CASE STUDY
18 1/9 期末考

以上電子檔的格式均為 PDF (Portable Document Format), 建議使用 Adobe Acrobat Reader 5.0 以上的版本來閱讀。

其他下載地點:


←