【107-1】數位人文學

Digital Humanities

邵軒磊 (國立臺灣師範大學)

本課程專注於使大碩同學有能力從一定的資料基礎上,「完整」操作一個專案,能從自己身邊的資料發現實用價值。課程關鍵字為「R語言、決策樹、文字探勘、文本分類」。

Ch 1. 數位人文課程概論 /  邵軒磊
Ch 2. 資料創制與讀入1 /  邵軒磊
Ch 3. 資料創制與讀入2 /  邵軒磊
Ch 4. 資料創制與讀入3 /  邵軒磊
Ch 5. 資料庫使用 圖表可視化1 /  邵軒磊
Ch 6. 資料庫使用 圖表可視化2 /  邵軒磊
Ch 7. 資料庫使用 圖表可視化3 /  邵軒磊
Ch 8. 分類算法與決策樹1 /  邵軒磊
Ch 9. 分類算法與決策樹2 /  邵軒磊
Ch 10. 專題實做 進度報告1 /  邵軒磊、黃詩淳
Ch 11. 專題實做 進度報告2 /  邵軒磊、黃詩淳
Ch 12. 專題實做 進度報告3 /  邵軒磊、黃詩淳
Ch 13. 專題實做 進度報告4 /  邵軒磊、黃詩淳
Ch 14. 專題實做成果報告 /  邵軒磊、黃詩淳、蔡芸琤

計畫主持人資訊

姓 名 邵軒磊
電子信箱 hlshao2@gmail.com
電 話 02-77343408
服務學校 台師大
系所單位 東亞學系
職 稱 副教授

教師簡介

姓 名 邵軒磊
現 職 副教授
E-Mail hlshao2@gmail.com
連絡電話 0277343408

最高學歷

Ph.D.

研究專長

政治學、數位人文

近年研究主題

政治學、數位人文

教師簡介

姓 名 黃詩淳
現 職 副教授
E-Mail schhuang@ntu.edu.tw

最高學歷

Ph.D.

研究專長

近年研究主題

中文課程名稱: 【107-1】數位人文學
英文課程名稱: Digital Humanities
教師姓名: 邵軒磊
開課學校/系所: 國立臺灣師範大學
開課學期: 1071
學分數: 3 學分
課程關鍵字: R語言、決策樹、文字探勘、文本分類
課程領域: 社會科學
課程階層: 基礎
應用數位技術/工具:

 使用各種數位工具對人文經典或現今社會現象做研究,將幫助於研究者能理解大量典籍之意義,並為未來更進一步之深入理解打下基礎。因此本課程將教導修課學員使用決策樹分析法(decision tree),對已有或特定未領域之文獻做出分析。本課程將直接使用數位工具,將作為補充教學時使用R語言,但同學亦可使用自身熟悉之程式語言。課程要求方面,使用「問題解決教學」(Problem-Solving Teaching)、做中學(doing by learning)鼓勵學員就既有熟悉資料以數位方式做出輔助分析,再配合自身專業學養做出解釋。

先備課程: 統計學
程式語言
延伸課程: 資料科學程式設計
相關課程: 資料科學相關課程

課程概述

本課程專注於使大碩同學有能力從一定的資料基礎上,「完整」操作一個專案,能從自己身邊的資料發現實用價值。課程關鍵字為「R語言、決策樹、文字探勘、文本分類」。

教學目標

 人文研究正面臨典範轉型的過程。數位科技與資訊革命帶給人文學科巨大的衝擊,一方面是傳統的研究方法、工具有其侷限性,致使研究發問受到影響,一方面則是日常生活、行為模式、社會文化正因為數位科技的普及而發生改變。 數位人文學之目的在於利用數位科技與數位內容進行人文研究,以及探索數位科技的社會衝擊與因應之道。數位人文學源自於各種人文學科的資料計算(humanities computing),並廣泛地運用新科技,整合了傳統人文學與社會科學的方法論;同時,結合電腦運算所提供的工具,如數位媒體、資料視覺化、資訊檢索、統計學、文本探勘、數位製圖與數位出版等,成為理解社會文化現象的一種路徑。但必須說明的是,數位人文學仍為一個動態的、發展中的學科,隨著新技術的出現而更迭其發展模式。 因此,從資料的收集、分析到呈現,數位文獻與電腦網路的應用已是不可或缺的一環。數位技術的應用,能夠更有效率地收集與整合研究材料;用新的方法切入既有的研究問題、發現新的現象、開展新的研究方向;或是促進跨領域研究、同儕交流、以及研究成果的呈現與擴散。因此,以「運用資訊科技提昇人文研究」為核心關懷的「數位人文學」日趨重要,如何更有系統、更有效率地運用數位技術於人文研究領域,並評估其衝擊與影響,需要人文學者積極地探索與回應。本課程引介數位人文學的發展現況,並說明其方法及運用的可能性。

修課條件

 先修課程:如果你是東亞系同學,請至少修過一種「統計學相關課程」後選修。如果你是其他系所同學,請至少修過一門「統計學或程式語言」相關課程後選修,或請與老師面談後選修。

授課方式

課堂教學+小組討論 (佔總授課時數 1/3 以上)

成績評量方式

 小考30%

期末報告70%

教學進度

 數位人文研究之精神在於,使用各種數位工具對人文經典或現今社會現象做研究,將幫助於研究者能理解大量典籍之意義,並為未來更進一步之深入理解打下基礎。諸如詞頻分析(word frequency analysis)、共現詞研究(co-word research)、主題分析(topics analysis)等等觀念。 因此本課程將教導修課學員使用前述方式,對已有或特定未領域之文獻做出分析。本課程將直接使用數位工具,教學時使用R 語言,但同學亦可使用自身熟悉之程式語言。課程要求方面,使用「問題解決教學」(Problem-Solving Teaching)、做中學(doing by learning)鼓勵學員就既有熟悉資料以數位方式做出輔助分析,再配合自身專業學養做出解釋。

單元 1   數位人文課程概論

參考書目

 參考書目 李仁鐘,R語言資料分析:從機器學習、資料探勘、文字探勘到巨量資料分析 [第二版](台北:松崗,2017)
Jim Georges, Jeff Thompson and Chip Wells, “AppliedAnalytics Using SAS Enterprise Mining,” (California: SAS, 2010)
簡禎富, 許嘉裕,《資料挖礦與大數據分析》(台北:前程文化,2014)
邵軒磊,〈政治模擬研究法初探:以戰略三角理論之檢証為例〉,《全球政治評論》,第53期,2016年1月,頁153-174。
邵軒磊,《關係平衡理論與資料庫實證初探--回顧釣魚臺事件之中日互動》,《東亞研究」,47卷1期,2016年1月,頁1-37。
項潔編,《數位人文:在過去、現在和未來之間》,翁稷安,Tani Barlow,鄭文惠等著,(台北:台大,2016年)
黃詩淳、邵軒磊(forthcoming),酌定子女親權之重要因素:以決策樹方法分析相關裁判,台大法學論叢。(TSSCI)
邵軒磊、曾元顯(forthcoming),文字探勘技術輔助主題分析—以『中國大陸研究』期刊為例,問題與研究。(TSSCI)
黃詩淳、邵軒磊(2017年11月),運用機器學習預測法院裁判──法資訊學之實踐,月旦法學雜誌,270期,頁86-96。