【106-2】數位人文專題

Topics on Digital Humanities

祝平次 (清華大學)

近二三十年來,數位科技的進步大大促進了各種不同知識學門在研究上的可能性。由於電腦比對、計算能力可以快速地處理大量資料,使得之前很多光靠人力難以進行的研究議題 ,可以藉著電腦來完成。在這一波新的...

Ch 1. 課程介紹 /  祝平次
Ch 2. 心智圖軟體 /  祝平次
Ch 3. 標記語言(一):認識網頁 /  祝平次
Ch 4. NotePad++:示範與實做 /  祝平次
Ch 5. CText.org與數位分析工具 /  祝平次
Ch 6. CBDB說明與練習 /  祝平次
Ch 7. Corpro庫博語料庫分析工具 /  闕河嘉
Ch 8. 標記語言(二):TEI/XML /  洪振洲
Ch 9. 標記語言(二):MARKUS /  祝平次

計畫主持人資訊

姓 名 祝平次
電子信箱 dh@ptc.cl.nthu.edu.tw
電 話 (03)574-2742
服務學校 國立清華大學
系所單位 中國文學系
職 稱 副教授

教師簡介

姓 名 祝平次
現 職 國立清華大學中國文學系副教授
E-Mail dh@ptc.cl.nthu.edu.tw
個人網頁 http://tinyurl.com/pingtzuchu
連絡電話 (03)574-2742

最高學歷

美國哈佛大學東亞語言文化博士

研究專長

宋明理學

儒家倫理學

數位人文

近年研究主題

宋明理學

儒家倫理學

數位人文

教師簡介

姓 名 闕河嘉
現 職 國立臺灣大學生物產業傳播暨發展學系副教授
E-Mail hchueh@ntu.edu.tw
連絡電話 (02)3366-4416

最高學歷

紐西蘭奧克蘭大學教育博士

研究專長

鄉村研究

文化研究

後結構主義

近年研究主題

傳播學

鄉村研究

傳播理論

文化研究

文化與生活哲學

教師簡介

姓 名 洪振洲
現 職 法鼓文理學院佛教學系副教授兼任圖書資訊館館長.
E-Mail jenjou.hung@dila.edu.tw
個人網頁 http://joeyhung.info
連絡電話 (02)2498-0707

最高學歷

國立臺灣科技大學資訊管理研究所博士

研究專長

數位文獻分析

佛學數位典藏

資料庫

近年研究主題

佛學資訊技術與工具

關聯式資料庫管理實務

腳本語言

中文課程名稱: 【106-2】數位人文專題
英文課程名稱: Topics on Digital Humanities
教師姓名: 祝平次
闕河嘉
洪振洲
開課學校/系所: 清華大學
開課學期: 1062
學分數: 3 學分
課程關鍵字: 心智圖
文本標記
Notepad++
CText
CBDB
TEI
MARKUS
課程領域: 人文學
課程階層: 基礎
應用數位技術/工具:

心智圖軟體、Hyper Text Markup Language、NotePad++、Excel、CText.org線上平台、China Biographical Database、Corpro庫博中文語料庫分析工具、TEI/XML、MARKUS

課程概述

近二三十年來,數位科技的進步大大促進了各種不同知識學門在研究上的可能性。由於電腦比對、計算能力可以快速地處理大量資料,使得之前很多光靠人力難以進行的研究議題 ,可以藉著電腦來完成。在這一波新的數位工具風潮中,台灣人文學科的跟進並沒有比較慢,但在研究工具的開發上則比較遲緩,直到近十年,所謂的數位人文才越來越興盛。本課程的目的,在於讓沒有從事數位人文學習的修課同學有初步的體驗,了解文字、數字、表格和圖表之間的轉換;利用資料庫(CBDB,China Biographical Database,中國歷代人物傳記資料庫)來進行資料整理。前面的一個重點,在於文本分析;後面的一個重點,則在於簡單地理資訊系統(Geographical Information System, GIS)的使用。修習完本課程的同學,可以建立自己的全文檢索、進行初步的文本分析,並將分析結果轉換成數字與圖表,以視覺化分析結果。CBDB的使用,則可以將空間的思考帶入人文學的學習中,立體化文字資料與空間則可以將空間的思考帶入人文學的學習中,立體化文字資料與空間的關係,並且可以和田野調查與圖片結合。藉由數位工具進行人文學的探勘,我們可以快速地掌握一本書、或幾本書的大致外貌;也可以將由這樣的初步的處理,再進一步把相關的文獻快速地檢索出來,進行更細緻的閱讀。

教學目標

本課程定位為初階數位人文課程,而計畫基礎課程的目標,是讓學生具備使用新型數位工具及處理巨量資料的能力,抑或具備對大數據進行語意分析的能力,此皆本課程教學目標建構的關懷所在。為使課程內容與時俱進,消弭可能的學用落差,本課程在前述關懷之下,設立了解標記語言、進行文本分析、學習使用關聯式資料庫的三個大方向。目標在於讓沒有從事數位人文學習的修課同學有初步的體驗,了解標記語言,進行文本分析,並學習使用關聯式資料庫的資源。

 

修課條件

本課程在電腦教室進行,基本上每個單元,會以教師說明、示範,然後同學實做的順序進行。

 

授課方式

課堂教學

成績評量方式

平時成績(50%):含課堂報告、討論、期中測試。
期末報告(50%):含期末發表及書面報告。

教學進度

(一)課程介紹
將快速瀏覽這學期會用到數位工具,也會介紹一些其它人文學科常用到的數位工具,具體地讓修課同學了解數位人文的可能性。
(二)心智圖軟體:示範、說明與實做
心智圖裏面蘊涵了分析、綜合的兩種研究方式,幫助我們對於所要分析、論述的課題有種全景式的掌握,對於研究議題的腦力激盪、議題整理都很有幫助。
(三)標記語言(一):認識網頁的真相。
標記語言,是目前處理數位資料幾種最常用的方式之一,一方面讓同學對網頁的超文本格式(Hyper Text Markup Language, HTML)有一基本的認識,一方面也藉由實做,讓同學了解網頁連結的機制。
(四)NotePad++:說明、示範與實做
Notepad++是款非常受歡迎的文字編輯軟體,我們將利用它來學會清理數位文本的能力,以便進行進階的文本分析,並且進而利用Excel來統計分析處理過後的資料。
(五)CText.org線上平台與數位分析工具
利用CText.org來統計、分析資料,並將統計分析的結果視覺化為圖表或網絡關係,完成從文字到數字、表格與圖表的轉換。
(六)CBDB說明與示範、練習與測試
CBDB (China Biographical Database,中國歷代人物傳記資料庫)可以進行集體傳記學、地理空間、社會網絡等不同型態的研究。一方面要藉著CBDB了解關聯式資料庫的原理,一方面也要熟悉CBDB的基本操作。
(七)Corpro庫博中文語料庫分析工具。(闕河嘉)
臺灣大學闕河嘉老師將介紹她利用文本分析所做出來的研究例,以讓同學了解文本分析在現今社會可能的研究對象。庫博具有很多為台灣客製化的功能,比起AntConc更適合在台灣的同學使用。
(八)標記語言(二):TEI/XML(洪振洲)
此將檢視做為網路資料庫最常見的可擴展標記語言(eXensible Markup Language, XML)中的一種西方人文學科標準 TEI(Text Encoding Initiative)。將請到長期主持法鼓山中華電子佛典 CBETA 標記的洪振洲老師來講解 TEI 。
(九)標記語言(二):TEI/XML的實做與MARKUS
將藉由oXygen Editor的編輯軟體來實做一個TEI檔案。並且利用荷蘭萊頓大學所開發的MARKUS來進行半自動的文本標記。