厦门大学:哈佛大学东亚系德龙博士来我校举办数字人文工作坊
1月15日,应我校图书馆馆长萧德洪邀请,哈佛大学东亚语言学系、费正清中国研究中心德龙(Donald James Sturgeon)博士来我校开设“数字人文工作坊”。德龙博士介绍了中文历代文献的大规模文字识别、中文文献写作年份机器学习辨析以及和前现代中文文献语料库之间关联的自动分析方法,尤其在古文字的认读辨析、版本的考证、比较和相关关系的揭示等方面的个人研究成果。
近年来,数据交互与数据可视化等技术已成为人文社会科学领域学者的学术工具,正在形成新型的数字学术研究范式。数字化技术在古典研究领域应用已经从单一的数据库建设向文本分析、数据挖掘、可视化、图形图像分析、深度学习等文本辨析和内容分析的方向深入发展。数字学术工具为研究者提供古代文献研究与分析的新方法,使研究者具备探索发现新知识的能力,也获得更多以往未曾发现知识的脉络与相互关联。但使用这些分析方法时,特别是在数字工具的应用方面,人文学者往往面临着技术性的挑战。
德龙博士同时也是“中国哲学书电子化计划”(http://ctext.org)项目的创建者和维护者。中国哲学书电子化计划是个在线开放电子图书馆,为中外学者提供丰富的中国历代传世文献,收藏的文本已超过2500多万页影像资料,50亿字全文文本,包含了哈佛大学哈佛燕京图书馆藏的3万余种古籍线装图书,是在线古典文献最丰富数据库之一。原典资料库包括先秦两汉时期儒家、墨家、道家、法家、名家、兵家、算书、杂家、史书、经典文献、字书、医学以及出土文献等各种原文资料,同时提供康熙字典、现代汉语大词典以及相关英译文献对照、CTP字典、底本扫描版以及相似段落等内容。
工作坊历时一天,上下午共6小时,图书馆技术、特藏馆员、以及人文学院、新闻传播学院师生参加了此次活动。上午德龙在经济学院计量经济学实验室(经济分馆二楼)讲解并演示如何通过“中国哲学书电子化计划”平台及相关研究工具获取全文,进行文本相似、差异和关联分析以及各种结果的可视化展示。下午在图书馆二楼会议室与图书馆馆员们座谈特藏数字化以及数字应用等技术细节。工作坊现场互动热烈,参会人员与德龙博士展开了激烈的讨论。
(图书馆)
责任编辑:黄伟彬
本站(www.100xue.net)部分图文转自网络,刊登本文仅为传播信息之用,绝不代表赞同其观点或担保其真实性。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系(底部邮箱),我们将及时更正、删除,谢谢