12月15日下午,我校2016年终身教授学术报告会第17场在中文系特藏室举行。会上,中文系刘志基教授围绕“数据库文字学刍议”一题进行了探讨,上海师范大学徐时仪教授应邀对本次报告进行点评。
在会议之初,刘志基教授分析了当前海内外文字类数据库的发展现状,并结合自身操作经验对“数据库文字学”这一术语做出了概念界定,即“以贮存文字资料的数据库为基础,运用数字化处理手段的文字学研究。”在概念界定的基础上,刘教授进一步阐述了“数据库文字学”和传统“语料库语言学”的区别,并引证唐兰先生的观点,指出“中国‘文字学’的研究对象并不附属于语言学,文字形体的研究应该成为独立的学科。”
紧接着,刘教授就“数据库文字学”的可行性问题发表了独到的见解。首先,刘教授以西周金文“寶”字为例,来说明目前技术层面字符集的缺位现象及其解决方案。其次,刘教授分析了学术因素,即释读问题,对“数据库文字学”的影响,并将文字材料释读障碍的内容分为字的归属不明、词的归属不明以及用法不明三个层次。
刘志基教授秉持着“文字学应与时俱进”的思想,认为数据库文字学对传统文字学具有补缺意义,是传统文字学在数字化环境中发展处来的一个分支。二者虽紧密相连,但在研究材料的存在形式和资料可利用度上仍有较大差异。刘先生指出,相较于自然物载体形式的资料,数字化提升了传统材料的有用性,使之转化成了一种新材料,这对于提升文字研究的严密性和科学性大有裨益。
利用数据库进行文字研究已经取得了一定的成绩,但在“数据库文字学”的数据库建设方面仍有几个问题需要注意,刘志基教授对此发表了自己的看法:首先,必须收入历代文字资料的真实本体,而非后世转写的通用字形;其次,文字数据库的建设必须由较高文字材料释读能力的文字研究者直接参与,有较高的专业知识和能力来鉴别;再次,必须解决电脑字符集的缺口问题。
在会议后半段,刘教授和大家一起讨论了“数据库文字学研究得学术品质追求”问题。刘教授提倡要以问题来主导数据,成功的数据库文字学研究不仅是基于数据库资源来进行文字研究,而且必须是根据研究需要来建设数据库。此外,数据库不仅仅是研究方法的更新,更应当带给使用者以新的思路,使研究者的思维不再受限于传统的纸笔操作,要让大数据成为新思路的孵化器。
在刘志基教授精彩的学术报告之后,徐时仪教授回忆起求学时以“卡片箱”为载体的资料整理,并对此感慨颇深。徐教授在充分肯定数据库语言学巨大学术价值的基础上,劝诫在座的同学们要充分利用时代的优势,利用海量的大数据为自己的研究找到尽量多的原生材料,形成自己的思路和方法。
讲座结束后,刘志基教授耐心解答了同学们的问题。