国家社科基金重大项目“基于公共数据库的古文字字符集标准研制”开题论证会顺利举行

发布时间:2022-04-10浏览次数:428

2022326日下午13:00-16:00,教育部人文社科重点研究基地中国文字研究与应用中心召开国家社科基金重大项目“基于公共数据库的古文字字符集标准研制”(项目批准号:21&ZD309)线上开题论证会。

开题论证会专家组由中国古文字学会会长、吉林大学副校长吴振武教授、郑州大学汉字文明研究中心主任李运富教授、复旦大学人文社会科学数据研究所东亚语言数据研究中心负责人潘悟云教授、中山大学南中国海考古研究中心主任许永杰教授、华东师范大学中国文字研究与应用中心主任臧克和教授和华东师范大学数据科学与工程学院高级工程师陈优广副教授共六位专家组成,吴振武教授任专家组组长。项目首席专家刘志基教授,子课题负责人董莲池教授、白于蓝教授、张再兴教授、雷黎明教授、赵宇明副教授、汤志彪副教授及项目主要成员共三十余人参会。

开题论证会由专家组长吴振武教授主持,依次完成了项目首席专家刘志基教授作开题报告、专家提问建议、课题组回应专家组的意见等程序。

首先,项目首席专家刘志基教授作开题报告,从项目研究的目标和任务、成果形式、研发方略等方面介绍项目的前期工作基础和未来开展规划。本课题的研究目标,是在当下电脑字符集国际标准的框架内,研制一种可以由一个古文字公共数据库的实际应用来验证的,具体实现隶变前先秦古文字的每一个在构形上具有数字化处理存在意义(即精准概括了实际文献中所有同类字形)的字符(含整字、偏旁;楷字、原形)与当今国际标准字符集编码系统中某个唯一码位相对应的标准。与之相应,本课题需要完成两项工作:一是提交上述古文字编码字符标准的文本;二是研发由这一标准支持的古文字公共数据库。为完成上述研究目标,研究方略抓两个重点:一是学术为本。二是新技术保驾。

之后,与会专家对课题进行了评议,提出了诸多极具参考性的问题和建议。

李运富教授指出该项目是一个宏大工程,学术界十分需要,成果可为学术界提供很大的方便,并提出几个问题和建议。包括:一是古文字字符集的编码确定,需要在理论上有清晰的说明,字样的选取规则应详细告知使用者。异构字的选择比较容易,异写字就比较复杂,需要说明清楚。二是编码空间有限的问题应该如何解决?字符编码是平面呈现还是分层呈现?可以考虑分层实现,解决码位不够问题。三是编码如何检索,以提高字库的检索效率。

陈优广教授从计算机技术角度指出,项目工作很复杂,应做好顶层设计,功能如何设计;项目整理的工作量很大,字符的各种对应、统计出现频度、上下文的关系等等,都可考虑技术介入以提升效率。

潘悟云教授指出,华东师大的古文字研究很有特点,注重字位。这个项目要注重字位与字位变体。并提出问题,集外字如果放在GBK,码位会不够,不够的话,如何去申请?如果自己确定码位,当然可以,但是各家会不兼容。建议采用“字位”方案提高整理效率,没有字位的码位要去申请。

许永杰教授提出,以往古文字编码未在国际标准化组织中通过,项目的成果是否有可能被通过?其次,多字体方案,分文献类型,原形与楷体,能不能便利使用和管理?另外,不受限编码的使用,能不能通过合理管理,得到高效的使用。

臧克和教授指出该项目具有连续性,并提出几点建议供项目组参考。一是古文字材料的字形都是个性化的,因人而异,字符集要求则是抽象的需要统一的,因此具有非常大的矛盾。二是古文字字符集编码数量很多,编码空间是不是足够容纳?三是字符集和数据库是密切关联的,数据库建设的核心内容就是字符集的问题,需要处理好二者的关系,加以平衡。

吴振武教授提出该项目会面临一些复杂的问题,首先是古文字材料多样,每个个体都不一样,如何统一。再如古文字隶定问题,有些构形不能隶定,有些隶定怎么与现代文字对应,也是问题。古文字国际编码这件事,很多人都想做,但是目前都不成功。非常希望项目团队能够在以往积累的基础上,较好地完成这个项目,加惠社会。

对于专家组提出的问题和建议,课题组进行了积极回应。最后,臧克和教授作总结发言,感谢各位专家为项目开展提出诸多中肯的建议,希望课题组严格落实此次开题论证会的调整方案,争取按时高质地完成项目。至此,开题论证会圆满结束。