作者张涛尹小林分别系北京师范大学中国易学文化研究院院长首都师范大学电子文献研究所所长
周易是中国最古老的文化经典随着其思想体系的不断拓展社会价值的不断发掘逐渐形成了博大深邃的易学文化而在我国不同历史时期涌现出来的卷帙浩繁汗牛充栋的易学古籍成为中华优秀传统文化演进发展的重要载体也成为中华民族精神和智慧的集中体现目前国学发展已经进入大数据时代如何把传统易学古籍与现代信息技术结合起来开展好易学古籍数据库建设将是我们面临的一个重大学术课题
收集整理易学典籍夯实数据库基础
作为一项浩大的文化工程易学古籍数据库建设应当以易学古籍的收集整理和编纂为前提和重要基础
我国历代学人非常重视对卷帙浩繁的易学文献进行整理编纂从最早的官修书目别录七略到汉书艺文志隋书经籍志等史志目录等从中都体现了易学文献整理编纂的重要成果及至清代乾隆年间开四库馆编纂四库全书易学典籍作为群经之首位列开篇而且数量也是所有分类中最多的阮元主持编纂清经解进一步总结了清代易学的研究成果王先谦编纂清经解续编续收清代学者经学著作209种涉及胡渭惠栋张惠言俞樾等十数家易说完整地展现出清代易学研究的全貌20世纪20至40年代推出的续修四库全书总目提要是现存规模最大的文献解题目录亦涉及大量易学典籍
周易注疏资料图片
近年来随着文化事业的发展新的易学古籍整理和编纂工程不断涌现北京师范大学中国易学文化研究院分别于2013年2018年推出的中国易学文献集成68册和中国易学文献集成续编70册共计138册不仅网罗了各时期代表性的易学著作而且首选善本为底本为易学古籍的整理编纂起到了重要的示范作用与此同时北京师范大学中国易学文化研究院又与国学网首都师范大学电子文献研究所联合承担中华易学全书项目以文渊阁四库全书经部易类典籍为基础整理易学典籍183种1839卷共3500余万字并制作2000余幅矢量易图被已故著名学者余敦康先生誉为易藏同一时期在学术研究机构和专门技术公司的共同推动下我国陆续出现的各类古籍数据库均不同程度地收录有易学古籍传统易学古籍与现代信息技术相结合的趋势开始出现并获得初步发展
虽然近年来易学古籍的整理编纂工作不断取得新成就但还存在许多有待改进之处一方面以往的易学古籍整理大多属于传统类型的典籍汇编缺乏与现代信息技术的紧密结合另一方面现有各类古籍数据库所收录的易学古籍由于受到分类法的限制尚未实现优化整合比如雕龙古籍数据库有四部丛刊四部备要雕龙四库全书等子库却没有单独的易学分类同时各数据库收录的古籍版本相对比较单一对各种版本尤其是海外珍本鲜少涉及包括日本足利学校所藏南宋初年刊本周易注疏等整体而言现有古籍数据库尚存在资料不够完备零散不成系统内容未能精细化文本未能精准化等问题因此在新时代易学古籍数据库建设是一项亟须开展的学术课题和文化工程
确立数据库主体框架推动易学数字化
易学古籍数据库是顺应信息化技术发展需要服务于易学研究及中华优秀传统文化研究的重要平台主要目标是开发通用的统一查询辅助分析易学文献的综合管理和应用系统以便快捷地进行数据和文献资料的查询下载等工作在我们看来易学古籍数据库的建设应当以古籍系统化数字化的学术理念为推手从传统文献学和数字文献学相互融合相得益彰的角度展开需要收集整理易学古籍文献运用先进技术将其转化为数字化资源逐步建设数据库最后还要校对数据库文本的精确性完成数据库的检查和验收工作具体来说其主体框架可以概括为一条主线两大环节和三个要点
一条主线是以易学古籍数据库为中心系统收集整理易学古籍并采用先进的数据信息技术将之转化为数字化资源建立科学全面准确的易学古籍数据库
两个环节是指建设易学古籍录入文本和影像文本录入文本是由人工输入计算机的易学古籍全文影像文本则是采用现代技术工具真实呈现的易学古籍原貌
三个要点是指数据库技术系统的三大方面即数据存储系统数据分析系统和平台管理系统
数据存储系统作为数据库的上层系统数据分析共享的支撑系统是整个数据库的核心组成部分能够满足对结构化数据非结构化数据和半结构化数据统一存储和查询的需求便于实现查询的高效性和存储的安全性
数据分析系统利用分布式存储和并行计算框架结合多种分布式计算引擎对各类结构化半结构化及非结构化的信息资源进行快速的分布式计算并提供基于关联聚类分类预测等类算法库以及可视化组件拖拽式的数据挖掘分析开发工具包既可提供易学古籍查阅与研究的深度挖掘和分析服务也可提供数据资源管理目录管理组织人员管理用户权限数据接入和共享服务运行监控及平台运维等功能
平台管理系统是围绕文本PDF图片音视频等多种格式资源的持久化存储数据库设计相关分类及元数据结构以便为系统地查询检索在线使用以及持续扩展等业务提供基础支持这些都是非常重要的
整合易学书目版本系统构建子数据库
关于易学古籍数据库建设的具体内容和步骤方法不同学者或许会有不同看法见仁见智我们认为这一数据库至少应该包括易学古籍书目数据库易学古籍全文数据库易学古籍版本数据库作为三个二级子目录即子数据库统一于易学古籍数据库这一母数据库中
易学古籍书目数据库是收录历史上出现的所有易学著作和篇章的数据库具体的建设步骤应该分为两个方面一是对易学古籍的编目需要对历代相关史志目录和官修私修目录以及近数十年来整理出版的出土易学文献和国内外馆藏易学古籍资料进行全面收集系统编目注明版本馆藏编纂出高水平高质量的易学古籍书目并撰成历代易学古籍书目二是充分借鉴吸收中外建设数据库的成功案例和优秀经验运用先进的数据库技术将其转化为数字文字图形图像声音等数据形式并存储于计算机内成为由计算机操控能够有效共享的数字化资源推进易学研究的现代化
易学古籍全文数据库是著录易学古籍全文内容的数据库建设的重点是需要以现存易学古籍的文本为对象参考著名学者的校释研究成果对已有标点的古籍文本进行重检对无标点的古籍文本则运用先进的数据信息处理技术自动标点再辅之以人工重检纠正误差最后产生古籍点校本统一由人工输入计算机形成数据库以供使用者进行检索阅览考虑到全文数据库应用的广泛性该数据库还应当具备丰富的检索方式包括标题检索全文检索分类检索专书检索高级检索等全文检索数据库需要在书目检索数据库的元数据基础上添加古籍内容及其与古籍的对应关系能够让使用者对检索结果进行准确定位或对比直接了解古籍内容
易学古籍版本数据库是囊括现存易学古籍各种不同版本的数据库版本学是以各类古籍的抄本批校本稿本和印本等为研究对象的学科易学著作的不同版本有着不同的历史和价值对修缮古籍考辨真伪具有重要作用建设易学古籍版本数据库需要尽可能全面地收集整理现存易学古籍的所有版本包括国内外高校图书馆博物馆等单位以及科研机构收藏的传世易学古籍以及载录于甲骨金石简帛等不同载体的易学出土文献并转化为数字化资源为使用者提供包括封面序跋插图版本版式藏书印批校题跋等古籍版本信息真实呈现易学古籍原貌满足读者和研究者不同的阅读体验和学术需求
打破时空限制深化易学研究与保护
新时代的易学古籍数据库将建成最具综合性系统性的易学古籍总汇建成最具专业性权威性的一流数据库其学术价值和现实意义尤为突出
数据库对易学古籍的系统梳理和完整呈现尤其是数据库所具有的共享性为学者提供了便捷的检索和阅览服务打破了获取资源的时空限制即便在不同地区和不同单位都能够便捷地获取分布于全球的易学古籍资源有效地提高工作效率最大限度地推动易学研究的深化和拓展同时易学古籍数据库的建设既需要易学古籍整理领域与数据库建设领域的通力合作也需要积极整合学术界多学科多方面的资源和力量随着中华文化的广泛传播易学古籍数据库的建设有助于在当代易学研究中树立和把握全球意识国际视野从而在与国外学术界互学互鉴互动的过程中促进易学研究的进一步发展和传播推动中华文化更好地走出去
随着信息技术的不断革新发展建设中文古籍类数据库的技术已经在自动比对自动标点自动排版等方面取得突破性进展但如何实现影像文本向录入文本的精准高效转化实现列表视图和提要视图的随时切换实现从研读批注到下载打印的一站式完成凡此种种依然是有待攻克的重大难题而且考虑到易学古籍文献会由于文物出土等因素而不断丰富已完成的古籍数字化体系在吸纳现有数字对象的基础上还需要不断补充新的研究资讯和成果即该体系应是动态的可灵活扩展的如何在技术层面有效地实现这一点也是我们应该思考的重要问题易学古籍数据库建设为这些新技术的探索和研发提供了契机和平台有助于实现数据库建设技术的新突破确立数据库的典型范例
古籍是人类智慧的结晶却屡因战乱火烧水浸虫蛀鼠咬等破坏而残缺亡佚古人采取的对策是抄写备份分开保存其中四库全书被分藏于全国七座藏书阁就是一例相比之下古籍数字化在保护古籍方面无疑具有得天独厚的优越性利用现代信息技术对古籍文献进行加工处理使古籍转化为电子数据形式通过网络光盘等介质传播使其彻底免于各种灾厄而永续保存可谓功在当代利在千秋在这一方面易学古籍数据库建设将会是一个成功案例
总之在新时代在易学研究更加综合更具全球视野更注重现代转化和创新发展的当下易学古籍数据库不仅是对以往易学文化成果所作的一次系统全面的总结和梳理而且也会在研究思路学科布局研究方法基本框架主要内容等方面有所创获我们相信以此为契机和平台今后易学研究的开展将获得更加坚实的文献资料基础并获得人工智能互联网大数据等现代信息技术手段的支持和支撑而这将有助于相关的学科建设和学术发展有助于中华优秀传统文化的进一步传承弘扬和发展
光明日报2019年12月14日11版