《中国文档名词发展演变史》特色鲜明,系统梳理了从先秦至民国文档名词的发展脉络,运用计量语言学等方法深入研究,以大量文献为依据,详细阐述各时期特点及影响因素,兼具学术性与可读性,是档案学、语言学等领域研究的重要参考书籍。
本书是一部具有较高学术价值的专著。本书系统梳理了中国文档名词从先秦至民国的发展脉络,详细阐述了各时期文档名词的演变历程,对了解中国文化传承与发展意义重大。作者运用计量语言学等方法,通过大量文献检索与数据分析,深入探究文档名词的起源、发展规律,以及政治、文化等因素对其的影响,使读者能清晰把握其发展轨迹。书中不仅对常见文档名词进行解读,还对一些易混淆或鲜为人知的名词进行辨析,为档案学、语言学等领域的研究提供了重要参考。无论是专业研究者还是对历史文化感兴趣的读者,都能从本书中获得对中国文档名词及相关历史文化的深刻认识,是一部不可多得的佳作。
专业语言的历史实证研究(代序)
本书是笔者主持的国家社科基金一般项目中国文档名词发展演变史(14BTQ071)的最终成果。
一、研究对象
名词,是人对特定的客观事物的符号性表述。这种表述(名称)是人们在认识世界、理解世界的活动过程中获得的,其对象是那些具有独立特征的某一个或存在共性的某一类事物。这个名称确立后,会在人类认识发展过程中得到不断的修正与完善。名词的产生与发展,表面上是语言问题,而本质上是人类思想认识问题。词汇,不仅仅是语言,更是一种概念、一种思想。对它们的研究,是构建人类思想史、认识史的一个重要方面。
专业语言,对于一个专业领域而言具有极其重要的意义。普通人也说文书和档案,但那只是一种一般意义上的名称,不是一种专业的概念认识。他们在说这些名词时,没有专业研究员头脑中的那些丰富、精确的概念认识。作为概念的专业名词,它是建立在通晓专业历史和成就的基础上的。非专业地使用名词与专业地使用概念,是非专业与真专业的明显区别。
作为专业的研究者,我们的确要比非专业人士对专业名词了解得更多。但
这就够了吗?黑格尔说,人们对自己经常挂在嘴边的名词往往是最无知的。虽
然作为研究者,我们对本专业的这些名词比普通人了解得多一些。但如果认真
推敲起来,说起这些名词的来源、演化,我们大多知之不详、知之不确。这种
无知,会使我们的专业性受到质疑,会使我们学科的成熟性受到质疑。专业语
言的成熟,从来都是专业成熟的显著标志之一。
关于文档名词的研究,是文书术语学、档案术语学、文书史、档案史等学科重要的基础性的组成部分。在古代汉语中,人们对文书和档案这两种事物的认知区分还不是十分清晰,反映为名称上的区分也不是很明显,同一个名词常常兼具文书和档案两方面的含义,它们之间联系紧密。历史时代越早,这种情形就越明显。基于此,本书将两者作为共同的研究对象,即我们研究的是文档名词,而不只是档案名词或文书名词。当然,由于现代社会名词的专业化程度大大提高,我们就改为以档案名词为主了。
在语言学中,研究某一专业或行业语言的部分,被称为专业或行业语言学。在专业语言学中,语音与语法不是研究的重点,词汇是它们的主要研究对象。而专业词汇又以名词为主,这是本书以文档语言中的名词作为研究对象的主要原因。
名词是由词素构成的,据此,我们将具有同一词素(根词)的名词归为一类,称为名词族类,这是一种词汇聚类研究方法在文档名词研究中的应用。具体而言,我们从文档语言的特殊性出发,在文档族类特征方面,归纳出以下族类文档名词:文族书族案族簿族籍族册族卷族牍族典族图族档族等。这些族类将文档名词划分为组或群,以一个群组为研究对象,即按照文档名词整体文档名词族类文档名词个体的研究路径展开,可以帮助我们更好地从整体到个体分析文档名词的词义与使用情况。
此外,文档名词族类中的很多名词往往可以分属两个不同族类,即构成该词的两个词素分属两个不同的族类,如案牍案卷文案等,它们既都属于案族文档名词,也分别属于牍族卷族文族文档名词。
在统计时,这些交叉的名词我们在不同的族类中皆纳入统计范畴,不在整体中加以剔除,以保持各族类本身的完整性。但在具体论述时会有所侧重、取舍,尽量避免较多的交叉与重复。
多数情况下,一个名词会具有多个义项。而这些义项往往并不都是指代文档类事物的,也会包含其他事物或概念,而本书中所研讨的主要是该名词的文档类含义和用法。如文字一词,《汉语大词典》中有3个义项、6种含义,在大多数情况下它是指记录语言的书写符号,古汉语中多指单字。比较这6种含义,仅有公文;案卷指奏疏或札子属于文档名词的范畴,即文字一词仅在这两种用法中指代文书档案类事物,因此检索结果和统计数据均在这两种用法(文档含义)的范畴内筛选和计算,即一般只统计其文档含义的部分,以确保数据的准确性和可靠性,避免含义混淆、数据泛化。
本书的选词范围较大,总数多达200余个。在名词范围上达到了前所未有的水平,具有较高的全面性。如文族名词就包括文、文卷、策文、公文、文典、文字、文告、文凭、文契、文墨、文款、文疏、文牒、文榜、文诰、文翰、文历、文学、文验、文解、文稿、文檄、文引、文札、文示、文表、文帖、文券、文状、文奏、文按、文计、文约、文记、文帐、文移、文符、文献、文证、书文、文书、文案、文牍、册文、文册、典文、图文、文簿、中古文、架阁文字、架阁文书等51个文档名词。
当然,即使达到如此之大的选词范围,但在浩瀚的词汇海洋面前,遗漏仍然是难免的,有待我们继续挖掘。
- 主要基于数据库文献之检索、分析的较大数据量抽样统计法
本书采用了计量语言学的方法进行历史语言学的研究。它需要两个重要前提:第一,历史上连续的文献遗存。对于古代语言,特别是文档语言(具有明显的书面语言特点),我们主要从各个时期的书面文献来考察。如果文献是断断续续的,数量很少,就难以达到较好的效果。在这一点上,我们要感谢我们伟大的祖先,从商代开始,就给我们留下了大量的连续的文献资料,不但经史子集汗牛充栋,小说、笔记也数不胜数。这是本书开展研究的必要条件之一。第二,数据库的建设与运用。我们进行了大数据量的统计工作,如果没有网络数据库这样的工具,手工完成是很困难的,甚至说是不可能完成的。
尽管本书的数据量很大,但使用的仍是抽样统计法,即在从全部研究对象(古代文献)中抽取一部分对象(笔者当时所能查到的全部数据库文献及部分纸质文献)进行调查并取得资料的基础上,运用数理统计的原理,对整体做出数量上的估计判断,从而对认识对象得出大致结论。抽样法也叫取样法,统计学中称为抽样推断法,是统计方法在社会科学领域的应用。这种统计工作,成功与否、效果如何主要取决于研究人员对统计样本的选择。本书主要采用整群抽样法,即古代以《国学宝典数据库》《爱如生中国基本古籍数据库》所收全部古籍文献等为统计对象,现代则以年鉴数据库为统计对象,对这些群体对象进行调查统计,以期获得较佳的结果数据。
本书所进行的检索统计,样本主要来源于《国学宝典数据库》、《爱如生中国基本古籍数据库》(2016年年底)和《四库全书数据库》(2016年)所包含的书籍及一些特殊文献(如甲骨文汇编、金文汇编等),并参考了读秀等中文数据库。在古文献样本选择上,我们首先选择了《国学宝典数据库》,因为它是目前国内数据量较大、检索较便利的数据库。但这个数据库有一些缺点,如部分文献时代归属不准确、内容有错误、部分重要文献缺失等。所以我们采取了一些补救措施,如:在文献年代归属上,我们都在进行研究后确认或订正;在内容上,我们逐一对照权威纸本或纸本的扫描电子版,并以纸本作为参考文献注释的依据;在重要文献缺失问题上,如甲骨文献、金文文献、《清实录》等,我们就不能单纯依赖该数据库了,通过其他数据库(如《爱如生中国基本古籍数据库》、《四库全书数据库》、读秀等)和纸本文献来弥补。
…………