简体版 / 繁體版 正在载入当前时间...

平台影响/王贺:从“研究资料集”到“专题数据库”
2020-07-08 09:50:19  来源:抗战文献数据平台  点击:  复制链接

  编者按

  本平台上线以后,受到学界的广泛关注,今天推送的是上海师范大学青年研究员王贺老师前不久在《苏州教育学院学报》发表的《从“研究资料集”到“专题数据库”》。这篇文章对本平台高度肯定,我们十分感谢,以后一定再接再厉,不辜负大家的期望。

  感谢作者与刊物授权我们推送此文。

  “研究资料集”是常见的一种学术著作,但由于长期以来不被视为“著述”“学问”,也未被纳入传统的“文献学”“史料学”研究范畴,故其编纂历史及实践未能被很好地予以总结、批判,然其搜集、整理、编辑至出版的整个流程,均有不少值得注意的问题,有必要专门探讨。而其未来进一步的发展,因纸质“研究资料集”难以满足“数字人文”及当代学术的需求,乃是朝向“专题数据库”的建置。

  1980 年代以来陆续问世的“近代文学史料汇编”“中国现代文学史资料汇编”“当代文学史料汇编”等丛书是学界耳熟能详的“研究资料集”(有时也被称作“资料汇编”)。同时,古典文学、史学界也不遑多让,出版了诸多专题或综合性的资料集。

  但遗憾的是,编辑整理资料集这项工作由于至今仍不被视为“著述”“学问”,也未被纳入传统的“文献学”“史料学”的研究范畴,故近代以来搜集、整理、编辑及出版“研究资料集”的经验,长期以来未能被很好地总结、批判、继承、发展,以致今人从事此类工作,或嘈嘈切切、言人人殊,或全无章法、率尔操觚。

  2015 年,国家社会科学基金重点项目“回忆郭沫若作品收集整理与研究”立项,在研过程中,项目主持人曾在小范围内征求学界同行的意见和建议。藉此机会,笔者亦得以集中思考有关“研究资料集”的定义、编纂等问题。现将这些初步的思考稍作整理,以供感兴趣的读者参考。

  不过,需要说明的是,系统而深入地考察“研究资料集”的过去、现在与未来,并非本文的任务,本文只是在阅读常见“研究资料集”的基础上,结合笔者从事的近现代文献史料的开掘、研究等工作,就目力所及的资料集之搜集、整理、编辑及出版过程中应注意之若干问题,作一论述,进而指出“研究资料集”的未来,在于建置“专题数据库”,并对目前近现代文史数据库建置进展及其未来走向予以评析,其余问题,暂不作讨论。

  01研究资料的搜集与整理

  搜集研究资料是资料集作业的第一道程序。其中,注意发掘新资料是题中应有之义,但同时应该强调对常见书、文本、资料的搜集。关于这一点,置身“网洋大海”的我们,似乎不觉其难,但事实上,一切并没有我们想象得那么容易。原因很简单,其一,大量资料尚未被电子化、数字化;其二,即使已经电子化、数字化,没有一定的技术和方法,也难以觅见。

郁曼陀(中)、郁养吾(右)、郁达夫(左)三兄弟合影

  举例来说,郁达夫的第一本小说集《沉沦》于 1921 年 10 月问世,在当时的上海新文坛遭到很严厉的批评,被认为是黄色文学、颓废文学,后来周作人、胡适及创造社的同人出来声援,为其正名,才刹住了这股道德批判的风潮。

  但在当年,究竟是谁在批判,怎么批判,批判什么内容,一直没有找到文章佐证。海内外的专家在论述该历史事件时,都必须转述,并发挥自己的想象力,形容《沉沦》如何被批判、如何不受待见。

  直至 2016 年 12 月初,因一个偶然的机会,笔者才找到一篇文章,总算是落实了这个批判,有了起码的证据。最早的一本《郁达夫研究资料》在 1982 年就已出版,编者是陈子善教授及其当时的同事王自立先生。不过,这个资料集距今已有 30 多年。

  在这 30 多年间,有很多郁达夫的集外文和研究资料被重刊。2006 年,李杭春等人合编的《郁达夫研究资料索引》付梓,2007 年,新版《郁达夫全集》出版。但这篇重要的研究资料都未收录其中。

  由此可见,迄今已出版的作家学者文集、全集及其他著作(如日记、书信、回忆录等),虽然已极为丰硕,既有的书籍、文本、资料可谓恒河沙数,但毕竟还有许多遗珠,尚待我们采撷。前辈学者走南闯北吃灰尘,一丝不苟抄卡片,尚且难免遗珠之憾,我们汲取已整理发表、出版之文献资料时,自须竭尽全力。

  对常见资料的搜集,还有必要澄清三点。

  一是不仅应注意中国大陆的中文文献,也应将视野放到两岸三地乃至其他国家和地区的中文文献;

  二是虽然以中文文献为主,也应考虑搜集外文文献,若一时不能翻译,不妨原文照录;

  三是纸质文献之外,也应留意到网络资料。众所周知,网络资料有多种类型,即使是数据库中的原始文献,如疏于扫描其出版日期、误署出版信息等,利用起来尚须下功夫辨析、研读,至于一般文史爱好者所撰之网文,就更需要专业人士把关,以判定其学术价值,如果因噎废食,一概弃之不顾,则有损资料集之性质。

  整理研究资料,是资料集作业的第二道程序。有必要指出,这绝非录入文字付印即可,应遵循文献学的规范和要求进行整理。学者们每每谈及现代文学史编纂、书写中的问题时,作者使用的史料不足或误用史料似最易引人诟病,但我们都很清楚,没有一个文学史的作者能够承诺自己所参考、讨论到的作家作品及相关的一切资料,都是自己亲手、亲眼掌握的原始资料(当然,引用时须尽可能复核),更何况还有大量的研究论著需要理解、掌握。

  而资料集一个起码的作用,就在于使包括文学史作者在内的一切读者,拥有此书后不必再首先翻查原始资料。然而,环顾周遭,就连文集、全集的整理,依文献学规范、要求而为之者都极为少见,各式各样的研究资料集中所载之资料,是否尽可信赖,也就不难想象了。

  既然我们没有提供一流水准的“研究资料集”,又怎么能责怪我们的同行写不好文学史呢?其中有些批评近乎无稽之谈。

  2015 年成功大学马森教授所著三卷本《世界华文新文学史》出版,就有批评意见认为,其未读原作,而参考他人论述太多。

  “这是一项非常严肃的指控,有些迹近于诛心之论,如果最后证明成立的话,由于它违背了起码的学术规范,将严重损害著者及此书的学术声誉,此书仍在,读者可以检验其说是否正确。这一指控果然能够成立的话,我们自不必搬用瓦尔特 • 班雅明的毕生之追求乃是写一部引文之书之类的例子为马森辩解。不过,理解这一问题的重点或许是历史书写、叙述固然必须要求著者有自己的‘裁断’,但在当下学术积累已经相当丰厚的环境中,写作者须尽可能参考众说,变得尤为重要。夏志清当年写《小说史》,参考的书籍有限,不是他不想,而是先行研究太少,资料有欠缺,否则,他以后不会念念不忘应该补上萧红、端木蕻良等人的专论。” [1]

  为学者提供研究资料、整理资料之重要,于此可见一斑。

  遵循文献学的规范和要求整理资料,至少意味着以下三个方面的工作:

  一是慎选底本。近现代文献资料整理之底本如何选择?通行的做法是“从初兼顾从善”;

  二是施以校勘。若汇校一时难以实行,其他的校勘之道,也大可一试,而其要义,即在于不妄改原文;

  三是增加注释。注释以必要为范围,人所共知者,自不必注。

  此外,我们也要时常提醒自己——文献学的工作,亦有其边际。也就是说,任何文献资料,不仅是学术研究的资料,也可能还是文学文本,其中有些内容无法亦不必证实,以免固化读者的批评、阐释空间。

  02研究资料的编辑与出版

  编辑是资料集作业的第三道程序。资料集的编辑,固然应有明确的标准、原则、体例、方法贯穿始终,但也应该考虑到“具体问题具体处理”这一朴素的为人为学之经验,而不宜事事处处强求一致。

  如在《资治通鉴》的标点、整理过程中,就遇到了一个问题:总纂司马光于各卷下所题署之职衔不尽一致,而这又与其官职的变动、地位的升降有关,是否需要统一处理?

  据参与标点工作的蔡美彪教授讲:

  “标点本对著者衔名的题署可以采取不同办法:一是按照现行署名惯例,只在卷首或扉页题司马光著,不署职衔;一是按原版式在各卷题署职衔,但一律依照成书时的题署,以求统一。商讨之后议定,标点本各卷一依原书的题署,在各卷之前,分署不同的职衔,不作任何改动。因为标点本不是改编本,校勘的任务也只是校雠同异订正讹误,不宜对原有文字任意删改。而且,各卷职衔的不同,还可作为研究成书年代的依据,不宜轻易删除。” [2]

  并引述近人张须的真知灼见进行说明:“余考《通鉴》逐卷题衔,大都历数卷,或十数卷而辄易。以此知某卷为任某官时所辑,而李攸之说为不诬。循逐卷之题衔而观之,则某时期中进程之淹速,与其功力之难易,皆可测知。夫温公辑此书,以何年进何卷,史传无征,而余得于逐卷书衔处比而知之,是亦研究之一快已。”

  足见在古籍整理工作中,统一体例、强求一致亦有不尽切当之处。而近现代文献资料的整理、编辑工作何尝不是如此?面对大量的研究资料,其是否符合资料集的编辑标准、原则,或列入或舍弃,着实费人思量,但有了这一基本认识,或可为我们的编辑工作带来帮助。

  在这些技术性的工作之外,还应该考虑到一点,即编辑思路的不同。资料集与文集、全集编辑的根本不同,在于前者面向众人,尤其是许多无名作者,而后者只针对一人一家。

  一人一家,可以循发表、出版时间或文体等线索进行编辑,而成于众人之手者,则必须依类而别,以主题再配合其他标准(如发表、出版时间),作相应之归置、编排。

  如何设定主题,有哪些主题,设定之逻辑何在,无法纳入既定主题的资料该如何处理,与一个以上主题相关的资料该如何处理?这都需要在编辑过程中不断摸索,空谈无益。然而,对于一套大型的研究资料集而言,在处理上述问题时,似宜大不宜小,宜宽不宜窄。

  另外,既是“研究资料集”,为方便学者参考、利用,编制索引更是极有必要。但如何编制索引,编制哪些索引?虽不必效法洪业、袁同礼诸君的壮举,也不必向当年商务印书馆影印《十通》《佩文韵府》而编订巨帙之索引看齐,但亦可参考近代以来既有之做法、经验,特别是图书馆学、情报学领域有关索引编制的研究成果,使之化一成千,成为治学之不二法门。

  目前,大型的 20 世纪文学研究资料集,除“1913—1983 鲁迅研究学术论著资料汇编”拥有名副其实的“索引卷”外,其余诸如“中国现代文学史资料汇编”“中国新时期文学研究资料汇编”“郭沫若研究文献汇要(1920—2008)”等丛书,或不明索引与目录之别,以致有索引之名而无索引之实,或无索引分册,不免有损其书之参考利用价值。

  出版是资料集作业的最后一道程序。编著者既已付出诸多辛劳,自应极力争取一流的校对、装帧、印刷、出版水准,切不可撒手不管,交差了事。这一点,从学理层面来说,几无谈论的必要,但在实际操作中,却值得被反复强调。

  在一些研究资料集及文集、全集的出版发表会、讨论会及其他非正式场合,诸多编者曾慷慨分享自己为编辑近现代作家学者的文集、全集及研究资料与出版方反复沟通、争取等事,使人感慨其所承担之工作似可与责任编辑比肩,且其自认作责无旁贷之举,积极、高效地介入了出版的大多数流程、环节,从而保证了出版物以较为理想的形式面世。

  事实上,也唯有综合上述所论搜集、整理、编辑及出版四方面,且在每一方面都用心经营,我们才能真正理解学者关于任何一个现代作家的研究都必须建立相应的“研究文献保障体系”,而这是一切研究所要完成的基础工作,并将其所设想的“力求作品搜集、研究资料整理和回忆录汇编三项工作并重”(其中研究资料整理和回忆录汇编皆属于“研究资料集”的范畴,回忆录只是一种研究资料)的“现代文学研究文献保障体系”落到实处 [3],从而推进相关的学术研究。

  03从“研究资料集”到“专题数据库”

  纸质“研究资料集”的出版虽仍有必要,且在长时间内不会消亡,但面对我们正在迎来的“数字人文”(digital humanities)时代,笔者以为学界更应考虑建置“专题数据库”,以供全世界研究者免费访问、获取。这一“研究资料集”的发展方向,亦宜进入资料集编纂者的思想视野。

  尽管用数据库检索、下载资料只是其中小小一环,但没有数据库,人文研究所谓的数字取向、方法等也就无从谈起。

  让我们想想自己的研究经验,在今天我们的日常学术工作中,那些完全未经电子化、数字化的纸质“研究资料集”利用率有多高,影响有多大,在多大程度上能帮助我们完成查询资料的目标、设想?其对于当下乃至今后的学术发展所起的作用,是否能够达到“专题数据库”一半的效果?

  恐怕都很难说。 在关于近现代作家学人全集如何编纂的讨论中,有学者指出:“编‘全集’的最大困惑是,这到底是‘个人著作’呢,还是‘专题档案’?很多分歧其实是由此而生。” [4]

  举例来说,章太炎在“民国以后的各种通电”,钱锺书的“读书笔记以及类似读书笔记的短文”,是否应收入“全集”,见仁见智。但我们如果转换思路,将“全集”或“资料集”的编纂,变成“专题数据库”的建置,上述这些问题自可迎刃而解,且不会导致“全集”的“功能紊乱,变得越来越复杂,规模也越来越大,远离一般读者,只能藏身于图书馆” [4] 等问题。

  相反,“专题数据库”既可使全世界的读者都能随时随地访问、检索、利用,能够沟通学院内外,有利于学术生产与知识的民主化,还可以通过电子化→文本化→数字化,打破单一的主题、目录、索引(如人物、地名)、时间等原有知识分类、生产逻辑的限制,将所有资料从原有的历史与社会语境、文本脉络中解放出来,让所有资料获得了平等、独立的生命,亦即任一读者 / 数据库用户可以通过新的关键词、标签将其检索、利用,为之赋予新的意义。从结构化的数据汇集,到去结构化的数据利用,是普通的“研究资料集”万难企及的。

  更重要的是,对于学者而言,应有这样的自觉:数据库的建置,并不只是数据库厂商、图书馆员的专利,也没有我们想象得那么复杂、繁难,既然已有丰富资料,且获得了国家学术基金支持,又何妨放手一试?

  据笔者所知,在这方面,中国香港、中国台湾、日本及欧洲、北美诸地的研究者(有团队,亦有个人)已有不少示范。近年来,近现代文学史研究领域中也有加强史学品格、重视文献学取向的倡议。

  但应该承认,就连研究资料的电子化和数字化,史学、文献学、图书馆学界也早已走在我们前面。

  台北中研院近史所所建“胡适档案资料库”“袁氏家藏近代名人手书”“徐永昌日记”,北京中国社科院近史所档案馆所建“顾维钧档案数据库”,北京大学图书馆所建“陈翰笙档案资料库”,上海图书馆所建“盛宣怀档案知识库”等,均是很好的示范。

  与此相较,在近现代文学史的研究中,学者们经常使用的网络资源、数据库,几乎没有多少是自己建置的。目前,只有香港中文大学中国语言及文学系、大学图书馆系统所建“中国现代文学研究网” [5]“中国现代戏剧资料库”“香港文学资料库”,香港浸会大学传理学院所建“早期华文报纸电影史料库”,台北艺术大学电影创作学系所建“台湾电影史研究史料数据库”及北京鲁迅博物馆“在线检索系统”(含《鲁迅全集》《鲁迅研究月刊》)等,乃是少数的几个例外。

  公允地说,近几年来,受惠于数据库厂商、大型图书馆所建数据库的中国内地学术界,也同样深刻感受到了来自它们的刺激,并开始重视这一工作。

  主要表现为有多个以建置“专题数据库”为主要目标或次要目标的研究项目获批成为国家学术基金项目,项目化(与海外高校、企业的“项目制”仍不同)成为激励、驱动近现代文学甚至当代文学“专题数据库”建置的动力。

  如 2011 年的重点项目“网络文学文献数据库建设”,2014 年的重大项目“汉译文学编年考录及数据库建设(1896—1949)”,2015 年的一般项目“中国现代文学报刊作品系年及数据库建设”,2016 年的重大项目“中国新诗传播接受文献集成、研究及数据库建设(1917—1949)”和“抗战大后方文学史料数据库建设研究”,2017 年的重点项目“‘学衡派’年谱长编及文献数据库建设研究”,以及重大项目“延安时期未刊文献资料收集、整理与数据库建设”“中国文学史著作整理、研究及数据库建设”“中国近现代文学期刊全文数据库建设与研究(1872—1949)”等。

  2018 年国家社科基金重大项目中,与近现代文学相关的“专题数据库”多达六项,包括“西南联大文献资料收集整理与数据库建设”“中国现代电影文学资料发掘、整理与资源库建设”“多卷本《中国现当代旧体诗词编年史》编纂与研究及数据库建设”“两岸现代中国散文学史料整理研究暨数据库建设”“古代文论研究文献辑录、学术史考察与数据库建设(1911—1949)”“《历代词籍总目提要》及文献数据库建设”等,可见当下学术界对于建置“专题数据库”并以此获取国家学术基金支持的强烈渴望。

  更鼓舞人心的是,2018 年底,作为国家社科基金项目“抗日战争研究专项工程”的阶段性成果,由中国社会科学院、国家图书馆、国家档案局牵头,中国社会科学院近代史研究所和百度云承办的“抗日战争与近代中日关系文献数据平台”(简称“抗战文献数据平台”)已正式上线。

  该平台目前已收录 1949 年前的档案、报刊、书籍、图像、音频、视频等各类文献达 1700 万页以上,承诺面向全球读者永久免费开放,所有文献均可免费在线检索、阅览。其余诸多获得国家学术基金支持的数据库目前还在建置,当其建成之时,以何种方式(在线版或光盘版)发行,又会制定怎样的资源开放与保护政策、用户访问政策,其常用功能、界面是否友好等,还要作进一步的观察,但无疑“抗战文献数据平台”开了一个好头。

  总之,目前学者们逐渐意识到建置数据库的必要性,并将其视作自己的学术使命和工作的重要内容,这使得当下“专题数据库”的发展呈现出与以往完全不同的面貌。我们有理由期待,未来这一方面的工作会取得长足的进展。

  与上述所举诸多大型的、旨在搜集整理某一较大的专业领域全部新旧文献资料、充满了勃勃雄心的“专题数据库”项目相比,我们也期待着未来可以整合、优化现有的丰富数字资源,真正将工作重心放在电子化、数字化和向读者提供服务、嘉惠中外学林的小型“专题数据库”(诸如鲁迅等人的专题数据库)的建立。

  作者附注:本文初稿承蒙辛德勇、陈尚君先生赐阅是正,定稿后投寄《苏州教育学院学报》,匿名评审人亦多所指教,谨此一并致谢。

责任编辑:宋吟霜 最后更新:2020-07-12 07:51:13

特别说明:抗日战争纪念网是一个记录和研究中国人民抗日战争历史的公益网站。本网注明稿件来源为其他媒体与网站的文/ 图等稿件均为转载稿,本网转载,并不意味着赞同其观点或证实其内容的真实性。本网转载出于非商业性的文化交流和科研之目的,如转载稿侵犯了您的版权,请告知本网及时撤除。以史实为镜鉴,揭侵略之罪恶;颂英烈之功勋,弘抗战之精神。我们要铭记抗战历史,弘扬抗战精神,坚定理想信念,为国家富强、民族复兴,实现伟大的中国梦作出新的贡献。感谢您对抗日战争纪念网的支持。
纠错电话:0731-85531328、19118928111(微信同号)

上一篇:【资料推介】《近代史资料》前100期

下一篇:平台影响/数字人文与跨越国界的史料共享——以抗战文献平台为例

办公室 0731-85531328

抗日战争纪念网 13723880171

抗战文化研究会 15116420702

抗日战争图书馆 18182129125

抗战文化研究会

抗日战争纪念网

抗日战争图书馆

抗战文化研究会

抗日战争纪念网

抗日战争图书馆

红色力量传播

抗战研究

微博

抗战研究抖音号

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

中文域名:www.抗日战争纪念网.com 主办单位:长沙市抗战文化研究会

不良信息举报 电话:0731-85531328 手机:19118928111(微信同号) QQ:2652168198 E-mail:krzzjn@qq.com

湘公网安备43010402000821号 ICP备案号:湘ICP备18022032号 长沙市互联网违法和不良信息举报中心