基于本体的中医学术传承脉络构建
来源:99网
2018年第5期 ·学术探讨· 基于本体的中医学术传承脉络构建术 中国中医科学院中国医史文献研究所(北京,100700) 丁侃张丽君 摘要:针对当前中医古籍数字资源日益增多而利用不足的现状,提出了通过中医文献与人物本体的构建,关联 起中医学术传承脉络的方案。尝试借助于本体,对异构的中医古籍资源元数据方案进行统一语义化描述和转换,实 现平台间资源的深度聚合。 关键词:中医传承本体文献人物 文献标识码:A 文章编号:1006—4737(2018)05—0032—04 中图分类号:R2—03 Construction of Traditional Chinese Medical Heritage Based on Ontology DING Kan。ZHANG Lijun (Institute of Chinese Medical History Literature,China Academy of Chinese Medical Sciences,Beijing 100700,China) Abstract:In view of the current situation of the increasing number of digital resources without thorough application on ancient Traditional Chinese Medicine(TCM)books,.This study puts forward to the program of the inheritance of TCM throvlgh the construction of TCM literature and character ontology.With the help of ontology,the heterogeneous meta-data scheme of TCM resources is to unify semantic description and transformation,and to realize the deep integration of resources among platforms. Keywords:traditional Chinese medicine;inherit;ontology;literature;character 中医学术的传承,离不开“书”与“人”,即大致 经过30余年的发展,积累了相当数量的数字资源。 然而相关的资源可能分散在异构的多个数据库中, 依靠了“文献整理”和“师徒授受”两种传承方式。 因此我们认为中医学所有的文献以及知识的源与 流,均可以归结到这两大脉络上。本研究基于本体 的理论和方法,对中医学术传承涉及的“书”与“人” 的概念和关系进行知识组织,对概念所涉及的属性 应用元数据进行语义描述,从而全方位地关联出中 难以实现一体化获取和利用,同一数据库中的资 源,也未必做到了合理的“整序”。 以中医经典著作《伤寒论》相关的资源为例: ①古籍原物衍生的数字资源,至少包括“明万历二 十七年己亥(1599年)赵开美校刻仲景全书本”、 “日本宽政三年辛亥(1791年)观理药室影刻本”、 “清光绪二十五年己亥(1899年)石印本”等;②古 籍点校本原物衍生的数字资源,至少包括人民卫生 出版社、中医古籍出版社等出版的众多点校本;③ 医学术传承的脉络,并尝试通过此脉络,对异构的 中医古籍数字资源进行深度聚合。 现状与需求分析 中医古籍数字化工作,起步于2O世纪80年代, 参照不同底本、校本点校的诸多《伤寒论》全文文本 基金项目:中国中医科学院基本科研业务费项目“中医古籍数字化衍进发展研究”(编号:ZZlO0505);中医医史文献传承创新研究数据平台 (编号:ZZ110508);北京中医药科技发展资金项目“基于传承脉络的中医古籍数字化资源整合共享方案研究”(编号:JJ2018-98) △通讯作者,E.mail:abe82925@163.corn 资源;④《注解伤寒论》、《伤寒来苏集》等《伤寒论》 相关的注释文献的资源;⑤从《伤寒论》中抽取出的 桂枝汤、小柴胡汤、太阳中风证、阳明经证等碎片化 (结构化)的方剂、病证等资源;⑥《伤寒论》中的病 证、方剂知识在后世文献中被反复转载、注释、发 挥、应用(可视为《伤寒论》知识的传承过程)产生的 相关资源;⑦另外还包括与《伤寒论》相关的人物, 如张仲景、王叔和、林亿的信息。这些相关资源如 同“孤岛”分布在不同的数据库中,难以被有效地利 用。只有将组织松散、异地分布的异构资源进行有 序化再组织,才能实现一体化获取和利用。 关于资源的再组织,近年来有学者提出了“资 源聚合”的概念,资源聚合侧重于基于知识的内容 发现和数据管理,强调通过概念分析、引证关系等 手段发现并用可视化手段呈现出数字资源中蕴含 的知识结构¨ 。其中所强调的“引证关系”,正是中 医学术传承的表征。 中医古籍数字资源深度聚合以何种方式展开, 聚合的资源、知识如何组织序化,这是领域专家需 要思考的问题,由此我们提出了按照传承脉络进行 聚合的思路。而传承脉络的构建,需要借助本体的 理论和方法。 基于元数据的本体设计 本体(Ontology)一词源于哲学领域,是关于存 在的理论。在信息科学领域,定义为概念体系的明 确的、形式化、可共享的规范说明_2 J。元数据 (Metadata)是描述其他数据的数据,或者说是用于 提供某种资源的有关信息的结构数据 J。 资源的组织在微观层面都是依据各种规范的 元数据方案,资源之间的宏观联系依据知识本体所 形式化的联系模型,知识本体使各类元数据方案联 系成一个立体的知识网络 J。 不同时期、不同主体,在不同理念、参数、标准 指导下建设起来的诸多中医古籍数据平台,其元数 据方案设计、元素设置各不相同。为此,我们首先 参考了《国家图书馆古籍元数据规范与著录规 则》[5 3、“中医古籍书目元数据”l6 J、“中医古籍元数 据”、“中医语义元数据”l ,张文勇的“人物数据库 元数据设计规范” J、王楠定义的“人物概念及属 性”¨9 这些已有的元数据方案,同时梳理总结了众 多数字化平台、产品的数据结构、资源特色,最终确 定了本研究文献、人物本体构建中采用的元数据 方案。 中医文献杂志 通过构建基于元数据的本体,对各种现有异构 的元数据规范进行语义强化,以实现语义层面的资 源关联和知识聚合。 中医文献本体构建 1.构建参考 在中医文献本体构建过程中,我们以《中医文 献辞典》作为参考。该书由余瀛鳌先生主编,收录 了重要的中医文献6100余条,对于少数民族医药文 献亦有收载。每一条目相当于该书的内容提要,提 纲挈领,尽举特长优点,叙述十分醇正¨ 。该书尤 其重视考证文献学术传承的关系,对于医学人物之 间的关系,亦有所涉猎。 2.元数据方案 书名:文献的名称,包括异名以及卷数和存佚 情况。 主要责任者:对创建古籍负主要责任的实体。 此项著录主要责任者名称、别称、国别、所处时代以 及责任方式。此项可链接人物本体。 其他责任者:对古籍资源的创建有贡献的实 体。此项可链接人物本体。 成书时间:古籍结集成书的时间。此项著录古 籍成书的朝代、年号纪年、公元纪年。 主题:使用特定词汇对古籍资源内容的归纳描 述。分类参考《中国中医古籍总目》,包括:医经、基 础理论、伤寒金匮、诊法、针灸推拿、本草、方书、临 证各科、养生、医案医话医论、医史、综合性著作。 有些一级分类下有二级乃至三级分类。 时空范围:文献内容所涉及的地域范围和时问 范围。此项著录地名、年代。 相关文献:链接与所著录文献相关联的其他文 献本体。此项著录书名及相应的文献关系。定义 的文献关系:引录、选录、增编、续编、改编、仿体例、 注释、全注、分类注释、集注、发挥、影响、评述、单 行、翻译、歌诀化、图表化、并称、比较。 附注:记录未在其他元素项著录又有必要补充 说明的内容。包括著录附注、丛编附注、子目附注、 合刊附注等。 现存资源:链接文献现存的资源。 语种:文献内容所使用的语言种类。 参考:著录文献所参考的资料。 3.知识通过文献传承的脉络 通过时代、分类、分科、分级、时空范围等信息, 展示文献在各个维度上的分布情况。通过文献之 2018年第5期 间的关系,诸如引录、注释、发挥等展示文献之间的 传承脉络,以及通过同一文献的多个责任者,发现 学者的合作及传承关系。通过一本一本的书,构建 学术传承的脉络,其中每本书(文献本体)作为脉络 上的节点。 中医人物本体构建 1.构建参考 在中医人物本体构建过程中,我们以《中医人 物词典》作为参考。该书由李经纬先生主编,收录 人物多达6200余条,每位医家详述其履历籍贯、医 术渊源及其世系师承、医学思想及贡献、医学著述 及其卷数存佚等。后附有“人名字号、别名及师徒、 后裔索引”、“中医书名索引”_1 。 2.元数据方案 人名:人物的名称,包括字、号等别称。 生卒:人物所处的朝代,以及生卒年份。 类别:根据人物的性别、信仰、民族、专业、职业 等人物特征进行的分类。通过对《中医人物词典》 数据的分析,确定的类别包括:女性、儒医、释医、道 医、医官、、圣贤帝王、藏医、维医、蒙医、巫医、 法医。 里籍:人物籍贯以及经常活动的地域。涉及的 古地名参考《中国古今地名大辞典》。 学派:人物所属的学术流派。 专科:人物所属的科别。 专长:人物擅长治疗的疾病种类。 著述:人物所著述的文献。此项可链接与人物 责任相关的文献本体。 相关人物:链接与所著录人物相关联的其他人 物本体。此项著录人名及相应的人物关系。定义 的人物关系:师承、门人、推崇、影响、祖先、后人。 收载:收载人物信息的文献。 3.知识通过人物传承的脉络 通过时代、类别、里籍、学派、专科、专长等信 息,展示人物各个维度上的分布情况。通过人物之 间的关系,诸如师承、门人、推崇、影响、祖先、后人 等展示人物之问的传承脉络。通过一个一个的人, 构建学术传承的脉络,其中每个人(人物本体)作为 脉络上的节点,相关资源、知识聚合到相应节点上。 讨论 1.构建传承脉络的目的 深度聚合,不仅要揭示概念实体与实例之间、 实例与实例之间的关系,即揭示资源在外延上的相 似关系,特别是同一资源在不同层级的关系,更要 通过共同属性元素的挖掘,发现更多相似属性的内 部和外部资源,揭示概念实体之间的关系,实现从 资源整合向知识聚合的转变¨ 。 基于中医学术传承的两大脉络——“人”与 “书”,本研究探讨如何将不同来源、多种类型、各种 模式的中医古籍数字化资源,尤其是经过深度加工 碎片化的知识(知识体),在这两条脉络上建立起多 层面的关联,以实现资源整合与共享(被整合)。从 而梳理传承脉络,定位各类中医知识在学术发展过 程中时间、空间、来源坐标,达到知识序化的目的。 2.本体构建方法 本研究中,本体构建采用了循环获取法(Cyclic Acquisition Process)H 。由于中医古籍领域数据开 放程度不高,前期研究过程中未找到合适复用的本 体和叙词表,因此我们采用了手工构建的方式。一 般的知识获取手段不能确保领域知识的完备性,因 此选用专业词典,利用词典的定义和分类体系,进 行知识获取,是手工建立本体常采用的方案¨ 。 《中医文献辞典》与《中医人物词典》互为姐妹篇,前 者侧重文献,后者侧重人物,同时又互为补充,作为 领域权威的资源,可以满足我们构建初级本体的 需要。 在文献本体的构建过程中,对于文献间关系的 定义是本研究的难点;在人物本体的构建过程中, 人物相关属性的定义是本研究的难点,关于人物间 关系的定义,我们参考了何时希先生的《中国历代 医家传录》中总结的“十种关系”。 3.本体的迭代 本体的开发和完善是一个反反复复不断补充 的迭代过程 15]。IDEF一5方法和循环获取法等经典 的本体构建方法,均提到了本体优化的观点。 本研究仅是提出了基于《中医文献辞典》与《中 医人物词典》构建文献和人物初级本体的方案,在 此基础上还要经过反复的迭代过程,才能贴近于专 业领域中的客观实体和关系法则。在今后的工作 中,我们还需要参考更多的领域内权威的辞典资 料,以及复用可能的相关本体和叙词表,更为重要 的是在资源聚合的实践中验证并修正本体,使得文 献人物本体日臻完善,才能使由此勾画出的中医学 术传承的脉络,日益清晰丰富。 参考文献 [1] 张云中.从整合到聚合:国内数字资源再组织模式的变革[J] 中医文献杂志 1j 1J 1J 1J 1J 数字图书馆论坛,2014(6):16.2O. [9] 王楠.历史人物本体构建及其查询推理研究[D].桂林:广西 师范大学,2017:15—21. [10] 余瀛鳌.中医文献词典[M].北京:北京科学技术出版社, 2O00:1—2. 甘健侯,姜跃,夏幼明.本体方法及其应用[M].北京:科学出 版社.2011:25. 肖珑,赵亮.中文元数据概论与实例[M].北京:北京图书馆出 版社.2007:35. 李经纬.中医人物词典[M].上海:上海辞书出版社,1988: 1.5. 刘炜,李大玲,夏翠娟.元数据与知识本体[J].图书馆杂志, 2004,23(6):50-54,49. [12] 彭佳,郑巧英,张晗,等.基于元数据本体的特色资源深度聚 合研究[J].图书馆杂志,2016,35(11):82—89. [13] 刘仁宁,李禹生.领域本体构建方法[J].武汉工业学院学报, 2008,27(1):73—77. 肖珑,苏品红,刘大军.国家图书馆古籍元数据规范与著录规 则[M].北京:国家图书馆出版社,2014:39.79. 徐春波.中医药古籍元数据规范研究[c]//中华中医药学会 第九届中医医史文献学术研究会论文集萃.成海:山东中医药 大学,2006:210. [14] 刘浩公,蔡东风,张桂平.一种基于词典的领域本体建立方法 [J].通讯和计算机:中英文版,2007(2):61—64. 丁侃.基于知识元信息技术的中医古籍元数据研究[D].北 京:中国中医科学院,2009:14.22. [15] 张志刚.领域本体构建方法的研究与应用[D].大连:大连海 事大学,2008:3. 张文勇.湖南近代人物数据库建设研究与实现[D].长沙:中 南大学,2013:30.34. (修回日期:2018—07—03) 中医思维的话语呈现方式 南京中医药大学(南京,210023) 周延松 米 摘要:语言是思维的工具,中医思维的诸多典型特征也因而鲜明地体现在中医话语之中。涉医汉字清晰地折射 出中医思维的轨迹,中医学术语常以取象比类的方式显示其人本主义特性,语词组合中的语法作用与弹性机制隐含 着功能联系和中和思维,句法上的意合特点与中医学的整体观念密切相关,语段和语篇的结构模式体现出系统与变 易思维,由此形成中医话语不同于西方科学话语的固有特色。缘于其鲜明的人文属性,对中医话语的规范化与标准 化,不能采取单一性的“科学”视角,而应充分考虑中医思维及显现其中的话语特性,缓步推进。 关键词:中医话语思维方式 文献标识码:A 文章编号:1006—4737(2018)05·0035—04 中图分类号:R2—4 现代语言学认为,语言不仅是人类的交际工 具,还是重要的思维工具。从最单纯的方式理解, 怀特海认为语言表现为思维在习惯上的结果和显 现。…中医和汉语都诞生于中华文化的土壤,同是 中华文化的重要组成部分。正如汉语显示出中国 面进行考察,无论汉字、语词、语句,还是在此基础 上形成的语段、语篇,中医话语在表现出汉语根本 特点的同时,还是中国传统思维及中医思维方式的 外在呈现。以下以思维为视角,从上述不同层面, 探讨中医话语和中医思维相互建构的特征及其表 现,并就规范化、标准化趋势下的中医话语转型,提 出相关建议。 传统的思维方式,中医话语则是中医思维的结果和 显现。语言是一种具有层级性的系统,从不同的层 基金项目:江苏省高校哲学社会科学重点研究基地基金“中医文化国际传播路径与对策研究”(编号:2015JDXM012);“跨文化传播视域下的 中医话语特性及其传播策略研究”(编号:ZYWH2017.23)