• 中医养生社区:淄博|北京|杭州|泰安|济南|青岛|滨州|东营|潍坊|通化
  • 中药现代化
  • 您当前的位置:首页 > 中药现代化 > 科技前沿 > 正文
  • 中医古籍数字化建设与知识服务模式的构建

  • 来源:世界科学技术 作者:任玉兰 李政 梁红 江蓉星 时间:2013-04-28 07:42:00
  • 核心提示:一、中医古籍数字化建设研究的现状和趋势
    1.中医古籍的保护和利用刻不容缓.数字化技术为古籍的保护与利用研究带来了新的机遇
    中医药古籍是中医药传承数千年绵延至今的知识载体,更是现代中医药科技创新和学术进步的源
    一、中医古籍数字化建设研究的现状和趋势
    1.中医古籍的保护和利用刻不容缓.数字化技术为古籍的保护与利用研究带来了新的机遇
      中医药古籍是中医药传承数千年绵延至今的知识载体,更是现代中医药科技创新和学术进步的源头和根基。但由于历史悠久、自然灾害、保护不力等原因,在现存不足万种的中医药古籍中,大多数存在残破、虫蛀、湿浸等问题,并有4000余种已经成为孤本甚至面临绝本的危险,而有千余种稀有医籍如不及时保护也将会沦为孤本、甚至亡佚 ,因此中医古籍的保护和开发利用研究工作刻不容缓。
      数字化技术就是利用计算机及其相关设备对各种信息进行数码化处理的技术 ,不仅可实现古籍永久保存和再生性保护,而且可通过网络化共享、电子化方式实现古籍文献信息的多途径有效利用,并减少对纸本古籍的损耗,达到间接实现古籍原生性保护的作用。因此古籍数字化建设不仅为解决古籍文献保存和利用之间的矛盾提供了有效的途径,还为中医药古籍的保护和利用带来了新的机遇。
        2.中医古籍数字化建设取得了一定成绩,但仍停留在对古籍显性信息的数字化建设上,未深入开展古籍隐  性信息的数字化建设,制约了数字化中医古籍的有效利用
        中医古籍的保护和利用是一项事关中医药事业发展的基础性、全局性和战略性工作,加强中医药古籍的保护和利用,将大大有利于中医药特色优势的发挥、客观规律的把握,以及为传承抢救、创新发展提供支撑和服务。虽近年来建成的中医药古籍数据库数量不少,但真正得到广泛使用的并不是很多,除了库容相对较小、资料门类不全、检索手段滞后等问题以外,制约数字化中医古籍有效利用的重要因素还在于现阶段古籍数字化程度均比较初浅,主要停留在对古籍显性信息如书目、图像、文字、版本等数字化建设,缺乏对古籍隐性信息如实质内容、潜藏知识和规律的数字化分析、提炼,难于满足读者直接获取有用知识的需求。
    二、中医古籍数字化建设与知识服务研究的意义
    1.实现中医古籍的数字化与知识服务,未解决古籍文献“藏”与“用”的矛盾提供有效途径
        中医古籍以图文形式记录了中医学数千年来积累的理论知识和临床经验,相对于其他学科的古籍,不仅具有珍贵的文物价值,而且具有重要的实用价值。然而,古籍文献存在“藏”与“用”的矛盾,即:虽然古籍保存的目的是为了利用,但利用就会损耗,且不利于保存。中医药是一门继承性很强的学科,中医古籍更是传承和发展中医药学术的主要载体,如何保存并最大限度地开发利用中医古籍是中医研究和图书文献信息工作的重要课题。鉴于此,基于计算机数字化技术,采用“原图原貌”的图像实现中医古籍的永久保存和再生性保护,通过网络化共享、电子化方式实现古籍文献显性信息的阅览、检索,并通过数据库与知识挖掘技术实现古籍隐性信息的挖掘、分析和知识服务,可为解决古籍文献保存和利用之间的矛盾提供有效的途径。
        2.深入挖掘中医古籍的隐性信息,为促进古籍  服务模式从资源服务向知识服务转变提供研究思路
        中医古籍汇载着我国几千年来的中医药学术成就,故其应用价值不仅仅体现在文献载体利用本身,更重要的是从文献内容中挖掘和发现有价值的知识。鉴于此,基于知识挖掘技术深入发掘中医古籍潜藏的知识和规律,通过构建古籍数字化综合平台,为中医学教学、科研、临床提供多功能的知识服务,将有利于古籍服务模式从资源服务型向知识服务型转变,为高校图书馆中医药古籍的数字化建设和数据挖掘提供思路与方法。
    3.实现中医古籍信息的共享与知识挖掘,有利于促进中医药学术的传承和中医药事业的发展中医药文献资料记载了历代名医专家重要而丰富的临床医疗经验和精辟的理论,是后人在中医临床医疗、教学和科研工作中可以学习与借鉴的知识宝库。故此,在中医古籍数字化建设基础上,利用知识挖掘技术深入提取隐藏于其中的有用知识和规律,通过网络化、电子化技术实现古籍信息的共享,有效激活中医古籍所蕴藏的信息能量,使之成为中医药研究的知识宝库和高效的研究工具,这将有利于促进中医药学术的传承和中医药事业的发展。
      三、中医古籍数字化建设与知识服务研究思路
        1.总体思路和方法
        以几十种中医重要古籍为研究载体,采用文献学方法进行版本调研、文献整理研究,采用计算机数字化信息技术对中医古籍显性和隐性信息进行数字化建设和研究,基于数据库和知识挖掘技术进行古籍信息的知识发掘和提取、知识服务模式和方法研究,最终基于网络支持平台技术方案构建集中医古籍信息存储、阅读、研究、知识挖掘、知识服务于一体的数字化信息平台。
        2.具体研究内容和思路探讨
        (1)中医古籍数字化的保真原则和技术研究。
        鉴于古籍的文献学和史学价值,在古籍数字化过程中,必须把“保真”作为首要原则[2]。一方面,需对古籍书页、书脑、书根、书脊、版心、书函、书套等原貌原图的采集原则、方法、方式、技术参数等进行研究,以实现中医古籍形式上的完全保真;另一方面,需对数字化图像转化技术、文字识别技术、异体字和避讳字映射转化方式和策略进行研究,建立保持版式还原风格(繁体竖排)的数字化文本库,从而实现中医古籍内容上的完全保真。如此既能保持中医古籍原貌的复制品,又能得到文本、字体、字形与原版相同的文本,可以达到古籍原貌保护和文本利用的双重目的。
        (2)中医古籍显性和隐性信息的数字化建设方案探讨。
        中医古籍所传承的信息不仅包括可以直接呈现的显性信息,还包括潜藏的隐性信息,而后者可能更具传承价值。因此,古籍数字化建设应该包括显性信息和隐性信息两方面的建设。
        中医古籍显性信息的数字化建设方案主要包括3个部分:古籍数字化图像采集、保存与发布方案研究,中医古籍元数据著录方案研究,古籍文字的数字化转换、识别、发布、检索、图文对照方案研究。针对古籍原貌的数字化,可采用无接触性拍照或扫描方式对古籍的原貌原图进行采集,不仅包括古籍的书页,还要包括书脑、书根、书脊、版心、书函、书套、牌记、印章等,然后采用图像处理软件与计算机技术对图片进行转化、处理和保存,形成可实现检索的图像加文本的双层数字化文件。针对古籍元数据的著录,需对古籍内容描述、知识产权、外形描述等反映古籍显性信息的数据进行全面提取、著录,如题名、作者、版本、年代、出版方式、主题、内容提要等。针对古籍文字的数字化,可采用计算机文字处理技术进行数字化图像的文字识别、转换和简化,并进行标点,形成简体横排文本格式文件,实现图像繁体与文本简体相对照的数字化文件。
      中医古籍隐性信息的数字化建设方案将主要包括3个部分:中医古籍知识的深度标引方案研究,中医古籍知识点的提取、关联与整合研究,中医古籍关联知识库的构建。在对古籍文本信息内容进行解析的基础上,将其内容分解成多个具有独立意义的信息单元,然后提取知识概念进行多级注释和标引,并以此作为后期知识关联和检索的链接点;根据解析的信息单元和知识概念,设计中医古籍数字化文本数据库结构和数据模型,并通过数据ETL过程即抽取、转换、加载,将分布的异构数据源清洗、转换、集成、整合到目标数据库中,构建成中医古籍关联知识库,成为数据库检索、数据挖掘、联机分析处理的基础。
      由于中医古籍隐性信息具有隐藏性、间接性、暗示性,因此在隐性信息数字化建设中,如何使隐性信息可视化、显性化、扩展化?如何使数字化、显性化后的信息能准确体现古籍知识的特征、内涵、关联和实质?如何为知识挖掘提供可供利用的数据?因此,中医古籍知识的深度标引,中医古籍知识点的提取、关联与整合,中医古籍关联知识库的构建将是今后研究的重点和难点。
      (3)中医古籍数字化知识挖掘研究。
      中医古籍数字化的目的不仅在于全面展现古籍的显性信息,更重要的是实现隐性信息的可视化、显性化、扩展化,因此须在中医古籍关联知识库构建基础上进行知识挖掘,提取潜藏的有用知识和规律。该部分研究包括文本知识挖掘研究、语义关联挖掘研究、知识规律的提取研究,以及挖掘结果的可视化研究。可在古籍知识库构建的基础上,将每种中医古籍作为一个知识整体,根据古籍知识的特点,选用分类、聚类或关联分析类等数据挖掘方法进行中医古籍知识的提取、挖掘,如方剂类古籍可采用关联规则提取方剂配伍规律,病案类古籍可采用聚类方法提取疾病治疗规律,针灸类古籍可采用复杂网络方法提取腧穴配伍规律,等等。同时采用图表方式实现挖掘结果的可视化。
        但由于中医古籍信息年代悠久,又都是文本型数据,具有明显模糊性、不确定性和非线性等特征,如何进行深入的知识挖掘和知识发现?挖掘过程和方法如何才能体现中医思维特征、如何才能进行深层次的相关性与规律性处理?因此中医古籍信息的文本知识挖掘、语义关联挖掘、知识规律的提取也是研究的重点和难点。
        (4)中医古籍数字化多功能知识服务模式研究。
        古籍数字化建设最重要的目标在于促使古籍服务模式从资源服务向知识服务转变,然而,如何才能实现多功能、多层次的知识服务目的和效果?故需切合实际,对古籍数字化知识服务模式,包括个性化信息检索、基于超文本链接阅读环境、智能辅助支持功能、知识发现服务的方式、实现方法与方案进行研究。具体可包括:①个性化信息检索功能的设计与研究,即利用计算机技术实现中医古籍数据库的全文检索、条件检索、关联检索、超链接反
    馈检索等;②基于超文本链接阅读模式的设计与研究,即通过超文本链接技术实现原本中相关内容的信息单元之间链接,以一个信息需求点为中心,汇聚出所有相关信息单元,建立多功能阅读环境,改变传统读书方式的线性顺序,为读者提供信息的非线性表达方式;③智能辅助支持功能设计与研究,即利用计算机技术,为读者提供有关中医古籍内容本身的、科学准确的统计与计量信息,并提供与中医古籍内容相关的参考资料和辅助工具,如字数、字频、词频的统计数据,异体字的汇聚显示等;④知识发现服务设计与研究,即通过数据挖掘技术和结果可视化实现古籍信息的深层次挖掘与提取研究,为中医临床和科研提供有价值的参考和支撑。
        随着信息化的发展,人们对知识服务的要求越来越高,如何才能将古籍显性、隐性知识呈现给读者,实现中医古籍的实际价值?采用什么模式才能有效满足中医科研、临床、教学多功能、多层次的知识服务?在网络环境下,如何满足读者知识服务的即时需求?故此,个性化信息检索、基于超文本链接阅读环境、智能辅助支持功能、知识发现服务的方式、实现方法也都是研究的重点和难点。
        (5)基于知识挖掘与服务的中医古籍数字化平台的构建。
        通过对古籍图像和文本发布、浏览、显示和输出方案以及网络支持平台等技术方案的研究,构建基于知识挖掘与知识服务的中医古籍全文数据库,实现中医古籍数字化多功能知识服务模式,包括个性化信息检索、基于超文本链接阅读环境、智能辅助支持功能、知识发现与服务,为中医古籍显性和隐性信息的多层次、多环境的有效利用提供一个数字化信息平台,为中医药特色优势的发挥、客观规律的把握以及传承抢救、创新发展提供支撑和服务。
        综上,中医药古籍是传承中医药学术和思想的重要知识载体,更是现代中医药科技创新和学术进步的源头和根基。古籍数字化建设既为解决古籍文献保存和利用之间的矛盾提供了有效的途径,更为中医药古籍的保护和利用带来了新的机遇,而将知识挖掘融人中医古籍数字化建设,促使中医古籍服务模式从资源服务向知识服务转变,既是古籍数字化保护和利用的方向和趋势,也是中医药事业发展所需。

    (如果您认为转载内容侵犯了您的权益,请及时联系我们,本网站将在收到信息核实后24小时内删除相关内容。)

  • 相关文章:
  • 无相关信息
  • 延伸阅读:
  • 互联网药品信息服务经营许可证 国家编号:B-0101-0027-000031山东编号:(鲁)-经营性-2016-0014 中电商协团证字第TQ0142号 京ICP备11018379号-2
    Copyright©1999-2019 TH55.CN Inc. All rights reserved. 唐汉中医药网 版权所有