基于ALEPH500系统的分布式部署研究

您所在的位置:网站首页 四川大学图书馆外网访问 基于ALEPH500系统的分布式部署研究

基于ALEPH500系统的分布式部署研究

2023-02-14 03:47| 来源: 网络整理| 查看: 265

谢 鹏 崔 振 李念祖

(首都图书馆,北京 100021)

1 ALEPH500系统简介

ALEPH500系统是艾利贝斯(ExLibris,aPro-QuestCompany)集团开发的大型图书馆自动化集成管理系统,为公共图书馆、高校图书馆以及图书馆联盟提供了图书馆自动化解决方案。根据美国LibraryJournal杂志的统计报告,艾利贝斯是全球规模最大的图书馆软件服务商[1],目前全球用户超过7000家。ALEPH500系统以Oracle数据库为后台,提供强大的资源共享能力、完全的系统连通性以及与第三方系统的无缝协调工作能力。模块化的组件设计使用户可以灵活实现图书馆的本地化需求。ALEPH500系统采用先进技术和管理理念,使图书馆的各项业务流程得到了优化,同时为图书馆业务格局的重组提供了很好的基础,是一个完全集成的图书馆系统[2]。

当前,全球有超过2300个机构在使用ALEPH500系统,包括多个国家图书馆和世界著名的大学图书馆。自动化系统用户包括英国国家图书馆、俄罗斯国家图书馆、日本国会图书馆以及美国哈佛大学、美国麻省理工学院、英国牛津大学等。在国内,ALEPH500系统也拥有大批用户,国家级图书馆包括中国国家图书馆、中国科学院国家科学图书馆、中国社科院图书馆、中国版本图书馆。省级公共图书馆包括首都图书馆、上海图书馆、天津图书馆、南京图书馆、广东省立中山图书馆、四川省图书馆。高校图书馆包括北京师范大学图书馆、复旦大学图书馆、上海交通大学图书馆、浙江大学图书馆、武汉大学图书馆、四川大学图书馆、中山大学图书馆等。据统计,ALEPH500系统在国内现有43家用户,是国内拥有最多图书馆用户的综合性自动化管理系统。

2 北京市公共图书馆计算机信息服务网络概况2.1 总分馆模式

公共图书馆的总分馆模式,是指在一个合适的地域单元内,由一个或多个建设主体,建成一个“公共图书馆群”,形成图书馆服务体系,提供普遍均等的服务[3]。

“北京市公共图书馆计算机信息服务网络”(以下简称“一卡通服务网络”)是以首都图书馆为中心馆,以区图书馆为各区总馆,以街道、乡镇图书馆为分馆,社区(村)图书馆(室)为远程用户的图书馆四级联合服务网络。“一卡通服务网络”实现了全市各级公共图书馆的联合检索、联合编目、馆际互借、资源共享和图书“一卡通”流通服务,它优化了北京市公共图书馆网络服务环境,提升了北京地区公共图书馆自动化管理水平[4]。读者可以在任意一家联网图书馆办理“北京市公共图书馆网络联合读者卡”,不仅可以借阅图书、期刊,在300多家联网图书馆享受异地还书服务,还可以免费使用百余种电子资源数据库。

2.2 服务规模

截至2019年底,“一卡通服务网络”已覆盖了全市16个行政区、270个街道、乡镇,联网成员馆已达345家。包括1家省级图书馆——首都图书馆、19家地市级图书馆、4家少儿图书馆。北京市公共图书馆共有馆藏文献约3840万册(件),2019年新增藏量221万册(件),2019年全北京市公共图书馆年外借图书超过1300万册次,年接待读者近千万人次,全市持卡读者超过170万人。

图1 2019年北京市公共图书馆计算机信息服务网络服务数据

2.3 发展历程与系统更迭情况

到目前为止,“一卡通服务网络”已经经历了17年的发展,也经历了不同的发展阶段。2002年北京市开始建设公共图书馆计算机信息服务网络,使用统一的业务管理系统,即“智慧2000系统”。2003年在西城区和西城区下属的10个街道开始试运行“一卡通”业务系统。2004年将通借业务模式推向了全市,实现了分层级、广域网范围内的系统运行。2007年提供一卡通联网服务的公共图书馆已覆盖了全市10个区馆及113个街道图书馆。

2012年,首都图书馆二期新馆正式对外开放服务,全市公共图书馆的服务效能不断提升,对业务管理系统的技术需求日益增强。统一的业务管理系统是整个服务网络体系的技术支撑,原有“智慧2000”系统已经无法满足需求。2014年,“智慧2000系统”和“ALEPH500系统”进入双系统并行运转阶段,全市各级联网图书馆达到177家。

2017年4月5日,北京市公共图书馆计算机信息服务网络正式进行系统更迭,由“智慧2000系统”切换为“ALEPH500系统”,集成系统包含“采访”“编目”“流通”等8个基础模块,以及“读者管理”“统一身份认证”“联合编目”等7个扩展模块。

本次部署是ALEPH500系统在我国首次覆盖一个省级行政区域内的全部公共图书馆,与全国范围内其他ALEPH500系统实施案例有很大的不同,数据处理量大,联网馆数量多,覆盖范围广,具有突破性意义。

图2 ALEPH500系统部署示意图

3 系统部署条件与需求3.1 网络部署条件

ALEPH500系统同时提供B/S、C/S两种网络连接模式。对于业务能力较强,涉及业务种类较多的首都图书馆中心馆和各区级图书馆,主要采用B/S与C/S相结合的部署模式;对于业务类型较简单的街道、乡镇、社区级图书馆,主要采用B/S架构的浏览器访问模式。

ALEPH500系统的数据库服务器和各项业务应用的服务器都部署在首都图书馆数据中心机房,对于首图内网终端用户,可以直接连接使用,而对于首图以外的终端用户,理想情况下可以通过专线网络或者组建VPN虚拟专网来接入首图内网使用。但是考虑到全市各图书馆的人员、经费、场地等条件各不相同,组建专网的实施难度较大,因此目前北京市各区级图书馆,以及街道、乡镇、社区图书馆都采用互联网访问的模式,首图数据中心将ALEPH500客户端和WEB版应用所使用的业务端口映射至公网IP地址,外网用户使用公网域名访问服务器,凭账号密码登录系统进行应用。

图3 外网用户访问方式示意图

3.2 网络安全需求

对于图书馆自动化集成系统来说,系统的安全可靠性是最基本的要求。图书馆自动化集成系统应当具有较为全面的安全保障机制,才符合系统的安全稳定性标准[5]。

2017年6月,《中华人民共和国网络安全法》正式实施,明确规定国家实行网络安全等级保护制度。网络运营者应当按照网络安全等级保护制度的要求,履行安全保护义务,保障网络免受干扰、破坏或者未经授权的访问,防止网络数据泄露或者被窃取、篡改[6]。此次在北京市公共图书馆范围内部署ALEPH500系统,系统安全需求参照了等级保护1.0标准。需要注意的是,在系统实施过程中的本地化和二次开发应用以及系统部署环境的改动,是否产生了新的不安全因素,对这些问题应及时进行渗透测试和漏洞修复。

3.3 数据分析需求

大数据分析是目前的技术热点,旨在从海量无序的数据以及信息当中选择出最为有效的信息,同时根据决策方向而制定出一个较为有效的参考方案。这一技术在当代数字图书馆的管理与服务中也有很大用武之地,把图书馆完全融入大数据之中,增加图书馆数字产品,提升图书馆服务水平,借助大数据技术解决图书馆的有关问题[7]。ALEPH500系统会持续地记录全市读者的借阅行为,如果能对这些行为数据进行深度挖掘,则有利于提供个性化阅读推介,更好地为读者进行精准服务,从而提高图书馆管理水平与服务效能。

为满足数据挖掘与数据分析的需求,ALEPH500系统需要一个专门的分析平台或对外接口,提供有关数据的分析以及统计,同时还能够根据用户发出的指令,对于信息进行综合提取,同时不会影响日常业务的响应速度。

3.4 系统更迭的必要性

北京市公共图书馆长期使用“智慧2000系统”,由于该系统研发年代久远,在总分馆模式使用中陆续暴露出了很多结构上的缺陷,给系统管理维护造成了诸多不便。

“智慧2000系统”采用双数据库机制,首都图书馆设置中心数据库,各联网图书馆设置本地数据库。读者借阅信息保存在中心数据库,图书编目信息保存在本地数据库,单册馆藏信息则在中心库和本地库各保存一份。当终端进行借还操作时需要在本地、异地数据库同步操作,这些操作由客户端发起,经中间通讯程序汇总后执行。

由于网络传输的不确定性,偶尔会发生一些数据库指令执行失败的情况,比如两端数据库未能同步修改,而执行失败的指令会滞留在通讯程序的队列中成为死锁,阻碍后续指令的执行,造成业务停滞,必须由人工介入清理死锁。由于“智慧2000系统”的业务功能没有分割,任意一个终端发生的死锁指令都会造成它所在通讯程序上的所有业务阻塞。随着“一卡通服务网络”的发展,联网图书馆数量越来越多,网络状况越来越复杂,通讯服务死锁的概率也随之增加,系统使用体验逐年下降。

4 系统部署方案4.1 业务功能划分

ALEPH500系统在行业内使用广泛,技术成熟稳定,并且采取单一数据库集中部署方式,不再有本地、异地数据库同步问题,理论上不会如智慧2000系统时期那样发生数据库死锁问题。不过,智慧2000系统的局限性也是在十余年的长期使用中暴露出来的,可以预见ALEPH500系统的使用寿命可能会更长。考虑到未来北京市公共文化事业的长期发展,公共图书馆的服务范围也将持续延伸,业务形态也会更加丰富多元,届时系统压力也会逐渐加大。从长远角度来看,为了避免今后出现类似的困扰,应当在部署之初从根本上做出预防手段,防止单点压力扩散到整体。

在这方面ALEPH500系统提供了很好的解决方案,其数据库和应用分离,支持多节点的数据库访问,应用服务也采用模块化设计,允许使用多台服务器来分别承载不同的业务,客户端使用不同的域名就可以访问到不同服务器。

具体的划分方式需要考虑两个维度的条件:从业务重要性来看,使用客户端软件的采访、编目、典藏、流通功能依然是图书馆核心业务,一旦中断会造成严重影响,而其他外围服务的重要性相对较弱。从馆际区别来看,首都图书馆作为中心馆,流通规模和社会影响力均为全市首位,应当优先保证首图业务的连续与稳定。虽然各区馆所用的ALEPH500客户端软件与首图一致,但会自行采购自助设备与第三方系统,可能选择与首图不同的提供商,因此其接口服务器应当与首图相分离,以防意外干扰。

根据上述“核心业务与外围业务分离,首图业务与区馆业务分离”的原则,ALEPH500系统在正式部署时,采取分布式部署方式,共使用了3台数据库服务器,7台业务服务器,见表1。

表1 首都图书馆ALEPH500服务器清单

中心数据库使用双机组成了OracleRAC集群,实现高可用性和负载均衡,两台主机并行工作,当其中一台发生故障时,将由其他主机接管其作业,待故障主机恢复正常后,集群又会为它分配新的工作任务[8]。

应用服务器1号机专门承担全市图书馆核心业务,包括客户端应用(采访、编目、典藏、流通等)以及WEB综合业务(打印书标、门禁、物流等)。2号机承担首都图书馆自助设备与第三方系统连接(WIFI认证、电子阅览、自助打印等)。3号机则承担各区馆自助设备与第三方系统连接。4号机运行WEB流通程序,主要针对基层社区馆的流通人员使用。5号机对读者提供OPAC综合检索服务。6号机作为测试服务器专门用于开发测试新功能,以及培训演示操作。对于数据挖掘和分析的需求,又另设有数据中台应用服务器与数据库服务器,其数据库与中心库保持镜像同步。

4.2 数据中台

ALEPH500系统为了满足数据挖掘的需求,特别设计了数据中台结构。所谓中台即位于前台应用和后台数据之间,是数据界面的一种架构,通过数据技术将数据从应用界面复制出来,然后通过数据计算、加工,进而为上层应用提供统一标准和口径的支撑平台[9]。通过数据中台,可进一步利用大数据技术及各种专业工具软件等,有效实现数据分成、水平解耦,将公共数据有效沉淀。

该平台单独使用一台数据库服务器,具备基于数据库日志的增量捕获机制,实现源端数据库到数据中台贴源层的数据实时同步,而不对业务系统产生任何影响和额外负载,进而对借阅数据进行充分的分析统计。

该平台将充分利用首图中心馆的资源及数据资产,重点打造数据分析共享服务化和数据应用工具化能力。转变原有面向开发人员为主的传统思路,构建数据资产和数据服务目录、自助式报表工具、数据探索区等面向普通用户的开放性功能,达到吸引用户看数据、用数据的目的,促进数据中台持续迭代、良性发展。

4.3 硬件设备与拓扑结构

首都图书馆ALEPH500系统各业务服务器(见图4)统一使用联想xSystemX3850X5主机,配置为4颗E7-4820CPU,64GB内存,600GBRAID1本地磁盘,安装RedHatEnterpriseLinux5.10操作系统。

图4 主机业务分担示意图

主数据库服务器为两台IBM PowerSystem S822小型机,配置为20颗物理CPU,128GB内存,通过HBA卡外接至独立数据存储阵列,安装AIX7.1操作系统,并部署为OracleRAC集群。

数据中台所用数据库服务器为一台IBMPowerSystem720小型机,配置为4颗CPU,64GB内存,同样使用HBA卡外接数据存储,AIX7.1操作系统,部署相同版本Oracle。

4.4 安全设计

由于采取了互联网直接访问的方式,首都图书馆ALEPH500业务服务器的登录方式事实上是向公网开放的,而北京市部分街道级图书馆,以及市内24小时自助图书馆终端普遍使用动态IP接入互联网,没有固定IP地址,无法通过防火墙白名单的方式直接限制终端来源。这种情况下难以识别用户的合规性,特别是WEB版应用,此时系统的账户密码便成为了唯一的验证手段,防护能力有所欠缺。

而ALEPH500系统的WEB版应用原本使用HTTP协议方式明文传输,存在着易泄露、易注入、缺乏完整性检测的问题[10],在公网中有可能被窃取数据信息,存在管理员账户泄露的安全隐患。

为增强ALEPH500系统在互联网环境下的安全性,针对北京市公共图书馆网络所使用的WEB版应用进行了额外开发的工作,全面启用HTTPS协议,通过SSL加密方式传输数据防止泄露,并增加了密码重试次数限制功能,尽可能防止了恶意破解的行为。

4.5 效果验证

首都图书馆ALEPH500系统自2017年4月正式上线使用,至今已逾两年,其间整体运行情况良好,未出现重大系统应用事故。系统各服务器负载平稳,性能充裕,从未发生因性能瓶颈而造成的业务迟滞。

截至2020年初,以ALEPH500系统中的1号应用服务器为例,针对服务器的性能监测显示(见图5),其CPU和内存使用情况在一周内的峰值为30%左右,属于合理区间内。其他服务器数据与之类似,该结果验证了前期业务分割的设计合理,很好地保障了北京市公共图书馆服务网络的稳定运行,并且为未来长期发展保留了充足增量空间。

图5 ALEPH500服务器性能监测数据

5 结语

首都图书馆在部署ALEPH500系统的过程中,通过对服务的合理划分,成功实践了一种分布式部署方法,有效地支撑起了北京市公共图书馆计算机信息服务网络的平稳运行。新系统令馆藏文献信息更准确,联采联编、图书预约、联合检索、自助借阅等服务更加高效便捷,业务系统开源性增强,更加适应未来图书馆日益扩展的服务新手段、新内容。新系统帮助北京市建立起了一套完整的公共图书馆总分馆服务体系,优化了北京市公共图书馆网络服务环境,提升了北京地区公共图书馆计算机管理水平,进一步提升了北京市公共图书馆的技术能力与服务能力,能够保障各级公共图书馆满足市民多层次的文化需求。

猜你喜欢 服务网络北京市部署 北京市:发布《北京市2022年能源工作要点》节能与环保(2022年7期)2022-11-09北京市丰台区少年宫中小学校长(2022年4期)2022-05-28北京市勘察设计研究院北京测绘(2021年11期)2022-01-24一种基于Kubernetes的Web应用部署与配置系统成都信息工程大学学报(2021年5期)2021-12-30北京市营养源研究所乳业科学与技术(2021年6期)2021-12-17晋城:安排部署 统防统治今日农业(2021年7期)2021-07-28部署非公有制企业党建(2020年5期)2020-06-16浅谈新形势下县级图书馆如何做好阅读推广工作中文信息(2018年3期)2018-06-11构建江门地区公共图书馆服务网络模式的思考河南图书馆学刊(2017年11期)2017-11-27服务网络协作模式下中小物流企业间利益分配研究商业经济研究(2017年1期)2017-02-10

图书馆学刊2020年4期

图书馆学刊的其它文章“双一流”视域下ESI前1%学科图书资源保障与利用分析*清末民国时期浙江公共图书馆发展述略*乡村振兴战略背景下少数民族非遗文化资源的长期保存研究图书馆阅读推广体系建设与发展研究共享经济视角下图书馆众筹阅读服务模式研究5G时代图书馆总分馆建设方向管见——以公共图书馆为例


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3