2.1项目背景
新农合业务是中国移动贵州公司在医疗卫生行业类的一大重要信息化应用。贵州省新农合项目建设至今,在线运营业务包括68个县(区)、1224个乡(镇)、16508个村;建档总人数3358.44万,2015年参合总人数2505.37万;门诊补偿人数1796.04万人,门诊补偿人次12157.6万人次,住院补偿人数752.96万人,住院补偿人次1470.37万人次。接入卫生医疗单位15744家,其中卫生医疗管理机构(卫生局和合医办)957个、省级医疗机构18家、市级医疗机构166家、县级医疗机构874家、乡级医疗机构2213家、村级卫生室11516家。项目运营6年来,数据积存较多,现网生产库数据量已达TB级,业务在稳定性与可靠性上的需求非常高。
新农合业务系统2015年总体收入1547万元,数据量较大且涉及敏感数据,因此对数据的安全性及可靠性要求较高,且客户与贵州公司新农合业务合同中明确提出需要进行数据备份,因此结合贵州公司业务系统容灾备份原则要求,进行容灾系统建设
2.2项目时间及内容
项目时间:合同签订之日起一年;
项目内容: 新农合业务系统数据库支撑服务、新农合数据库备份服务、新农合数据校验机制实施服务、新农合业务数据资源管理调测服务、新农合操作系统优化支撑服务、新农合业务平台调测及支撑服务。
2.3项目范围
服务类型:技术支撑服务
服务内容:新农合业务系统数据库支撑服务、新农合数据库备份服务、新农合数据校验机制实施服务、新农合业务数据资源管理调测服务、新农合操作系统优化支撑服务、新农合业务平台调测及支撑服务
服务涉及生产环境数据库平台:
数据库类型:Oracle
新云平台:县级平台数据库2台(Oracle RAC集群),报表数据库1台
蓝云平台:黔南分库数据库2台(Oracle RAC集群),报表数据库1台
三 、技术要求
3.1服务整体要求
3.1.1总体目标
本期容灾支撑服务规划和建设的目标是:
实现关键业务系统及其关联系统的数据安全;
减少计划停机次数/时间,消除对核心数据的争用;
将异地中心接管业务的时间控制在可以接受的范围内;
实现异地中心的软设备和数据的复用。
容灾系统的建设需要考虑的具体因素包括:
系统的可恢复程度:处理能力的恢复程度、数据的恢复程度、业务功能的恢复程度;
系统的可容忍的中断时间:系统中断时间长短对应的业务损失程度应在可以接受的范围内;
成本:包括系统建设、维护成本,以及资源复用情况;
现有系统的保护机制:包括现有的技术、管理和人员。
业务连续性的指标有两个,即恢复时间目标(Recovery Time Objective,以下简称RTO)和恢复点目标(Recovery Point Objective,以下简称RPO)。
RTO:表示了从灾难发生直到业务流程再次运行(即被恢复)的时间。
RPO:是灾难发生后业务能够容忍的数据丢失量,或者说灾难发生造成的数据丢失量。
标准的RTO、RPO级别定义如下:
RTO级别列表
级别 |
恢复时间要求 |
(1级) |
15分钟内恢复 |
(2级) |
2小时内恢复 |
(3级) |
4小时内恢复 |
(4级) |
1天恢复 |
(5级) |
可恢复,但无时间要求 |
RPO级别列表
级别 |
可容忍丢失的数据 |
(1级) |
无数据损失 |
(2级) |
30分钟内的数据损失 |
(3级) |
4小时内的数据损失 |
(4级) |
8小时内的数据损失 |
(5级) |
一天之内的数据损失 |
结合上述指标情况及现网实际需求,我们建议,对本期新农合业务系统容灾支撑服务的RTO、RPO级别设定如下:
服务内容 |
RPO 级别 |
RTO级别 |
新农合业务系统容灾支撑服务 |
1级 无数据丢失 |
1级 15分钟内恢复 |
3.1.2服务具体内容
本期新农合业务系统容灾支撑服务主要具体内容如下:
对目前新农合业务系统数据进行数据库级数据实时复制,构建生产和灾备中心的双活应用体系;
实现新农合业务系统双活容灾。
生产和灾备中心数据库随时处于双活打开状态,可读可写,一是可最为迅速地启用灾备中心。二是可充分利用资源,灾备中心可承担查询等任务。
无需在每台需要同步的服务器上安装代理,减轻生产系统压力,降低服务实施、监控、维护复杂度。
与平台无关,操作系统、存储设备都可异构;现有环境包括网络都可充分利旧。
数据实时,用分析数据库日志的方式进行数据复制,复制效率高,秒级复制,数据实时性要求高。
自带校验机制,数据准确。
实施部署简便。
3.1.3服务建设方案
新农合业务系统容灾支撑服务方案应满足以下要求:
方案设计需要满足应用系统数据丢失指标RPO的要求;
在选择数据复制技术时,除了考虑RPO、RTO要求,更多要考虑方案实施的复杂度,尽量不影响生产系统,并兼容各种设备。;
生产和灾备中心为双活中心,数据库随时处于双活打开状态,可读可写,一是可最为迅速地启用灾备中心。二是可充分利用资源,灾备中心可承担查询等任务。
在复制网络设计时,应充分考虑数据复制对网络线路资源的带宽需求和流量需求,以减少数据复制的丢包率,保证生产与灾备之间的数据复制链路稳定,确保数据的一致性;
用于数据复制的设备端口和网络端口应与其他数据链路分开,避免其他数据对数据复制的影响。
方案设计需要充分考虑与平台无关,与平台操作系统、CPU无关;操作系统、存储设备都可异构;现有环境包括网络都可充分利旧
用于数据复制的设备端口和网络端口应与其他数据链路分开,避免其他数据对数据复制的影响。
实施部署简便,无需安装代理。
新农合业务系统容灾支撑服务方案包括但不限于:
投标人应提供本次服务的总体方案。
应与设备提供商配合完成服务项目内容的安装调试。
应与设备提供商配合完成整体环境的集成。
应提供现有系统、网络割接实施细化方案。
3.1.4服务技术要求
新农合业务系统数据量较大,业务在稳定性与可靠性上的需求非常高,因此数据采集应对生产和灾备系统影响最低。★
应采用对生产和灾备系统影响最低的方式进行数据采集,不破坏原有业务系统,无需对业务系统进行改造,在不影响各个业务系统正常运行的情况下实现 “非侵入式”的信息资源采集。
数据采集时,不应在生产和灾备系统安装任何插件,避免对系统运行造成可能的影响。(提供原厂商系统截图)
新农合业务系统数据量较大且涉及敏感数据,业务在稳定性与可靠性上的需求非常高,对数据的安全性及可靠性要求较高,服务需保证灾备的整体性能。★
应有专用数据处理服务器,能实现秒级数据同步。(提供原厂商系统截图)
新农合业务是医疗卫生行业类的一大重要信息化应用,服务范围广,在将来很长一段时间内都是医疗卫生行业的重要信息化组成部分。所以服务需具有普适性,能够利旧及实现未来的扩展。
服务应具有平台无关性,支持基于HP-UX、IBM AIX、SUN SOLARIS、Linux、WINDOWS等主流操作系统平台的主流数据库。包括但不限于Oracle、SQL Server、MySQL、DB2等主流数据库。目标端应可以支持达梦、金仓、南大通用等国产数据库,以响应国家自主知识产权、国产化的需求。同时服务应支持异构数据库、数据结构的融合,使数据在异构数据库间能够流动起来。
服务应能自动化工作,无需人工介入,节省人力成本,降低人为错误。
应有专用数据处理服务器,能实现秒级数据同步。(提供原厂商系统截图)
新农合业务系统数据量较大且涉及敏感数据,对数据可靠性要求较高,所以要求服务具有数据校验功能,保证生产环境与灾备环境的数据一致性。★
服务应提供记录实时校验功能,判断每条修改的数据的修改前数据是否和系统的当前数据相同,否则必须提供报警,供错误分析和处理。(提供原厂商系统截图)
服务应能简便易用,提供“所见即所得”的用户界面,降低安装调试和使用的难度。
提供图形化的数据集成工具,界面应是中文界面,方便用户通过拖拽方式进行工作。(提供原厂商系统截图)
服务应能提供相关统计数据,并以图形化呈现,便于运维,监控。
应提供管理监控功能,能实现对运行状态、运行日志、系统配置等方面进行统一的管理及监控,同时能够对信息进行统计,分析热点操作,并进行分类展示,以便分析、查看信息使用情况。(提供原厂商系统截图)
新农合业务系统数据量较大,业务在稳定性与可靠性上的需求非常高,服务应能实现生产环境与灾备环境的“双活”配置,均为可读可写,提高灾难时切换速度,保证业务连续性,同时可以充分利用资源,减轻业务压力。★
源端、目标端数据库都应处于read-write状态,而且能够各自运行自己的业务。(提供原厂商系统截图)
新农合业务系统数据量较大,服务需提供灾备的大数据量处理能力。
针对现有新农合业务系统数据量的情况,服务应能支持总数据量在1000GB以上规模的复制,同时能够支持每天变化量在500GB以上的数据复制。
新农合业务系统数据量较大且涉及敏感数据,对数据可靠性要求较高,服务应能提供DDL复制能力,提高数据库一致性的灾备能力。★
服务应能支持DDL操作,将源端的DDL操作复制到目标端,提高数据库一致性。(提供原厂商系统截图)
新农合业务系统数据量较大且涉及敏感数据,业务在稳定性与可靠性上的需求非常高,服务需保证灾备的健壮性。★
服务应能保证灾备的健壮性,完成如下场景的对应:
当源端数据库出现问题,目标端数据库不受影响,源端数据库恢复后,可以从问题点时间开始继续进行实时灾备;
当目标端数据库出现问题,源端数据库不受影响,目标端数据库恢复后,可以从问题点时间开始继续进行实时灾备;
当网络出现问题,两端数据库均不受影响,网络恢复后,可以从问题点时间开始继续进行实时灾备;
同时服务本身应具有高可用(HA)功能,形成主备,不应只有一套服务。否则当服务出现问题时,业务系统灾备将无法实现。
新农合业务系统数据量较大且涉及敏感数据,业务在稳定性与可靠性上的需求非常高,服务应具有压缩传输的能力,有效减轻灾备传输的I/O压力和带宽成本。
服务本身应能提供数据压缩传输的能力,能够有效减轻灾备传输的I/O压力和带宽成本。
四 、项目实施相关要求
4.1安装
1)除非另作规定,投标人负责一切与系统安装调试有关的实地工作和服务,至少包括合同规定的设备的现场配置、调试、安装、集成和联调,配置、调试、安装、集成和联调所需的仪器、工具、设备。
2)安装调试前1周,投标人向招标人提供《系统安装调试申请书》和《系统安装调试方案》,《系统安装调试方案》经双方讨论确认后,招标人出具《系统安装调试申请和方案确认书》。《系统安装调试方案》作为安装的依据,至少包括以下内容:安装调试手册、安装调试进度安排、安装方法、调试方法、安装调试工具的准备、安装调试环境的准备、需招标人的配合工作、其他需要的准备。
3)投标人指派合格的、有经验的安装监督人员和工程师到现场,对系统进行安装调试工作。投标人有责任将安装过程和步骤做详细记录,并完成《系统安装调试过程记录》文档。招标人对于不能胜任的工作人员,有权要求投标人调换,费用由投标人负责。从安装调试到质保期结束,投标人进入现场施工的工程师须提前提供相关技术认证证明。
4)投标人的现场工程师对所有安装工作的正确性负责。安装过程中,因投标人人员责任(包括指挥错误和安装方案不当)造成的设备损坏,由投标人负责。
5)安装调试工作必须有招标人代表在场。招标人代表应在投标人技术人员的许可和指导下参加安装调试工作,投标人有责任对招标人技术人员提出的问题做出回答,并有责任在安装过程中要向招标人工程师详细讲解安装过程中的注意要点及系统运行过程中应注意的问题。在系统尚未正常运行前,必须随时按招标人的要求前往安装调试地点解决招标人提出的所有与安装调试有关的问题。
6)系统安装调试过程中,若技术文件需要更改,需要按更改流程进行审批,审批后,投标人免费提供改正后的全部技术文件。
7)每一次调试作相应的记录,并填写《系统安装调试报告》;如发生异常情况,则填写《系统安装调试异常事件及处理报告》。根据调试结果,完善最终的设备配置和系统的运行方案。
8)安装调试完成后,投标人向招标人提供系统的《系统安装调试报告》,报告中至少包括以下内容:系统的安装调试结果、系统安装调试中的问题及解决方案。招标人在进行检查确认无误后,招标人出具《系统安装调试验收报告》,经双方项目经理签字确认,方可进行到下一步工作。
4.2测试
1)系统测试
系统测试是在完成系统的安装和调试后,由招标人代表按验收程序进行现场测试其功能及性能。
2)测试方案
投标人应提交《系统测试方案》,招标人确认后,出具《系统测试方案确认书》;测试过程需要严格按照相关标准及规范由专业测试机构进行;测试过程产生的费用由投标人承担;测试内容应包括但不限于以下内容:
关键指标验证测试
性能指标(稳定性、压力、容错)测试
安全性能测试功能测试
3)测试报告
投标人在进行系统测试过程中,要及时填写《系统测试过程记录》;测试过程中针对发现的异常情况要及时处理,并填写《系统测试异常事件及处理报告单》。
在所有测试内容完成后提供正式的《系统测试报告》。测试报告的格式应简单明了,便于实际的操作,测试报告应包括但不限于如下内容:
测试说明及测试目的;
测试的开始、结束时间、地点及方法;
测试环境、产生测试数据的方法、系统配置图;
测试合格的标准;
数据打印输出的结果、图表等;
测试缺陷分析及整改方案;
测试结论、测试遗留问题备忘录;
测试人员名单;
测试负责人签字。
投标人撰写《系统测试验收报告》,经招标人同意后,双方项目经理签署。系统技术测试结束。
4.3验收
4.3.1初验
1)投标人在测试通过后,可编制《系统初步验收申请书》和《系统初步验收方案》,初验内容应包括但不限于本技术规范中所要求的内容,及完整的各类文档资料。
2)经招标人确认后,出具《系统初步验收申请及方案确认书》,并组织相关人员和机构,会同投标人进行项目初步验收。投标人配合招标人做好《系统初步验收过程记录》的填写,并参与初步验收并编写《系统初步验收报告》,投标人根据验收结果,完成《系统初步验收报告》。
3)初验合格后,双方签署《系统初步验收报告》。
4)初验不合格,投标人应立即就初验中发现的异常事件进行处理,并填写《系统初步验收异常事件及处理报告单》,直至符合招标人提出的各项要求并调试至验收合格。
5)招标人对初步验收的认可并不解除投标人对合同规定的保证责任。
6)初步验收过程中产生的费用由投标人承担。
4.3.2试运行
1)初验合格之日开始,撰写《系统试运行申请》和《系统试运行方案》,出具《系统试运行申请和方案确认书》后,按照《系统试运行方案》进行整个系统的试运行测试;系统试运行期为3个月。试运行过程中做好《系统试运行过程记录》、《试运行调试报告》的填写。
2)试运行结束后,投标人撰写《系统试运行合格报告》,双方签署《试运行合格报告》后,试运行完成。
4.3.3最终验收
1) 系统最终验收在系统试运行完成后15日内进行。
2)试运行结束后,提出《系统最终验收申请书》和《系统最终验收方案》,出具《系统最终验收申请和方案确认书》后,依据合同要求编写终验大纲和终验标准,并组织相关人员和机构,会同投标人进行系统最终验收。最终验收主要内容是对初步验收时存在的问题进行测试验收,处理完成试运行期间出现的异常情况,并对试运行期的设备状态进行总结。
3)终验内容应包括但不限于:
关键指标验证、性能指标(稳定性、压力、容错)、安全性能测试功能测试
完整的各类文档资料。
4)系统最终验收方式由双方协商,招标人最终予以确定。
5)系统最终验收过程做好《系统最终验收过程记录》,投标人应积极配合。
6)最终验收合格后,双方签署《系统竣工验收报告》。如有未尽事宜,双方签署《系统升级改造竣工验收备忘录》。
4.4技术支持及售后服务要求
1)投标方应对其在售后服务、技术支持方面的情况作出说明,例如:售后联系人、联系方式等;同时必须及时对故障进行修复。
2)在质量保证期内,包括升级、维护等,要求详细说明各类服务的范围、内容、方式。
3)质量保证期内,提供7×24小时原厂商标准技术支撑服务。
在接到用户请求后,供方有责任在保证期内提供以下形式的技术支持服务:
电话咨询
供方必须为用户提供技术援助电话,解答用户在系统使用中遇到的问题,及时提出解决问题的建议和操作方法电话咨询。
远程在线诊断和现场故障排除
对于电话咨询解决不了的问题,经用户授权供方可通过Internet远程登录到用户网络系统进行免费的故障诊断和故障排除。不排除指派技术人员赶赴现场的故障处理
4)质量保证期内原厂商提供一年4次巡检服务。
5)如投标人公司被兼并或收购,兼并或收购公司有责任继续对招标人履行合同义务。
4.5文档资料要求
1)投标人在编写技术方案时必须列出整个实施过程中所产生和按业主要求需向用户提交的详细文档清单,包括文档提交的计划安排。
2)投标人中标后在项目开始时、项目实施过程中和项目结束时应向用户提供充分的项目文档(所有文档必须是中文版本,且可以编辑),包括但不限于下述文档:
项目实施方案:投标人应提供项目实施方案,主要内容包括实施范围、策略、规范及标准、组织机构及人员配置、项目管理机制等内容。
项目实施计划书:投标人应提供项目实施计划书,主要内容包括每阶段的大致工期,每阶段的目标、每阶段的主要任务等内容。
培训方案:投标人应提供培训方案,主要内容包括培训计划、培训内容、培训时间、培训对象、培训目标等。
项目实施过程文档:各阶段的实施报告、测试报告、开发解决方案、功能说明书、数据字典(标准、规范)、 用户手册、测试报告、详细设计(包括操作界面、流程图)、验收报告、工作总结、会议记录等。
验收文档:项目验收时所需的各阶段工作报告、技术报告、试运行报告、项目总结、评估报告等。
其它文档:投标人还应提供与本项目实施和系统运行有关的其它文档和资料。
3)文档应有统一封面和编号,编号要与文档清单相一致。并在文档封面合适位置标出编号及项目文档字样。
4)文档应按编号次序、分类成册。
五 、培训
1)培训计划
培训计划应做好人员、设备设施,课程内容,明确方向,做到三个保证:资源保证、实施保证、质量保证。
总体培训策略如下所述:
培训内容先进性与实用性相结合。
培训教材采用专业教材,授课语言为中文。
对学员从严要求,确保培训质量。
培训内容
对技术维护人员的培训具备独立承担本职工作的能力。对招标人至少组织1场本项目现场培训,每场培训人数及时间不少于3人×2天。
培训内容包括:
服务的各项功能及使用方法,服务的运维管理技术培训,服务的配置及使用方法,
现场培训前至少提前一周向招标人提供详细的培训大纲,并征得招标人的同意。
2) 技术交流
不定期和招标人技术人员进行技术交流,依据目前系统运行维护中存在的问题,或者招标人就系统运行需要了解的内容开展各种专题讨论和技术交流。
六 、项目实施人员要求
考虑到本项目的重要性,本次项目建设需要投标方提供完善的项目组织和管理,以确保系统建设的及时性和质量要求。要求卖投标方详细描述为本次系统建设所能提供的实施项目组织,以及项目管理方案和人员配置方案。包括参与本项工程的工程负责人、技术负责人及相关技术人员名单
专人专项,要求卖方保证独立的专项安装调试团队,需列出详细的专项安装调试团队成员名单及相关信息;
投标方项目成员必须为投标方正式员工。
投标方不得随意变更项目人员,如果人员变更必须提前二周向招标方提交书面人员变更说明。
投标方提供项目组组成人员的详细清单。
项目实施人员包括但不限于如下人员:
沟通联络人员
沟通联络人员主要负责整体项目沟通协调。
学历:至少具备大学本科以上学历,建议硕士研究生及以上学历;
工作经验:至少2年工作经验;
人数:至少一人;
资质:具有相关专业资质为佳,如PMP,OCP等;
其主要职责是:
在客户整体项目进度安排下,协调相关资源推进项目
与领导汇报项目推进进度
协调各方资源进行相关环节推进
项目经理
项目经理是整个工程的执行管理者,对项目建设的进度、质量负直接责任。
学历:至少具备大学本科以上学历,建议硕士研究生及以上学历;
工作经验:至少3年工作经验;
人数:至少一人;
资质:具有相关专业资质为佳,如PRINCE2、PMP、IPMP、CPMP等;
其主要职责是:
负责实施并全面履行合同,处理合同变更,协调项目组与用户的关系,保证项目的顺利进行;
负责协调项目组内部关系,保证各小组的工作保持技术上的一致性;
对工程进度、质量和成本进行总体控制;
领导制订施工计划,审定各种施工方案;
定期地检查项目计划的完成质量和完成情况;
负责项目人员组织调配,向公司提出人员增减计划;
考核、评定项目人员的业绩;
组织工程验收、交工和结算;
对外重要文件的审定和签发。
项目实施人员
项目实施工程师是最终服务交付客户的成员。
学历:至少具备大学本科以上学历,建议硕士研究生及以上学历;
工作经验:至少3年工作经验;
人数:至少两人;
资质:具有相关专业资质为佳,如PMP,OCP等;
其主要职责是:
在项目经理安排和指导下,执行项目用户现场实施任务;
参与编写《用户手册》、《操作手册》和相关培训教材;
技术支持服务人员
技术支持工程师是售后服务团队中必不可缺的一员。
学历:至少具备大学本科以上学历,建议硕士研究生及以上学历;
工作经验:至少2年工作经验;
人数:至少一人;
资质:具有相关专业资质为佳,如PMP,OCP等;
其主要职责是:
负责人员协调安排工作,制定服务规范;
完成安装、调试、演示;
完成培训和讲解;
协助解决用户在使用过程中遇到的问题,并提供支持。
撰写文档及数据分析报告;
根据用户需求、结合功能提供合适的解决方法;
项目测试人员
由专业测试人员组成,负责全面测试。
学历:至少具备大学本科以上学历,建议硕士研究生及以上学历;
工作经验:至少3年工作经验;
人数:至少一人;
资质:具有相关专业资质为佳,如PMP,CSTE,ISTQP,国家软考认证等;
主要职责包括:
参与进行测试活动;
编写确认测试相关文档;
项目验收人员
负责完成项目验收阶段的各项准备和验收总结工作。
学历:至少具备大学本科以上学历,建议硕士研究生及以上学历;
工作经验:至少3年工作经验;
人数:至少一人;
资质:具有相关专业资质为佳,如PMP,OCP等;
主要职责包括:
参与进行验收活动;
编写确认验收相关文档;
验证总结
项目顾问人员
根据需要对项目各个方面提供咨询协助和技术支持。由相关方面的专家组成。
七 、项目实施安排
7.1项目进度
本项目实施时间、实施的难度和风险,提出可行的最短的实施计划和最佳的人员配备,实施方案至少包括以下内容:
1)提供实施方法论,实施详细步骤,说明每个步骤中的关键工作。
2)工程进度表:需综合考虑自身的技术实力及人员力量,兼顾买方对本工程进度的要求,针对本系统的建设,提出确实可行的最快时间进度安排,提供进度图表应至少明确几个关键点,比如:
到货时间(若投标人有第三方采购)
需求调研完成时间;
程序设计和开发时间;
系统安装调测时间;
系统割接时间;
验收测试时间
等。
3)人员组织配置;并说明每项工作人员数量和工作时间。
7.2项目实施
在应答文件中对项目实施相关内容做出阐述,包括但不限于实施范围、实施要求、实施内容、实施计划及相关承诺。
7.3项目管理
在应答文件中对项目管理相关内容做出阐述,包括但不限于管理制度、人员组织架构、项目管理方法、质量控制方法、沟通方法、流程控制方法等。
八 、应急响应方案
当灾难发生或生产系统发生故障时,生产系统不能对外继续提供服务,此时必须及时将系统切换至灾备系统,保证对外服务不中断或中断时间尽可能少。所以需要投标方提出完整、可执行的应急响应方案。方案中应包括但不限于:1、应急体系、应急规章制度建立及详尽内容;2、人员配置及职责;3、应急预案、资源保障计划;4、应急统筹管理指挥及联动计划;5、灾难恢复相关流程及指标;6、损失评估和补救计划;7、应急演练工作计划、场景、演练方案、演练时间、演练达到目的等。
8.1应急体系
灾难或生产系统故障一般都是在毫无准备的情况突然发生,所以需要事前建立完备的应急体系,制定完善的应急规章制度,才能在灾难发生时有条不紊、忙而不乱的按预订计划进行应对。
投标人应根据既有容灾应急项目经验,提供完善、完备、具备可执行性的应急体系建设指导意见、内容和相关应急规章制度详尽内容,应能帮助招标人建设适合本项目、本组织特征的应急体系和应急规章制度。
8.2人员配置及职责
投标人应提供针对灾难应急响应时的人员配置计划,包括但不限于,人员组织架构,人员职责,人员具体工作、汇报及执行路径等。将灾难发生时,应急对应的工作细化到人或职位,灾难发生时,达到每个相关人员都明确自己的责任和具体工作的结果,保证灾难应急响应工作有序、有效、高效的展开和执行。
8.3应急预案,资源保障计划
灾难应急预案的制定应遵循但不限于完整性、易用性、明确性、有效性和兼容性的原则。
完整性是指灾难应急预案(以下称预案)应包含灾难应急恢复的整个过程,以及灾难应急恢复所需的尽可能全面的数据和资料;
易用性是指预案应运用易于理解语言和图表,并适合在紧急情况下使用;
明确性是指预案应采用清晰的结构,对资源进行清楚的描述,工作内容和步骤应具体,每项工作应有明确的责任人;
有效性是指预案应尽可能满足灾难发生时进行恢复的实际需要,并保持与实际系统和人员组织的同步更新;
兼容性是指灾难恢复预案应与其他应急预案体系有机结合。
因灾难应急预案制定原则包含完整性、易用性、明确性、有效性原则,所以如果在灾难发生时,没有相应的资源可以利用,那么应急预案也达不到事前想定效果。所以在制定灾难应急预案的同时,应制定灾难发生时,启动应急预案的资源保证计划。应包括但不限于人、物、场所、通信、电力、IT信息资源、网络资源等,及相应资源的数量,应达到的能力指标和响应时间等。
8.4应急统筹管理指挥及联动计划
在灾难发生或生产系统发生故障后,应按照人员配置中的组织架构,进行统一指挥、统筹规划,达到各部门协调配合、高效应急对应的结果。所以应建立应急统筹管理指挥及联动计划。确保横向、纵向的各相关部门、人员、资源等能在统筹规划下,“行动如一人”,高效,有序的进行应急对应。
8.5灾难恢复相关流程及指标
投标方应针对本项目特点提供灾难恢复相关流程及指标。应包括但不限于如下步骤:
1.灾难上报
灾难及故障通常由一线值班人员最先发现。由于值班人员未必有能力判断灾难影响,这阶段的主要工作是收集资料上报执行组进行灾难评估。
当生产中心应用系统数据丢失或破坏需要从集中灾备中心恢复时,即构成上报条件。
一线值班人员发现灾难或故障应立即按规章制度进行上报。
灾难上报过程执行要点:
在灾难出现的情况下,应尽量保证人员的安全。
收集资料:受影响设备/设施/环境情况:服务器、光纤交换机、存储、磁带库、磁带、网络设备、广域网线路、电源、空调、电线、光纤等;机房环境破坏情况;
灾难情况:灾难原因,地震、雷电、风灾、雹灾、雪灾、水灾等自然灾害;污染;火灾、水灾等结构性破坏;外部***、计算机病毒、软硬件故障等人为破坏/过失等;员工伤亡情况;
灾难发生时间、估计恢复时间;
其他情况。
向执行组汇报资料,由执行组进行灾难评估
灾备中心监控人员发现生产系统故障告警而无法与生产中心联系时,应负责上报。
2.灾难评估
灾难恢复执行组根据灾难引发原因,目前业务和系统的情况、可行的恢复手段、所需的恢复时间,决定采用何种恢复方式的建议,编制灾难评估报告,并且提交评估报告给领导小组。
投标方应根据本项目特点和相关经验提供灾难评估的时间指标,该指标应处于合理、可达到的范围。
灾难评估执行要点
值班的执行组成员根据上报资料,初步了解情况;
尽可能邀请相关人员召开会议;
分析资料包括不限于以下内容:
受影响设备/设施/环境情况:服务器、光纤交换机、存储、磁带库、磁带、网络设备、区域广域网线路、电源、空调、电线、光纤等;机房环境破坏情况;
灾难情况:灾难原因,如地震、雷电、风灾、雹灾、雪灾、水灾等自然灾害;污染;火灾、水灾等结构性破坏;外部***、计算机病毒、软硬件故障等人为破坏/过失等;员工伤亡情况;
灾难严重程度、灾情的发展趋势;如需要,咨询多方技术人员(员工,集成商,合作伙伴,设备供应商等);
研究可行的应对措施,估计恢复时间;评估要尽快完成,评估报告要尽早提交;
提交评估报告给相关领导组审阅,确定数据恢复方式。
3.数据恢复
建议灾备中心和生产中心相关灾难恢复人员根据规章制度和应急预案相关步骤,完成数据恢复工作。
投标方应根据本项目特点和相关经验,根据不同灾难和故障程度提供相应的数据恢复时间和数据指标。可参考标准的RTO与RPO指标。
数据恢复过程执行要点:
暂时中断生产中心到集中灾备中心的数据复制设置;
确认生产中心公司生产环境应用系统已经恢复完毕;
工作人员将数据副本恢复到系统中;
检查操作日志,补回灾难期间离线作业的数据,并进行检查,确保业务数据的完整性,一致性;
启动应用系统;
重新启动生产中心到集中灾备中心的数据复制设置。
4.消息发布措施
为了制止和减少流言,公司高层领导应出面稳定员工、合作伙伴、股东等的不安情绪,因此需要有统一的渠道完成对内对外的沟通。
消息发布过程对内措施执行要点:
最好由专人负责,以维持信息的一致性;
除常用的通讯手段(如电话)外,应考虑备份的通讯手段,如Email、Web、电台等。
消息发布过程对外措施执行要点:
对外公布信息必须统一口径;
负责对外发布新闻的成员必须具备随机应变的能力;
通过培训,员工应了解对外发布新闻的行政管理组联系方法,做到不与任何非灾难恢复成员讨论该灾难事件;
行政管理组成员要预先建立和领导的沟通渠道、流程,落实与传媒会见的时机、时间和地点。
8.6损失评估和补救计划
当灾难应急响应方案生效后,应对灾难或故障造成的损失进行评估,同时应按照规章制度开始着手制定相关的补救计划。
投标方应根据本项目特点和相关经验,提供可执行的损失评估方案或模型,及不同程度损失的情况下的相关补救计划。
8.7应急演练工作计划
应急演练是指模拟灾难发生,通过系统切换和系统回切的操作,验证应急响应方案。
演练的目的是确保灾备系统的可用性和灾难应对计划的有效性,在启动灾备中心接管应用时,验证灾备系统是否可达到预定的指标;培训相关维护人员,优化灾备相关流程。
灾备系统建设完成后,为了确保灾备系统在发生灾难时能够发挥作用,必须定期或不定期的进行灾备演练。根据在演练过程中是否真正进行系统的切换,灾备演练可以分为模拟演练与真实演练。
模拟演练主要是为了检验在发生实际灾难后,参与灾难恢复的相关人员是否能够根据规划好的应急预案,有序可控地进行灾难恢复工作。
真实演练不仅要检验灾难应对计划的有效性,而且要验证灾备系统是否能够实现正常的切换和回切。
8.7.1 切换流程
在实施灾备系统的演练前,必须明确模拟的场景、演练的范围、参与的人员、执行的流程等内容;同时,要针对演练过程中存在的风险,制定相应的应对措施。
演练不能造成生产系统的长时间中断,更不能演练之后生产系统无法正常运行,造成人为的灾难。
演练是灾难应对计划的最好验证手段。演练过程中,应详细记录各个重要环节的时间点,用于考核灾备系统和生产系统的各项指标。演练后应及时总结经验,对发现的问题应及时解决,需要修改或优化的流程要限期进行修改和完善工作。
8.7.2 演练流程
为了达到演练的目的,演练的流程必须覆盖全面、严格执行。
演练主要步骤包括:制定演练计划、审批演练计划、演练启动、消息发布、演练切换、验证、演练回切、总结。
1.制定演练计划
演练计划需要根据灾难应对计划制定,其内容主要包括演练方式、范围、参与人员、时间进度等。在每一次演练之前,由执行组负责制定具体的演练计划,各责任工作组提供支持。
制定演练计划执行要点:
需明确以下内容:
演练的方式和范围。
演练的场景:确定能够完成演练目标的事件,包括灾难模拟或其他影响业务连续性的事件。
演练的潜在风险及应对措施。
演练参与的人员及职责。
演练的时间和进度安排。
要针对演练过程中存在的风险,制定相应的回退计划,以保证在演练失败的情况下,生产系统能回退到正常状态。
2.审批演练计划
演练计划审批是对演练的可行性进行判断,包括演练方案是否可行、演练时机是否恰当等。
演练计划需要得到领导组的批准。
演练计划执行要点:
如果采用真实演练的方式,演练会对生产系统造成一定的影响,因此,演练计划可能还需要得到相关领导批准。
3.演练启动
演练计划得到批准后,执行组启动演练。根据演练计划,通知相关人员。
演练执行要点:
在演练启动阶段,主要是根据应急预案,对灾难恢复场景进行模拟,演练灾难应对计划;
灾难上报:由日常维护人员模拟灾难发生,并向执行组上报灾难及相关信息;
灾难评估:执行组在收到灾难报告后,对灾难进行评估,并向领导组提交灾难评估报告,供领导组决策;
决策:领导组根据灾难评估报告进行决策,通知执行组由灾备中心接管应用;
灾难恢复启动:执行组组长立刻通知执行组成员及其他相关人员到位,成立灾难恢复指挥中心,协调各责任工作组成员有效地开展工作,监控灾难恢复的进度。
4.消息发布
演练可能会影响和中断系统的正常运行,因此需要有统一的渠道完成对内对外的沟通。具体的内容参见灾难应对计划。
消息发布执行要点:
采用适当的方式进行消息发布;
对外公布信息必须统一口径;
必须指定负责对外发布新闻的成员。
5.演练切换
真实演练包括演练切换,模拟演练不包括演练切换。
真实演练的演练切换应与应急响应方案描述的切换一致。
九 、维保服务/质保期
1)质保期
本服务的保修期为自服务正式提供之日起的12个月。
2)维保服务
原厂商提供7*24小时不限次数远程支持服务,服务热线400-168-2700。
安装调试:对客户购买的服务进行安装、调试、试运行,保证服务的正常运行,各项功能正常,性能达到预定指标。
顾客回访:每间隔一定的时间,对客户进行回访,了解使用情况和存在的问题,解答客户的疑问并了解客户对服务的意见。
远程技术支持:当服务运行出现故障时或应用户要求对系统进行调整时,在远程方式可以解决问题的情况下,我公司将提供远程支持服务。
我公司将通过电话、email和远程登录等方式对客户系统中出现的问题,在需要远程登录方式时,需要用户提供远程拨入服务,并提供相关系统的登录权限。
现场支持:在系统保修期内,如果出现了紧急故障而必需现场解决问题时,派遣工程师在客户现场对出现的故障进行现场解决。
技术咨询:解答客户提出的关于服务的技术问题,协助客户对存储系统进行调整和规划,使客户存储系统更优化,更可靠,更完善。
服务升级:在服务有效期内,基于现有版本上出现新的Bug fix和Patch时,将提供升级服务。
运行监控:在具有远程接入条件下对客户系统上服务运行情况进行运行监控,了解系统运行情况和定制计划执行情况,定期向客户提交监控报告。
十 、其他
投标人可根据对标书的理解,提供其他相关文档或证明材料。
来源:oschina
链接:https://my.oschina.net/u/4334778/blog/4341859