某银行数据中心搬迁整体实施方案
某银行机房搬迁项目
搬迁策略报告
目录
1概述 ................................................................................................................................................................... 3
1.1 某银行数据中心搬迁目标 .................................................................................................................. 3 1.2 某银行数据中心搬迁范围 .................................................................................................................. 3 1.3 搬迁策略制定的意义 .......................................................................................................................... 5 1.4 搬迁策略制定 ...................................................................................................................................... 6
1.4.1 搬迁策略制定方法 .................................................................................................................. 6 1.4.2 搬迁策略制定原则 .................................................................................................................. 6 1.5 某银行数据中心搬迁方式 .................................................................................................................. 7 1.6 某银行数据中心搬迁策略制定的重点和难点 ................................................................................... 7 1.7 搬迁策略阶段工作总结 ...................................................................................................................... 8 1.8 搬迁策略的总体思路及整体过程 ...................................................................................................... 9 1.9 某银行数据中心搬迁的特点 ............................................................................................................ 10 2 某银行数据中心搬迁策略分析..................................................................................................................... 11
2.1 搬迁策略的要点 ................................................................................................................................ 11 2.2 搬迁策略分析内容 ............................................................................................................................ 11
2.2.1 IT架构分析 ............................................................................................................................ 11 2.2.2 应用关联分析 ........................................................................................................................ 14 2.2.3 业务中断影响分析 ................................................................................................................ 15 2.2.4 批处理关联分析 .................................................................................................................... 15 2.2.5 系统保护分析 ........................................................................................................................ 17 2.2.6 物理共享分析 ........................................................................................................................ 18 2.2.7 设备冗余分析 ........................................................................................................................ 20 2.2.8 机房环境分析 ........................................................................................................................ 22 2.2.9 风险分析 ................................................................................................................................ 26
3 某银行数据中心搬迁策略 ............................................................................................................................ 29
3.1 某银行业务系统搬迁方式 ................................................................................................................ 29 3.2 搬迁批次划分要求 ............................................................................................................................ 29 3.3 搬迁各批次分析 ................................................................................................................................ 33
3.3.1 批次1搬迁分析 .................................................................................................................... 33 3.3.2 批次2搬迁分析 .................................................................................................................... 34 3.3.3 批次3搬迁分析 .................................................................................................................... 45 3.4 搬迁过程中的备份策略 .................................................................................................................... 46 3.5 搬迁中的容灾保护 ............................................................................................................................ 48 3.6 搬迁的应急预案 ................................................................................................................................ 48 3.7 某银行数据中心搬迁实施组织架构建议 ......................................................................................... 51
3.7.1 搬迁实施总行领导工作委员会职责 .................................................................................... 52 3.7.2 搬迁实施工作组职责 ............................................................................................................ 52
4 总结 ................................................................................................................................................................ 61
某银行机房搬迁项目策略汇报
某银行数据中心整体搬迁策略报告
1概述
1.1 某银行数据中心搬迁目标
某银行现在使用的机房于1997年建成,位于某市深南东路,随着业务不断发展,业务系统持续增加,机房区间、机房电力空调等基础设施容量趋于饱和,当时设计的能力已难以满足某银行业务发展需要。
位于某市保税区市花路的新数据中心,与现机房距离为15公里,预计2010 年2 月12日完成机房整体建设。为满足业务发展需要,某银行需尽快实施新数据中心的搬迁,使数据中心的综合管理和生产运行能力上一个新台阶。
某银行初步计划于2010 年3月份实施现有数据中心的整体搬迁,搬迁期间整个银行业务将全部中断,其对外影响非常重大。某银行数据中心搬迁的目标为:完成当前数据中心及中心机房内部所有IT基础设备的现状梳理、根据某银行自身的业务特点和业务需求,制定出符合某银行的搬迁策略和详细方案,保障业务系统顺利搬迁到新数据中心,将搬迁的风险以及搬迁对业务的影响降到最低。
1.2 某银行数据中心搬迁范围
某银行数据中心搬迁的范围主要是某银行位于某市某路某号,某银行大楼数据中心的67个计算机系统101个业务系统,包括核心业务系统、网银系统、外联系统等。其中: 计算机设备1063台,包括:
主机 小型机 服务器
SAN存储、磁带库、磁带机 网络设备
UPS、空调、加密机等其他设备 机房 范围
5楼大机房 、小机房
第3页
某银行数据中心整体搬迁策略报告
24楼信用卡测试设备 27楼资产管理部
5楼动力机房(设备利旧) 11楼测试机房
某银行分行 (部分测试设备) 不包括:
11楼集中作业部,22楼金融市场部 1楼机房 ,某银行分行 库房
具体的业务系统如下表所示。 类别 核心业务 业务系统 综合客服、信用卡、个贷 卡交换、综合理财、黄金交易、个人实盘外汇买卖、前置类业务 开放式基金代销、资讯平台、保理、商业汇票、银银合作、资金交易前中后一体化、现代化支付、供应链金融、第三方存管、联网核查公民身份信息、前置、分行前置等 网上银行、95501客户服务中心、终端、全行b/s查渠道类业务 询机、统一消息平台、金卫士、网上招聘、内部网服务器等 技术支撑 密码服务系统、通讯集群网关、加密机 资产托管、信贷风险管理、国际业务处理、Swift、电业务管理类 子数据存储、电子式储蓄国债、统一数据补录平台、电脑验印、银税信息共享、统一征信、反洗钱监测报告、反恐怖融资黑名单、关联方信息管理、员工买卖股票申报等 3个 18个 11个 子应用系统 4个 42个 第4页
某银行数据中心整体搬迁策略报告
SAP、客户关系管理、财富管理、资产负债、综合报表、金融统计统一报送、事后监督、ODS等 OA、学习管理、人力资源等 ITSM 证券资金清算 6个 1个 1个 12个 经营分析 办公管理 科技管理 分行 1.3 搬迁策略制定的意义
搬迁策略是搬迁实施的指导原则,一个好的搬迁策略可以帮助某银行安全、平滑地实现系统搬迁和业务切换,反之,一个不好的搬迁策略则会给搬迁工作带来很多的麻烦,严重时甚至会造成搬迁的失败;某银行搬迁策略制定的主要意义在于: 保障业务系统顺利搬迁:
全面分析应用关联和物理关联 制定业务和数据安全保障建议 制定应急预案的建议 降低业务中断影响:
分析业务中断影响
保障业务按优先等级进行恢复 缩短重要业务的中断时间 降低搬迁风险:
多方位的风险识别、风险分析 制定风险应对策略建议 提高搬迁效率:
规划搬迁各批次的应用及设备清单 规划搬迁时间 梳理搬迁前的准备工作
第5页
某银行数据中心整体搬迁策略报告
1.4 搬迁策略制定
1.4.1 搬迁策略制定方法
在整个搬迁策略制定的过程中,我们采取了神州数码的搬迁策略制定方法。如下图所示。
首先,通过访谈、问卷、现场勘查、现有资料分析,我们对某银行的信息系统基础架构进行了全面的了解,在此基础上,从IT基础架构、应用关联关系、业务中断影响、批处理关联、系统保护现状、物理设备共享关系、设备冗余情况、机房现有环境、人员组织架构及搬迁风险等方面,全面进行了搬迁分析,通过综合考虑各方面的要素,制定出某银行数据中心的整体搬迁策略,包括各应用的搬迁方式、搬迁批次、搬迁阶段临时备份策略、搬迁过程中的数据保护方式、搬迁组织架构、搬迁应急预案等重要策略。
1.4.2 搬迁策略制定原则
在搬迁策略策略的制定过程中,我们考虑了以下原则:
采取先易后难,循序渐进的原则进行分阶段、分步骤的实施,从而可以降低搬迁的系
第6页
某银行数据中心整体搬迁策略报告
统性风险,减少业务停顿次数和总体停业时间。
按业务等级、应用关联和业务中断影响,决定搬迁过程中业务恢复的优先顺序以及不
同应用的搬迁方式。
制定完善的核心应用和数据保护方式,降低搬迁对核心数据和系统的风险。 保障重要应用系统应急环境的建立,缩短搬迁过程的故障处理时间。
搬迁过程尽量保持原有IT服务水平(Service Level),避免增加单点运行风险。 提前测试和验证新机房的环境、网络及数据,保证的搬迁过程的平滑过渡。
1.5 某银行数据中心搬迁方式
通常数据中心的搬迁分为三类:
物理搬迁:物理设备整体搬迁。
业务系统切换:数据、应用整体切换;无物理设备的搬迁过程。 混合型:部分数据、应用切换;部分数据、应用直接物理搬迁。
基于对某银行现状的分析和实际的业务连续需求,建议某银行采取“混合型”的搬迁方式进行数据中心搬迁,部分系统的数据、应用采用切换方式,部分系统直接搬迁。其中各业务系统的搬迁方式如下表所示: 业务系统 核心业务系统,关键7×24对外系统 对外服务5×8,7x15业务系统 对内业务系统 单系统搬迁方式 系统切换 优点 缺点 平滑切换; 需要专有的备用系统环完整的系统和数据保护;境,技术实施难度和投业务中断影响最小 入较大 完整的数据保护; 无需专有的备用环境 业务中断时间较长 依赖本地数据备份保护方式,业务中断时间长 存储切换,服务器物理搬迁 设备物理搬迁 1.6 某银行数据中心搬迁策略制定的重点和难点
某银行数据中心搬迁策略的重点和难点主要有以下几方面:
第7页
某银行数据中心整体搬迁策略报告 应用关联复杂:从业务持续角度出发规划搬迁方案,需要充分考虑应用间的千丝万缕
的联系。
业务中断影响大:在制定搬迁策略时需要最大限度地减少中断时间,降低中断给业务
带来的影响。
应用搬迁和网络的割接同时进行:这样增加了搬迁的难度,需要确定网络割接所影响
的业务系统,保障应用系统搬迁所需的网络环境。 应用和设备数量较多:无法一次搬迁,需要分批搬迁。 搬迁时间紧迫:三月底左右需要完成全部设备搬迁。
备份设备(STK带库)无法同时搬迁就位:需要考虑临时的备份方案。 设备冗余有限,不能全部切换:可以采用核心业务切换,其他系统搬迁的方式。 应用间数据交互量大:搬迁次序需要考虑业务间访问所造成的网络性能影响。 存储空间不足:需要分批进行2台EVA上数据的同步;同时需要租赁或新购一台NAS
存储。
需要定义业务恢复时间,保护级别等关键指标,考虑保障数据安全和业务持续的技术架构,编写业务恢复方案,应急预案,测试方案等详细步骤来满足业务持续的要求。
1.7 搬迁策略阶段工作总结
搬迁策略阶段主要工作内容: 进行了62场访谈和研讨:
涉及90多名应用管理员、应用开发人员和系统、网络、设备、操作室主管、经理
及管理员 52场应用访谈
3次网络现状和网络割接研讨 4次系统、备份、存储现状研讨 1次操作室日常操作管理现状访谈 2次搬迁策略研讨会 完成了对103个应用系统的访谈
第8页
某银行数据中心整体搬迁策略报告
绘制了57份应用系统关联图 编制了40份单系统搬迁分析报告 整理了各应用系统的详细设备信息
制定了总体应用系统业务关联图、应用总表 应用系统批处理关联总表 完成了机房的初步勘查工作
老机房和新机房现场勘查 整理了各机柜的详细设备信息
该阶段得出单应用分析报告、搬迁业务影响分析、定时批量任务关联分析、应用关联分析、业务恢复时长分析、应用设备对应清单、机柜设备清单等文档。
1.8 搬迁策略的总体思路及整体过程
批次 思路 为后续关键批次的搬迁提供必要的技术条件,同时验证新数据中心的网络、搬迁的路线、 搬迁对外服务7×24或7×15的业务系统、以及相应紧密关联的对内业务系统。将对外的业务影响降低最低 搬迁剩余的业务系统、开发系统以及利旧的设备 系统 影响较小或独立的业务系统、核心系统的备机,他们的搬迁不会对银行的业务造成外部影响 核心业务系统,一般都是7*24的业务系统,对银行的外部影响较大 一般是5×8的业务系统,对外部的影响较低 批次一 批次二 批次三 由于某银行数据中心需要搬迁的设备和应用比较多并且业务对外影响大,故我们采用分批搬迁,搬迁的总体思路如上表所示。
整个搬迁过程如下图所示。
第9页
某银行数据中心整体搬迁策略报告
2月20日2月5日EVA8100-2及相关业务系统搬迁3月6日核心类系统的备机搬迁第二批次搬迁第一批次搬迁•部分对内业务系统搬迁•网络设备搬迁•网络线路割接•核心业务系统切换•主要业务系统搬迁3月20日3月底4月初第三批次搬迁•剩余业务系统、安全、网络管理类系统•DMX1000、DMX3、EVA8100-1、STK带库搬迁•利旧设备:UPS、空调等搬迁准备工作•新旧机房网络连通、测试完成;新机房线路测试完成•DMX上第一批次系统数据同步•EVA8100-2至新机房EVA8400数据同步•过渡备份环境搭建第二次数据同步•DMX上第二批次系统数据同步•EVA8100-1至EVA8100-2数据同步(部分业务系统)及数据验证、测试第三次数据同步•EVA8100-1至EVA8100-2数据同步(剩余业务系统SAP、OA)及数据验证、测试
从上图可以看出在各批次搬迁前必须具备一定的前提条件,在之后的章节中我们将做详细的讨论。
1.9 某银行数据中心搬迁的特点
通过对某银行数据中心现状的分析以及基于数据保护的要求,某银行数据中心搬迁将会具有以下特点。如下图所示:
第10页
2 某银行数据中心搬迁策略分析
数据中心搬迁策略分析是搬迁策略制定的基础,分析的目的是制定搬迁策略,分析的范围都是围绕搬迁策略的考虑要点而进行。因此本章将首先简单介绍搬迁策略的要点,然后详细描述某银行搬迁策略分析的过程,及其对搬迁策略制定的影响。
2.1 搬迁策略的要点
搬迁策略的要点包括: 整体搬迁方式
搬迁过程中的数据保护方式 搬迁批次划分
各批次应用系统清单
各批次搬迁系统的设备数量统计 各批次搬迁时间
各批次内应用系统搬迁先后顺序 各业务中断和恢复时间分析 各批次搬迁前的准备工作 搬迁过程中的数据备份策略 搬迁过程中的应急环境策略 搬迁组织架构策略
2.2 搬迁策略分析内容
2.2.1 IT架构分析
某银行的IT总体架构如下图所示,
核心区包含了绝大部分对外对内的业务系统,将与新机房核心区连通;
网银区包含的系统有:网银及数字证书、外汇系统、黄金系统、前置-银企直连、
某银行机房搬迁项目策略汇报
某银行数据中心整体搬迁策略报告
公路收费、个贷系统(预审批)、网站、离行办公系统(VPN); 外联区包含的系统有:金卫士、统一消息平台、电子储蓄国债。
核心区包含了绝大部分对外及对内业务系统,将与新机房核心区联通 网银区系统: ➢ 网银及数字证书、 ➢ 外汇系统 ➢ 黄金系统 ➢ 前置-银企直连、公路收费 ➢ 个贷系统(预审分行接入
专线
外联专线接入 外联区系统: ➢ 金卫士 ➢ 统一消息平台 ➢ 电子储蓄国债
从IT总体架构可以看出,搬迁过程中,由于网络分区的现状及部分网络设备需要搬迁,对外业务相关系统最好一起搬迁,核心区内的业务,由于新老机房核心区联通,可以按多个批次进行搬迁。但整个搬迁过程中,网络环境的具备与快速恢复将是搬迁的重要条件。
考虑数据安全的重要性,某银行在新机房采购了DMX3和HP存储,并计划采用数据同步复制结合数据切换的方式,从而避免数据丢失或者存储故障而带来的严重后果。
当前的SAN与存储架构如下图所示。
第12页
某银行数据中心整体搬迁策略报告
DMX-3EVA8100-1EVA8100-2MainframeDMX1000200B200BDS-24-M24900B5100BDS-24-M24900B5100B ServersServersOpenOpen
新机房采购的DMX3其空间容量比较充分,可以同时和老机房DMX3、DMX1000进行数据复制,而新机房新购的HP空间则容量相对有限,不能同时存放EVA8100-1,EVA8100-2的数据,因此,在数据复制过程中,只能先复制其中一台EVA存储,等数据复制完成并将相关系统搬迁到新机房后,再将空闲存储搬迁至新机房,并和另外一台EVA存储进行数据复制同步。这就要求搬迁策略必须充分考虑HP存储数据复制时间的要求。
当前存储与应用系统的对应关系如下图所示:
第13页
某银行数据中心整体搬迁策略报告
FAS3140-NAS DMX1000 DMX3 EVA8100-1 EVA8100-2 DS4300 对外7×24或7×15业务系统 个人实盘外汇买卖 开放式基金代销 国际业务处理 综合客户服务系统 卡交换 信用卡系统 新代收代付 信贷风险管理系统 银税信息共享 信用卡 个人贷款 黄金交易 网上银行 OPICS 现代化支付 各前置系统 分行前置 总行前置 保理业务 统一消息平台 终端系统 电子存储系统 对外5×8业务系统 电子式储蓄国债 商业汇票 统一征信 电子存储系统 网银系统 商业汇票 征信系统 资产托管系统 对内服务系统 信用卡催收管理 财富管理 ITIL ODS、SAP 事后监督系统 事后监督 人力资源管理系统 (开发) OA系统、CRM 零售信贷ODS(备机) 信用卡系统-测试 信用卡反欺诈 终端整合测试 综合报表系统 信用卡数据集市 ODS 从图中可以看出EVA8100-2对应的系统比较少,因此可以先行搬迁,EVA8100-1上的系统比较多需要分批次搬迁。资产托管系统连接单独的存储。
另外,电子存储系统、网银系统、商业汇票、征信系统、ODS连接NAS,因此,也需要考虑NAS的同步复制关系,但目前并没有采够新NAS,因此搬迁策略中要考虑相应的NAS问题。
2.2.2 应用关联分析
通过前期的应用访谈以及对现有信息的收集,我们对各应用的关联的系统进行分析汇总得出应用关联分析表,如下所示。
根据以上的应用关联关系表,在相关系统搬迁至新机房后,就可以判断相关业务测试的可行性以及对外恢复的能力。
根据应用关联分析,结合某银行的应用服务等级定义,可以发现搬迁过程中,各应用的恢复等级如下:
第14页
某银行数据中心整体搬迁策略报告
1. 综合客服、信用卡、个贷是对外服务的核心,需要最优先的恢复; 2. SNA网关、前置平台是其他对外服务到综合客户服务的关键通道,也需要最优先的恢复;
3. 网银、终端系统、ATMPCV、多媒体自助、金卫士是对外服务的窗口,需要优先恢复;
4. 卡交换是银联接入深发行的通道,需要优先恢复;
5. 网银的业务与现代化支付关联紧密,需要优先恢复现代化支付; 6. 其他系统按应用服务等级进行恢复
2.2.3 业务中断影响分析
通过对访谈信息的收集及分析得出业务中断影响分析表,如下图所示。
根据业务中断影响,可以发现对外服务的业务需要尽量减少停机次数,并需要尽可能地建立专用应急环境。
2.2.4 批处理关联分析
各应用批量关联表如下图。-详见交付文档-某银行 Relocation_搬迁策略分析
第15页
某银行数据中心整体搬迁策略报告
其中红色批量任务是需要按时完成的任务,很难进行更改。因此系统搬迁时,需要考虑这些时间段,尽量保证这些批量任务在完成后再进行设备搬迁或者系统切换。 另外,和主机直接依赖的批量任务有:
直接关联应用 通道应用 批量名称 扣款、还本、付息 金抵利:到期自动转存批量 金抵利:回盘处理 报表生成 国际业务晚间批量程序 OBS批量 OPICS批量 原批量时间 22:00~23:00 6:00-6:30 18:30~21:00 备注 主机批前任务 主机批后任务 主机批后任务 主机批后任务 主机批前任务 主机批前任务 主机批前任务 总行前置 综合理财系统 总行前置 总行前置 国际业务处理 OPICS 商业汇票系统 新终端系统 日终批量脚本 21:45~6:10 给ODS送数 给rtc送报表 给ODS提供数据 备份 主机回盘处理 更新机构表、行部表、人力资源表、角色互斥批量 发送批量文件 更新柜员状态 生成报表 服务重启 个贷批量计提扣款 日间批量 存抵贷收益批量支付 日终作业 换日作业 商户入账批量 第16页
主机批前任务 3:00~3:15 4:00~4:30 4:30~4:45 6:00~6:20 21:05~21:20 23:01~23:10 23:10~23:30 23:30~23:59 20:00~0:30 17:00~18:00 21:30~21:45 8:00~8:15 21:00
主机批后任务 主机批后任务 独立批量 独立批量 主机批后任务 独立批量任务 主机批前任务 独立批量 独立批量 独立批量 主机批前任务 主机批前任务 主机批前 主机批前 主机批后 主机批前 个贷系统 个贷存低贷系统 保理系统 网上银行
批量代收代付系统 总行前置 某银行数据中心整体搬迁策略报告
卡交换系统 黄金交易系统 个人外汇实盘买卖系统 0:00 22:00(1min) 0:20~2:20 2:00~2:30 3:00~5:30 3:00~3:05 6:00~6:10 6:30~6:40 6:30~6:40 1:30~1:40 6:00~6:10 前置 电子式储蓄国债系统 电子数据存储系统 ODS 新代收代付批量系统 ATMPCV系统 信贷风险管理 客户信息同步 某前置hibatchnoecho.sh 其他分行hibatchkeep.sh 日终处理 JGP-CONVERT ODS批处理 hibatchkeep.sh 更新机构表 启动主机与前置,ATM与前置对帐 给ODS供数 从ODS取文件,该文件来自主机 2:00~6:00 5:00~6:00 17:00~17:45 3:00~16:00 23:40~11:30 2:00~3:30 6:10~6:20 3:00~3:10 2:00~2:10 4:00-10:00 主机批后 主机批后 主机批后 主机批前 主机批后 主机批后 主机批后 主机批后 主机批后 独立批量 主机批后 主机批前 主机批前 独立批量 主机批后 独立批量 主机批前 独立批量 独立批量 独立批量 独立批量 主机批后 集团自动划拨 日终批量 日始批量 RMAN数据库备份 黄金批量 行情备份 前置日志备份 交易系统日志备份、数据清理 传ODS数据 与主机对账 对于主机批后的任务,由于主机做完批量后,会将在次日自动覆盖,因此相关应用需要尽快搬迁至新机房,并获取数据后补做批量任务。如不能在规定时间搬迁至新机房,则需要考虑利用备份进行恢复。
2.2.5 系统保护分析
目前系统连接同城灾备中心做容灾,如下图所示
第17页
某银行数据中心整体搬迁策略报告
当前系统的主要备份方式有:
磁带机备份:操作系统主要采用此方式。
Lan-Free备份:主机系统先备份到VSM4虚拟带库,再归档到STK物理带库。
(VSM4 容量1T,仅能支持3天备份)
Lan备份:开放平台采用Veritas备份软件RMAN备份到STK物理带库(注:信用
卡DB采用LanFree备份)。
综合当前系统的备份方式,我们在搬迁过程中需要考虑临时备份问题。
另外,综合客服等4个系统已经在GDS建立了灾备系统,搬迁过程中,如出现紧急情况,可以考虑使用灾备系统进行应急恢复,另外,等系统搬迁至新机房后,也需要考虑尽快恢复灾备系统。
2.2.6 物理共享分析
通过对收集的信息进行分析我们发现当前系统有物理共享的情况,包括: 服务器共享:反洗钱(应用服务器)、ODS(文件服务器)、综合报表共享
10.51.1.95(P55A),综合报表、反洗钱和ODS共享数据库服务器10.1.51.230(P570),等共享情况如下图所
第18页
某银行数据中心整体搬迁策略报告
F5和Citrix共享:
ATM前端系统、CRM系统、RMS系统(信贷风险管理)、自助终端系统、ABS
系统、票据系统、黄金系统、密码系统共用F5;
信贷管理系统、资产保全系统、电子数据存储系统、征信信息系统、信用卡销
售人员管理系统共用办公Citrix;
网银系统、外汇系统、黄金系统、公路收费(前置)、个贷系统、银企直连(前
置)、网站、离行办公系统(VPN)共用网银区Citrix。 新机房没有新购F5和Citrix,故相关设备需要在同一批次搬迁。 NAS共享:
网上银行、ODS、电子存储系统、商业汇票、统一征信系统使用NAS存放文件,建议NAS与这5个系统尽量同一批次搬迁,避免以后出现重复停止应用的情况。 刀箱共享:
第19页
某银行数据中心整体搬迁策略报告
刀箱共享的情况如下图所示,在搬迁的时候一组刀箱内的设备尽量同一批次搬迁 。
5楼小机房刀片箱 1新#8 - Congnos报表 - ODS - 信用卡销售人员管理(Web) 5楼大机房69号机柜2号刀片箱 - 现代化支付 - 南京分行前置 - 自建CA - 信用卡申请 5楼大机房43号机柜刀片箱 - 电子学习平台 - 储蓄国债 - 黄金交易接口机 - 事后监督 - Congnos报表系统 - OA邮件群发服务器 5楼大机房69号机柜3号刀片箱 - 现代化支付 - 深圳、大连、昆明分行前置 - 综合理财DB 5楼大机房69号机柜1号刀片箱 - 交易欺诈 - 零售银行催收管理 - 黄金交易 5楼大机房69号机柜4号刀片箱 - 分行前置 - 分行前置冷备 网络分区关联:
新老机房的网银分区和外联分区没有实现三层路由连通,需要考虑在同一批次搬迁。各分区对应业务系统如下:
网银分区内的系统有:网银系统、外汇系统、黄金系统、公路收费、个贷系统、
银企直连、网站、离行办公系统。
外联分区的系统有:电子储蓄国债、金卫士、统一消息平台。 搬迁过程中,共享的系统需要考虑同一批次搬迁。
2.2.7 设备冗余分析
通过对应用系统对应设备进行统计分析我们得出应用系统的冗余情况,如下表所示。 对外应用系统冗余情况 (7×24,7×18) 对外系统5×8 冗余情况 对内应用 冗余情况 ECC和BW共用备机,DB\\APP共用个贷预审批DB\\APP共用一个人贷款系统 SAP系统 APP负载均衡,ETL中一台冷备机 系统 台冷备机 的DB和APP没有备机
第20页
某银行数据中心整体搬迁策略报告 DB\\APP在一台机器上,有开放式基金代销黄金交易系统一数据补冷备(磁盘已有备机 系统 统 录平台 坏),报表服务器无备机 DB冷备,其它在10.1.1.203个人实盘外汇买银银合作平反洗钱监测PC server有冷上,应用有冷卖系统 台 报告系统 备 备,DB无备机 95501客户服务资金托管系接收机没有备反恐怖融资无备机 中心系统 统 机,应用有备机 黑名单系统 DB和语音服金融统计统金卫士系统 保理系统 无备机 务器都有备机 一报送系统 老系统可以做国际业务处理系为FBS的备机商业汇票系事后监督系服务器单点 统 使用MTS没备统 统 机 电脑验印系资讯平台系统 无备机 统 银税信息共综合客服系统 S390冷备机 享 DB冷备;2台客户关系管信用卡 APP热互备 理系统 财富管理系综合理财系统 无备机 统 卡交换服务器文献管理系卡交换系统 有备机,DB无 统 备机 文件服务器与应用服务器共人力资源管OPICS 用备机,DB无 理系统 备机(右测试机) 应用互备、2学习管理系现代化支付 个DB服务器 统 做RAC App\\DB都有ITSM 网银系统 备机 数据库做统一征信系柜员管理系统 RAC、应用服统
第21页
无备机 10.1.51.230,10.1.1.95没有备机 无备机 互备 一备多,分行服务器无备机 App\\DB无备机 ACRM有备用机,OCRM不确定 服务器单点 服务器单店 应用负载均衡; DB单点故障; App,考试互备 流媒体、DB、报表单点 应用、DB互备; 应用负载均衡; DB单点故障;
某银行数据中心整体搬迁策略报告
务器作集群负载均衡、CAMA与eTeller互备 关联方信息电子数据存储系Web,App负载管理系统 服务器单点 统 NAS,DB单点 员工购买股票系统 信用卡催收SNA 负载均衡 DB有备机 管理系统 应用一主一信用卡新申总行前置 应用有备机 备,DB无备机 请审批系统 两个刀片服务信用卡反申分行前置 应用有备机 器作备份 请欺诈系统 服务器热备,信用卡销售金融自助终端 DB与柜员管 人员管理系服务器单点 理系统共用 统 对于有冷备机的设备,需要考虑先搬迁冷备机。对于没有备机的重要系统,需要考虑好新购备机,建立备用环境;对于没有备机的其他系统,需要考虑先做好备份,并通过通用应急环境进行应急恢复。
2.2.8 机房环境分析
机房概况
某银行目前业务生产系统及网络系统主要位于五楼大小两个机房,也有少部分开发测试机,具体情况如下表所示。 机房 设备 用途 5楼机要室 主机系统监控平台×1、现代化支付备机×1、ITSM开发机×1 5楼网络室 网络管理×1,安全管理×1 5楼维修间 网络管理×2 5楼小机房 核心区接入交换机、IRA区办公接入交换机、办公区负载均衡Citrix、95501留言、OA邮件转发、开发式代销基金 生产 (少部分开发测 第22页
某银行数据中心整体搬迁策略报告
报表、信贷风险管理Web、银税信息共享签名和应用服务器、电子数据存储Web、客户关系管理、新终端、电脑验印、实物资产、统一消息平台、前置系统、通讯网关集群、信用卡销售、客户关系管理、保理、OA开发测试、零售银行DB、swist、密码管理系统、网络管理、安全管理、设备运行监控、财富管理、新终端开发机、资产负债、Congnos报表、ODS、信用卡销售人员管理Web、SAP、反恐怖融资、客户关系管理×113 5楼主机房 综合客服、卡交换、综合理财、全行b/s查询机、网上银行、生产 个贷、信用卡销售人员管理ETL、统一征信、前置等16个子应用、开放式基金、95501、国际业务、OA、信用卡、DMX、综合报表、ODS DB、财富管理数据库、ODS系统/综合报表系统/反洗钱监测报告系统、GE个人征信、征信、个人实盘外汇买卖、SAP、资金交易一体化、黄金交易、电子数据存储、客户关系管理、人力资源、商业汇票、统一消息平台DB、新终端、ATM P/V/C,Congnos报表,IRA区网络,Keith项目、VISA、安全管理、保理、储蓄国债、电子密码、电子数据存储、电子学习、分行前置、核心网络、交易欺诈、金蝶财务、金融统计统一报送、金融自助、金卫士、开放式基金代销、催收管理、ITSM、票据、视频会议、统一数字证书、外币支付、外联网络、网站、现代化支付、文献管理等×583 开发测试系统主要位于11楼F机房和23楼开发间,以及某分行的部分测试设备,资产托管位于27楼。 具体如下表所示。
机房 设备 用途 (少部分开发测试) 试) 第23页
某银行数据中心整体搬迁策略报告 906机房 11F单证中心 11F机房 财富管理开发机*2 Swift系统未使用服务器*1 开发测试 开发测试 黄金交易、个人实盘外汇、Congos、卡交换、支付密码、开发测试 前置、网银、票据、事后监督、终端、ODS、客户关系管理、咨询、保理、现代化支付、个贷、储蓄式国债、综合理财、软件配置管理等5台服务器 11F基金会议室 开放式基金代销系统×1 16楼开发现场 23楼开发间 27楼机房 2楼机房 客户关系管理系统×1 信用卡开发系统×10 资产托管系统×7 95501录音设备×2 开发测试 开发测试 开发测试 生产+测试 开发测试 开发测试 开发测试 开发测试 6楼3号会议室 信用卡新申请外挂开发×1 8楼 附4楼 某分行 网站测试×1 个人实盘外汇买卖×2,电子密押测试×1 SAP、信用卡、ODS、客户关系管理、个贷、资产负债、国际业务、电子数据存储、事后监督、财富管理\\Congnos、统一数据补录×20 通过对各系统设备的统计,我们发现有部分系统主备机在同一机柜的情况,并且也有专用机柜共享的情况。主备机在同一机柜的详细列表如下。 机柜号 设备型号 同机柜主备机 卡交换系统主备机 个货APP服务器与备机 8 IBM标准机柜 9 IBM标准机柜 第24页
某银行数据中心整体搬迁策略报告
40 IBM标准机柜 41 IBM标准机柜 44 IBM标准机柜 48 IBM标准机柜 50 IBM标准机柜 64 非标准机柜 66 IBM标准机柜 67 IBM标准机柜 69 IBM标准机柜 新前置平台(货押系统)数据库服务器主备机 新前置平台(货押系统)APP服务器主备机 CallCenter数据库双机热备 个人实盘外汇买卖系统主备机 动态密码服务器主备机 新终端系统RAC 事后监督系统应用服务器(并行),电子数据存储两APP互备 新网银两APP互备 新黄金冷备机一备多,交易欺诈侦测系统主备机 对于主备机在同一机柜的情况需要分散风险。专用机柜共享的情况如下表所示。 机柜号 机柜类型 9 10 14 17 40 41 42 43 45 46 47
系统名称 IBM专用机柜 网上银行系统、个贷系统 IBM专用机柜 信用卡销售人员管理系统、征信系统、新代收代付批量系统 前置系统/联网核查公民身份信息系统、电子商业汇票系统、ATM IBM专用机柜 P/V/C项目开发 IBM专用机柜 95501 客户服务中心系统、国际业务处理系统 IBM专用机柜 前置系统、商业汇票系统开发 IBM专用机柜 前置系统等 18个子系统、商业汇票系统开发 IBM专用机柜 前置系统、征信系统、 ATM P/V/C项目开发 商业汇票系统、网上银行系统、国际业务处理系统、综合报表系统/IBM专用机柜 征信系统 IBM专用机柜 ODS 系统、财富管理系统、综合理财系统开发 IBM专用机柜 综合理财系统、信用卡新申请系统 IBM专用机柜 ODS 系统、征信系统 第25页
某银行数据中心整体搬迁策略报告 49 50 51 53 54 59 64 66 67 69 IBM专用机柜 SAP 系统、综合报表系统 IBM专用机柜 前置系统、网上银行系统、资金交易前中后一体化系统 IBM专用机柜 征信系统、个贷系统 IBM专用机柜 个人实盘外汇买卖系统开发、黄金交易系统开发、前置系统开发 IBM专用机柜 OA 系统、开放式基金代销系统、网上银行系统开发 IBM专用机柜 电子数据存储系统、信用卡系统开发 非标准机柜 人力资源系统、商业汇票系统、电子商业汇票系统、统一消息平台、新终端系统、统一数字证书系统、ATM监控系统 IBM专用机柜 电子数据存储系统、事后监督系统 IBM专用机柜 事后监督系统、网上银行系统 分行前置系统、现代化支付系统、催收管理系统、黄金交易系统、IBM专用机柜 交易欺诈侦测系统、自建CA系统开发、信用卡新申请系统 对于专用机柜我们最好整柜搬迁,以减少搬迁风险。 机房布局图
某银行总行主机房设备及电源布线平面图如下。机房内IBM专用机柜32个,SUN专
用机柜8个,EMC专用机柜4个,HP专用机柜4个,富士通专用机柜1个。
2.2.9 风险分析
某银行数据中心搬迁项目的主要风险如下:
非计划的业务中断:包括设备故障,数据丢失,系统故障,性能严重下降,依赖资源
缺失;
设备损坏:包括拆卸过程中损坏,运输过程中损坏及安装过程中损坏等; 人员风险:包括人员组织,应用与设备管理的结合,人员技能,人身意外伤害; 外部条件:包括外部接口项目延期,报关、清关,物理条件制约; 基础设施破坏:包括机房地板破坏,运输通道破坏,电力设施破坏。
主要风险分析如下表所示。
第26页
某银行数据中心整体搬迁策略报告 可能会出现在网关搬迁后于13 系统搬迁之后,导致系统网网络性能络流量回流回旧机房网关, 导致新旧系统网络负载增加网络访问能14 网IP地址如不能切换到新机力房,则影响到应用的访问。根据系统室以前所作的测 试,EVA数据同步可能会较应用性能15大地影响应用性能且同步时 间较长 网络流量回流:搬迁过程中中建议提前对网络性能进行相应测试,应用之间的访问数据量大的系统同一批次进行搬迁。某银行、网络建设厂商2010/2/12 新旧机房属于不同局端,公 中建议提前进行公网IP切换的规划和安排1. 需协调厂商优化数据同步方案,降低数据同步对生产系统的性能影响某银行、网络建设厂商2010/2/12高 162. 分批次进行EVA上应用的搬迁,以便提供数EVA厂商、某银行据同步所需的时间需要保障在搬迁测试及实施阶段(约30天)主机冷备机R36的CD License。某银行2010/1/30 软件的License,一旦需要R36的接管
主机的冷备机R36缺少CD能力得不到切换时R36无法使用CD软件保障。中2010/2/12 第27页
某银行数据中心整体搬迁策略报告
序号风险内容
潜在的影响优先级建议的应对措施应对责任方(人)某银行、搬迁实施方、物流目标解决时间现有机房货梯通道门不够高,且货梯门口缓冲有障9搬迁条件碍,导致大型设备无法采用货梯搬运。搬迁过程,新旧机房网络设网络访问、10备网络策略配置存在不同步业务运行受的风险影响由于外联专线很多,且存在影响网络割11某些外联设备应用配置情况接质量不明了的情况新旧机房之间的网络性能问题:分批次搬迁过程中,新12网络性能旧机房可能会出现网络流量过大的情况网络流量回流:搬迁过程中可能会出现在网关搬迁后于13系统搬迁之后,导致系统网网络性能络流量回流回旧机房网关,导致新旧系统网络负载增加新旧机房属于不同局端,公网络访问能14网IP地址如不能切换到新机力房,则影响到应用的访问。根据系统室以前所作的测试,EVA数据同步可能会较15应用性能大地影响应用性能且同步时间较长主机的冷备机R36缺少CDR36的接管软件的License,一旦需要16能力得不到切换时R36无法使用CD软件保障。高建议采用客梯搬运。需要提前做好协调、安排,并进行客梯表面的保护措施。2010/2/28中高务必保证新旧机房网络设备网络策略配置同步,如存在变更,需要提前申明,并进行相应测试某银行、网络建设厂商1. 整理清楚所有的外线与应用的对应情况,提前进行测试。某银行、网2. 评估网络割接的最小时间络建设厂商建议提前对网络性能进行相应测试,应用之间的访问数据量大的系统同一批次进行搬迁。某银行、网络建设厂商2010/2/122010/2/12中2010/2/12中建议提前对网络性能进行相应测试,应用之间的访问数据量大的系统同一批次进行搬迁。某银行、网络建设厂商2010/2/12中建议提前进行公网IP切换的规划和安排1. 需协调厂商优化数据同步方案,降低数据同步对生产系统的性能影响某银行、网络建设厂商2010/2/12高2. 分批次进行EVA上应用的搬迁,以便提供数EVA厂商、某银行据同步所需的时间需要保障在搬迁测试及实施阶段(约30天)主机冷备机R36的CD License。某银行2010/1/30中2010/2/12 第28页
某银行数据中心整体搬迁策略报告
3 某银行数据中心搬迁策略
3.1 某银行业务系统搬迁方式
基于对某银行现状的分析和实际业务连续需求,建议某银行采取“混合型”的搬迁方式进行数据中心搬迁,部分系统的数据、应用采用切换方式,部分系统直接搬迁。 通过数据同步复制的方式将数据完整迁移到新购DMX3和新购EVA上,核心系统具有切换条件的采用切换方式。目前暂无冗余的NAS设备,可以租用NAS作为数据复制目标和冗余以降低风险。具体搬迁方式如下表所示。
搬迁方式 分类 服务器 及应用 切换 搬迁 搬迁 搬迁 数据及 存储 切换 切换 切换 搬迁 核心网络新建,部分接入设备搬迁 相关网络 业务数据保护方式 核心系统(综合客服、SNA网关) 位于DMX3、DMX1000、EVA8100-1和EVA8100-2存储上的其他业务系统 位于NAS3140上的业务系统 独立使用存储或不使用外置存储的系统 数据复制同时作为同步数据保护的手段 通过NAS数据复制 搬迁前数据备份 3.2 搬迁批次划分要求
系统切换的要求:核心业务系统采用切换的方式进行迁移,需要提前搬备机; 数据迁移的要求:
新购EVA8100空间有限,仅能作为其中一台EVA的数据复制目标,需要先将
EVA8100-2及上面的系统搬迁,腾出空间作为EVA8100-1的复制目标; EVA8100上的CA数据复制会严重影响生产性能,尽量分散该存储上系统搬迁批
次,以提供足够窗口进行复制和数据验证。
应用及物理关联的要求:
数据交互量大的系统尽量同一批次搬迁 网络外联分区内的业务系统需一起搬迁
第29页
某银行数据中心整体搬迁策略报告
网络网银分区内的业务系统需一起搬迁 应用关联紧密的业务系统需一起搬迁
共享专用机柜(IBM/SUN)内的设备最好一起搬迁
共享设备的业务系统需一起搬迁(服务器、刀片机箱、F5、Citrix、其他设备) 根据上面批次划分的要求,建议某银行搬迁分为三个主批次进行。主要的批次划分的目的和对应的系统类型如下表所示: 批次 目的 为后续关键批次的搬迁提供必要的批次一 技术条件,同时验证新数据中心的网络、搬迁的路线、 搬迁对外服务的业务系统,以及相应批次二 紧密关联的对内业务系统。将对外的业务影响降低最低 搬迁剩余的业务系统、开发系统以及利旧的设备 系统 影响较小或独立的业务系统、核心系统的备机,他们的搬迁不会对银行的业务造成外部影响 核心业务系统,一般都是7*24的业务系统,对银行的外部影响较大 批次三
一般是5×8的业务系统,对外部的影响较低 整个搬迁过程如下图所示:
第30页
某银行数据中心整体搬迁策略报告
2月20日2月5日EVA8100-2及相关业务系统搬迁3月6日核心类系统的备机搬迁第二批次搬迁第一批次搬迁•部分对内业务系统搬迁•网络设备搬迁•网络线路割接•核心业务系统切换•主要业务系统搬迁3月20日3月底4月初第三批次搬迁•剩余业务系统、安全、网络管理类系统•DMX1000、DMX3、EVA8100-1、STK带库搬迁•利旧设备:UPS、空调等搬迁准备工作•新旧机房网络连通、测试完成;新机房线路测试完成•DMX上第一批次系统数据同步•EVA8100-2至新机房EVA8400数据同步•过渡备份环境搭建第二次数据同步•DMX上第二批次系统数据同步•EVA8100-1至EVA8100-2数据同步(部分业务系统)及数据验证、测试第三次数据同步•EVA8100-1至EVA8100-2数据同步(剩余业务系统SAP、OA)及数据验证、测试
从图中可以看到,在第一次搬迁前必须具备以下前提条件: 新旧机房网络连通、测试完成;新机房线路测试完成; 完成初始数据同步;
DMX1000至新机房DMX3的数据同步 ; EVA8100-2至新机房EVA8100-3数据同步 ; 过渡备份环境搭建。
第二批次和第三批次搬迁前都必须先做好EVA8100-1至EVA-8100-2的数据同步。
三个批次分别对应的业务系统包括: 1. 批次1搬迁系统及设备:
注:根据具体准备需要,第一批次分为多个小批次进行搬迁,搬迁时间也可适当调整;
第31页
某银行数据中心整体搬迁策略报告
2月5号搬迁•信用卡交易反欺诈(2月5号前迁出EVA8100-2)•事后监督系统(部分)(2月5号前,电子数据存储从同一机柜上迁出)•零售信贷数据集中分析(keith项目开发用)•EVA8100-2磁盘阵列2月8号搬迁•16台网络设备2月20号搬•资讯平台•统一数据补录平台•电脑验印系统•关联方信息管理系统和员工买卖股票申报系统•金融统计统一报送系统•资产负债系统•实物资产管理系统•档案管理系统和文献管理系统•反恐怖融资黑名单系统3月6号搬•信用卡备机•综合客户服务系统备机+3590磁带机+路由器•SNA网关备机•其他开发测试机
另外,2.20日前,新机房还需要完成操作管理系统的建设,相应工作人员采取新操作管理系统进行日常操作。
2. 批次2搬迁系统及设备:
•••••••••••••••••••••••综合客户服务信用卡个贷综合理财密码服务平台电子密押系统金融自助终端卡交换网站系统客户关系管理开放式基金代销个人实盘外汇买卖保理系统新代收代付离行办公系统(VPN)学习管理系统资金交易前中后一体化国际业务结算综合理财商业汇票新终端系统总行前置现代化支付••••••••••••••••••••••SNA网关网上银行统一征信系统财富管理ODS分行前置统一消息平台反洗钱ATMPCV电子数据存储信用卡销售人员管理学习管理系统事后监督(第二部分)电子储蓄式国债信用卡催收管理信用卡新申请信用卡数据集市黄金交易信贷风险管理金卫士SWIFT银税共享
第32页
某银行数据中心整体搬迁策略报告
3. 批次3搬迁系统及设备:
•••••••••••••SAPOA人力资源ITSM资产托管系统及相关网络设备交易流水查询系统安全管理密码支付平台应用运行监控支付密码系统灾难备份综合备份系统网络管理•••••视频会议系统设备运行监控证券资金清算系统软件配置管理系统金蝶财务系统•密码管理系统•操作室设备••••DMX1000DMX3EVA8100-1STK SL8500物理磁带库
3.3 搬迁各批次分析
3.3.1 批次1搬迁分析
批次1搬迁影响业务的应用有:信用卡交易欺诈、事后监督(部分设备)、资讯平台、统一数据补录、电脑验印、关联方信息管理和员工买卖股票申报系统、金融统计统一报送、资产负债系统、实物资产管理系统、档案管理系统和文献管理系统、反恐怖融资黑名单系统;不影响业务的应用及设备清单有:零售信贷数据集中分析(keith项目开发用)、综合客户服务系统备机、3590磁带机、路由器、信用卡备机。批次一搬迁的设备总数为52,具体如下表所示。
系统 整机柜 PC服务器 小型机 刀片服务器 阵列 磁带机 其他 小计
合计 2 20 8 2 1 3 16 52 批次一搬迁所需时间如下图所示。 第33页
某银行数据中心整体搬迁策略报告
数据备启动应用份应关闭包装运数据OS,认系统用(非集数据健康关机下输一致应用安装业务盘,及可用拆卸小计停中存储库及检查电清点就加电性验启动验证启动性检止上的数OS位证DB 查据)30分15分15分钟1小时6小时1小时60分钟2小时40分钟10分钟30分钟14小时钟钟切换/停止应停机前的前停应用前的应用名称用时检查和置条件间点处理导流水、预警分析批量非运行时,8:00-30事后监督可以先停止10:3010分钟分钟批量,搬后补做。5分交易欺诈无0:005分钟钟侦测系统无无30分15分15分钟1小时6小时1小时50分钟2小时5分钟5分钟5分钟13小时钟钟
从图中可以看到,在不考虑清关的情况下,一般系统都可以在14小时内恢复。批次1的设备大多是对内应用或者备用设备,因此,只需要根据需要选择某个周末,或者分成几个小批次在周末进行。
另外,可以在批次1中再搬迁一些其他系统的开发机、测试机和一些不用的设备。
3.3.2 批次2搬迁分析
批次2搬迁应用及其他设备清单如下图所示:
批次2搬迁影响业务较大的应用及设备清单 •
• • • • • • • • • • • • • • • • • • •
网络设备
综合客户服务系统 信用卡(CCS) 卡交换 个贷 综合理财
开放式基金代销 OPICS
个人实盘外汇买卖 黄金交易 现代化支付 金卫士 网银
新终端系统 金融自助终端 ATMPVC
电子数据存储 国际业务处理 SWIFT
通信集群网关
批次2搬迁对业务影响较小的应用及设备清单 • • • • • • • • • • • • • • • • • •
VSM虚拟带库 客户关系管理系统 信用卡销售人员管理 电子商业汇票 综合报表 财富管理
事后监督(剩余部分) 催收管理 交易欺诈侦测
离行办公系统(VPN) 电子储蓄国债 信贷风险管理 商业汇票系统 资产保全系统 反洗钱
信用卡数据集市 银税共享 电子学习平台
批次2搬迁过程中的难点有:
第34页
某银行数据中心整体搬迁策略报告
1. 应用数量多而且关键; 2. 设备数量很多,共计408台;
3. 系统管理员和设备管理员较少,搬迁过程中很可能成为瓶颈;
4. 搬迁路径和通道,多系统同时搬迁可能会成为物理搬运过程中的瓶颈。 针对这些难点,批次2搬迁方式有A、B两种方案:
A方案:批次2内应用系统进行分组,同批次内分时段错开搬迁; B方案:批次2内应用系统分多个批次,分批搬迁。 批次2搬迁的应用系统恢复优先顺序遵循以下原则: 1. 尽快恢复对外服务的条件; 2. 根据应用服务等级进行恢复。
批次2搬迁应用系统恢复优先级别如下图所示。
第35页
某银行数据中心整体搬迁策略报告
需要最优先恢复的A类系统 其他A类业务系统 B类系统 C类、D类系统
从图中可以看出:
1. 综合客服、信用卡、个贷是对外服务的核心,需要最优先的恢复;
第36页
某银行数据中心整体搬迁策略报告
2. SNA网关、前置平台是其他对外服务到综合客户服务的关键通道,也需要最优先
的恢复;
3. 网银、终端系统、ATMPCV、多媒体自助、金卫士是对外服务的窗口,需要优先
恢复;
4. 卡交换是银联接入深发行的通道,需要优先恢复;
5. 网银的业务与现代化支付关联紧密,需要优先恢复现代化支付; 6. 其他系统按应用服务等级进行恢复。
批次2内应用系统恢复优先级别详细情况如下图所示。 批次2搬迁的两种方式比较如下表。
搬迁特征 对外业务中断次数 集中申请停机时间 对外业务的搬迁周期 对外业务恢复后的性能问题 单次搬迁的业务影响范围 人力资源瓶颈问题 紧急情况下的回退问题 实施控制难度 方式A(同一批次内按优先级分组搬迁) 1次 1次 1次 正常 很大 严重 (设备较多,连续作战时间长) 难 很高 需解决人力资源瓶颈问题、加强进度控制;紧急情况下,部分对内业务有可能无法在48小时内恢复; 方式B(多批次搬迁) 多次 多次 2~4周 搬迁过程中,对外业务分散在两个机房,性能受到网络带宽的制约 大 中 中 中 外联专线需要能够根据分批进行割接,并需网络部门根据网络流量监控,评估分多个批次搬迁是否会造成网络带宽瓶颈问题 实施前提条件 第37页
某银行数据中心整体搬迁策略报告 3.3.2.1 搬迁方式B的考虑
方式B的搬迁考虑如下:
第1周:搬迁A1分组及共享机柜或者设备的应用; 第2周:搬迁A2分组及共享机柜或者设备的应用。 方式B第一周和第二周搬迁的应用清单如下图所示。
第二周 联网核查公民身份信息(国库信息、深圳同城支付结算) 网站 国际业务结算 SWIFT 电子数据存储 综合理财 商业汇票 开放式基金代销 黄金交易 个人实盘外汇买卖 资金交易前中后一体化 电子储蓄式国债 银企直连、公路收费 保理系统 新代收代付 ODS 客户关系管理 综合报表 反洗钱 第一周 综合客服 信用卡 个贷 SNA网关 密码服务平台 总行前置平台 分行前置 网上银行 新终端系统 ATMPCV 金融自助终端 卡交换 现代化支付 金卫士 如采用方式B,单次的搬迁负荷则会较轻,搬迁中的人力资源瓶颈问题得到缓解。但采用B方式会出现重要应用分布在两个机房的情况,对机房直接的网络要求较高。需要对网络的流量进行评估,以确认方式B的可行性。如果网络带宽足够,性能不受影响;同时在不考虑对外业务中断次数的情况下,方式B较优。
前期某银行通过对ODS的监测对网络流量进行过初步的评估并且得出数据流量并不大的结论,但是此种评估方法并不能对网络的流量进行比较准确地评估,建议的网络流量评估及处理方法如下:
1. 获得所有A1应用组(所有IP)与其他应用之间的数据流量总和;
2. 该总和基础上加上50%的容量用于应对部分系统高峰值 = 新老机房IP链路网络带宽; 3. 如果现有带宽不满足以上数量,则立即和DWDM厂商沟通,扩充端口和板卡;
第38页
某银行数据中心整体搬迁策略报告 4. 如采用方式B并碰到性能瓶颈的情况下,考虑中断新老机房之间的数据复制通道,以
增加IP链路的带宽,但后期的搬迁可能会相应延迟。
采用B方式搬迁并恢复业务后,如若出现性能问题,系统将无法回退,只能解决带宽问题。采用B方式搬迁的时间周期会延长,B方式搬迁周期估计如下图所示。
1月25日 第一次数据复制同步开始(DMX, 2月26日 批次1设备搬迁
开发机、测试机搬迁搭建备用
环境
3月27日 4月3日 批次2设备搬迁 批次3设备搬迁
2月20日 第一次数据复制同步完成(DMX,8100-2->8400) 3月20日搬迁冷备机 3月25日搬迁在线Cluster备机 第三次数据同步 EVA8100-1至 EVA8100-2数据同 第二次数据同步 EVA8100-1至 EVA8100-2数据同 3.3.2.2 搬迁方式A的考虑
综合考虑批量依赖、设备共享、机柜共享等多种约束条件后,采用方式A,批次2可以分成3个组,在不同的时间进行搬迁。具体如下:
第39页
某银行数据中心整体搬迁策略报告
提前组周五14:00开始搬迁ODS综合报表反洗钱信用卡销售人员管理信用卡数据集市第一组0:00左右开始搬迁网络设备综合客服信用卡个贷SNA网关密码服务平台电子密押系统总行前置平台分行前置网上银行新终端系统ATMPCV金融自助终端卡交换现代化支付金卫士综合理财电子数据存储国际业务结算SWIFT统一消息平台信贷风险管理第二组6:00开始搬迁商业汇票客户关系管理开放式基金代销黄金交易个人实盘外汇买卖资金交易前中后一体化电子储蓄式国债保理系统网站新代收代付统一征信系统财富管理信用卡新申请事后监督(第二部分)信用卡催收管理离行办公系统(VPN)银税共享学习管理系统5个系统21个系统18个系统
采用A搬迁方式,第二批次的设备数量统计如下表。
需拆卸PC服务系统内磁带加密大机与存IBM专用其他专用刀箱储机柜机柜机柜阵列机机器或UNIX0101系统第0组小计第1组小计第2组小计合计其他053760小计9230873262203251427231641217019501010347024024
搬迁方式A存在的难点有: 存在人力资源瓶颈;
机房空间容纳不了太多工作人员; 楼道门太窄;
过去某银行搬迁过程中,20多台设备需要10个小时。 针对这些问题我们提出的解决思路是:
设备拆卸安装由实施商提供足够的技术专家并行进行工作;存储认盘、操作系统启
第40页
某银行数据中心整体搬迁策略报告
停可以由实施商进行;对于数据库DBA的瓶颈,建议数据库启动由应用管理员进行;
根据机房空间、设备位置、拆卸的方便性进行人员安排;
充分利用货梯和客梯,对货梯通道进行适当改造,保持运输通道的通畅; 通过细化拆卸方案提高速度,并通过演练验证可行性。
可以看到采用A方案时,批次2搬迁的PC机相对较多,是影响进度的主要瓶颈;可以将所有PC机的冷备机提前2天搬迁而小型机则大多可以整体推移,相对速度较快。 采用A方案,在人员分配方面的初步考虑如下:
PC分配 6组(为避免人员疲劳,另外3组休息待命); 小型机2组IBM,1组SUN;
大机1组(可以稍晚拆)、网络2~3组;
应用管理员协助完成数据库的启动与验证过程,DBA提供指导与支持。 方式A搬迁的速度估算如下:
组1有22个整体机柜,每个30分钟拆完,5个小时拆卸完;13个小时全部装完; 组1PC有86个,按照6组,每个30分钟,7个小时拆卸完;(组1的PC分布在
不同的机柜),每个45分钟安装的话,19个小时全部装完; 组2有88个,30小时完成;
组3 预计37小时全部完成安装。边拆边运边装提高整体数度 (除去提前搬迁备
机的数量,预计完成时间会提前)。
对于采用方式A搬迁的通道瓶颈问题,我们可以采取以下方法解决: 1个客梯用于运人; 1个客梯用于灵活调用;
客梯的两个门分别用于PC网络绿色通道设备、小型机; 货梯和1个客梯用于PC和网络设备; 3个客梯用于小型机或者其他大型设备专用。
对于A搬迁方式,在搬迁过程中如出现搬迁时间过长的情况,导致整个设备无法在48小时内恢复业务,建议可以由领导层立即决策批次2中队内业务的部分设备暂不搬迁;等详细方案完成后,可以尽快通过模拟演练来验证方式A的可行性。由于A方式第二批搬迁
第41页
某银行数据中心整体搬迁策略报告 的设备比较多,此批次搬迁持续的时间比较长,故涉及到设备清关的一些问题:
1. 22:00~7:00不能清关;
2. 清关车辆和所运输设备必须提前报关;
3. 如报关单和实际运输不一致,则视为违法行为;
4. 海关有权利随意抽查车辆,一旦抽查,则需要很长时间的停顿。 对于此问题,需要某银行高层领导统一协调,争取实现清关无障碍。 3.3.2.3 搬迁批次2业务中断和恢复时间分析
在对第二批次的应用恢复时间进行分析前,我们先做如下的假定: 1. 主机是整个机房搬迁及业务恢复的主线; 2. 核心系统尽量采取切换的方法; 3. 周六0:00开始停止对外服务; 4. 保证主机跑批顺利完成后再切换。
在以上假定的基础上我们对应用进行分析,得出如下结论:
根据定时批量任务关联分析,主机、SNA需要在跑完批后进行切换(约4点钟); 个贷应用可以在0点开始; 信用卡批处理完后2点开始切换;
卡交换要进行日终处理,约在1点可以搬迁; 其他系统可以在0点后开始搬迁; 切换的系统选择合适的时间进行回切;
批次2搬迁各系统搬迁所需时间分析如下图所示。详见文档-某银行 Relocation_业务搬迁时间次序。其中清关时间暂估为2小时,同步复制数据一致性验证预估2小时。
第42页
某银行数据中心整体搬迁策略报告
根据业务搬迁次序表,我们可以得出批次2的搬迁时间图,如下图所示。
周五14点 第一组周六 0点开始 第二组6点开始 第三组12点开始 深圳发展银行业务搬迁第二批时间进度表周日 1点 周日 6点 周日8点
根据应用服务恢复要求,对应分行及各条外联专线接入须在相应时间段内完成割接。
第43页
某银行数据中心整体搬迁策略报告 批次2业务中断和恢复所需时间如下图所示。
提前组:周五7:00恢复应用服务,耗时17小时•ODS、新综合报表、反洗钱、信用卡数据集市、信用卡销售人员管理第一组:大部分系统周六20点可恢复完成(前置、网银23点),共耗时23小时•网络设备、综合客服、信用卡、个贷、SNA网关、密码服务平台、电子密押系统、总行前置平台、分行前置、网上银行、新终端系统、ATMPCV、金融自助终端、卡交换、现代化支付、金卫士、综合理财、电子数据存储、国际业务结算、SWIFT、统一消息平台•前置系统、网银最晚恢复第二组:周六24点可恢复完成,耗时24小时•商业汇票、信贷风险管理、客户关系管理、开放式基金代销、黄金交易、个人实盘外汇买卖、资金交易前中后一体化、电子储蓄式国债、保理系统、网站、新代收代付、统一征信系统、财富管理、信用卡新申请、事后监督(第二部分)、信用卡催收管理、离行办公系统(VPN)、银税共享、学习管理系统•客户关系管理系统最晚恢复 以上时间不包括故障发生后的缓冲时间,建议可以再预留10小时的故障缓冲时间。 应用回切时间点考虑如下:
A. 搬迁后立即回切,大约周六20-22点; B. 周日凌晨4:00批处理完成后; C. 运行一周后周五凌晨回切。 3.3.2.4 批次2搬迁注意事项
1. 考虑到ODS和各系统的关联关系很密切,尤其是0点后和很多系统都有交互,建议ODS提前半天搬迁,并在新机房快速恢复;预计周五14:00开始搬迁比较合适; 2. SWIFT系统HSM box掉电时间不能超过2小时,否则将丢失数据,搬迁中应给予相当高的优先级;
3. ODS机柜中有信用卡数据集市Web、综合报表Cngnos服务器,需要考虑这两个应用的半天中断,或者将相应应用迁移到其他机器;
4. 由于宁波同城支付要求5点前通过分行前置发送给人行结算,分行前置的搬迁会影响该业务;考虑到分行前置的重要性,分行前置需要优先搬迁,建议提前通知宁波分行周五
第44页
某银行数据中心整体搬迁策略报告 停止定期业务,以保证分行前置在0:00后就可以搬迁。 3.3.2.5 批次2搬迁的前提及主要准备工作
1. 在EVA8100-1上需在批次二搬迁的业务系统数据已经完整同步复制到EVA8100-2上,并完成数据验证;
2. 分行、外联和网银线路割接测试完毕; 3. 批次2系统的应急环境准备完毕; 4. 过渡备份环境搭建完毕;
5. 通知相关部门搬迁时间及配合要求。
3.3.3 批次3搬迁分析
第三批次搬迁的系统有三类:剩余的业务系统,管理区系统、开发测试系统,利旧设备。第三批次搬迁的设备总数为226台,第三批次搬迁的设备统计如下表。
大机与存储机柜 IBM专用机柜 其他专用机柜 刀箱 需拆卸PC服务器或UNIX 系统内阵列 磁带机 磁带库 加密机 其他 合计 3
0 1 0 223 9 3 0 8 96 226 对于STK带库、DMX1000、DMX3、EVA8100-1的搬迁均在相关应用系统搬迁前完成并顺利恢复服务后进行。
批次3具体搬迁时间如下图所示。
第45页
某银行数据中心整体搬迁策略报告
周六 0点开始 周六20点 深圳发展银行业务搬迁第三批时间进度表周日0点 系统名称时间周五14:0015:0016:0017:0018:00下6时到晚12时周六00:00121:002:003:004:005:006:007:008:009:0010:0011:0012:00101113:0014:0015:0016:0017:0018:0019:0020:0021:0022:0023:00周日00:00资讯平台电子密押系统(新上线)统一数据补录平台电脑验印系统全国支票影像系统反恐怖融资黑名单系统银联清算系统345(7小时30分钟)6(2小时)1078(45分钟)910111245(7小时30分钟)6(2小时)78912345(7小时30分钟)6(2小时)78911012345(7.5小时)6(2小时)107(1小时)89245(6小时40分钟)6(2小时)78912345(7小时30分钟)6(2小时)78911016(2小时)7891011开始时间02:3012345(7小时30分钟)关联方信息管理系统员工买卖股票申报系统SWIFT金融统计统一报送系统资产负债系统实物资产管理系统档案管理系统文献管理系统人力资源管理系统ITSM1245(7小时45分钟)6(2小时)78110191011245(7小时30分钟)6(2小时)7891245(7小时30分钟)6(2小时)7891011223445(7小时30分钟)5(7小时30分钟)6(2小时)6(2小时)77891081112345(7小时30分钟)6(2小时)7891101789101112345(7小时30分钟)6(2小时)12345(7小时30分钟)6(2小时)710118910111245(7小时30分钟)6(2小时)789111245(7小时45分钟)46(2小时)789101停止前的检查2应用停止3数据备份关闭数据库及系统5拆卸包装运输6清关 7安装加电8启动OS和DB9应用启动10应用系统可用性检查11业务验证制作时间:2009-12-11 上图的搬迁时间都是在周六0:00开始停止对外服务的假定下进行分析得出的。从上图可以看出第三批次业务系统周六0:00开始停止服务,20小时左右恢复运行,30小时可恢复服务(其中考虑10小时的故障处理缓冲时间)。
批次三搬迁的主要准备工作有:
1. EVA8100-1上余下的业务系统数据已经完整同步复制至EVA8100-2上,并完成数据验证;
2. 分行、外联和网银线路割接测试完毕; 3. 批次3系统的应急环境准备完毕; 4. 通知相关部门搬迁时间及配合要求。
3.4 搬迁过程中的备份策略
某银行数据中心当前系统的主要备份方式如下表所示。
第46页
某银行数据中心整体搬迁策略报告 备份内容 操作系统 备份方法 磁带机备份 先备份到VSM4虚拟带库,再归档到STK物理带库; VSM4容量为1T,仅能支持3天备份; 采用Veritas备份软件RMAN备份到STK物理带库 (注:信用卡DB采取Lan Free的备份) 备份方式 磁带机备份 主机系统 Lan-Free备份 开放平台 Lan备份 搬迁过程中面临的备份问题如下: 1. STK物理带库设备很大,需要厂商拆卸、安装时间需要10天以上; 2. STK物理带库无法在批次2中和大部分应用同时搬迁到新机房;
3. VSM4虚拟带库空间较小,无法支持主机系统10天以上的备份空间需求; 4. 新旧机房较远,无法将新机房的数据备份到现有机房。 搬迁过程中的备份策略如下:
1. 新老机房分别准备好磁带机和足够磁带,用于操作系统备份;
2. 利用现在闲置的3590磁带机作为主机的临时备份设备;(可以提前搬迁并部署); 3. 对于主机,修改备份作业流,先备份到硬盘上(需要增加磁盘卷),再归档到3590带机;
4. 新机房提前搭建开放平台的临时备份服务器,用于STK搬运完成前的临时备份(需要空余存储空间);
5. 对于老机房,也提前搭建临时备份空间,用于STK开始搬运后的临时备份。 由于新机房要求必须支持15~20天的临时备份手段,并且临时备份数据需要保留31天,故可以考虑利用租用的NAS设备同时作为临时备份介质设备,充分预留空间。对于NAS设备可以由实施方提供用于NAS数据复制同步和开放平台临时备份空间,空间需求为62T (其中NAS数据量 2T,30天临时备份空间60T)。
第47页
某银行数据中心整体搬迁策略报告
3.5 搬迁中的容灾保护
当前系统有同城灾备,在搬迁后需要尽早恢复新机房生产存储与GDS的SRDF容灾数据复制。
3.6 搬迁的应急预案
设备搬迁过程中的物理损坏和数据丢失是机房搬迁过程中的主要风险之一,因此,在搬迁前需要根据业务系统的需要提前准备相应的应急设备和环境。 应急方案主要包括四个层面:
设备搬迁过程中硬件故障,立即采取备件进行替换;
在缺乏备件、备件替换时间过长、备件替换无效的情况下,立即采取应急环境
进行系统恢复;
如出现大雨、交通堵塞、通关或者其他因素导致搬迁无法进行,需中止搬迁或
第48页
某银行数据中心整体搬迁策略报告
者进行系统回退;
安排专人对整个搬迁过程进行应急响应、事件监控和快速处理;
1) 备件替换是应急的主要方式,由某银行安排专人,提前要求厂家准备相应备件,在紧急情况下,立即进行备件提供和替换;
2) 应急环境分为两大类:专用应急环境和通用应急环境。专用应急环境主要用于对外业务或者非常重要的系统,通用应急环境主要用于对内业务或者相对重要程度较低的系统;
专用应急环境:就是指提前准备专用备机、部署相关的应用并进行测试,在搬
迁设备损坏或者其他应急情况下,利用这些备机进行应急恢复; 专用应急环境的来源有以下四种:
- 原先系统的冷备机、或负载均衡的备机; - 新购备机;
- 从某分行临时借用的开发机、测试机
- 从其他厂商或者合作伙伴借用的备机(包括加密机);
通用应急环境环境,就是提前准备一些机器,在紧急情况下,立即安装应用并
进行系统恢复。
通用应急环境的来源主要来源如下:
- 从某分行临时借用PC服务器(15~20台)、各类小型机(IBM 4~8台、Sun 2~3台)
3) 安排专人对整个搬迁过程进行应急响应、事件监控和快速处理:
设立专门的应急响应小组,对搬迁过程中的事件进行快速决策,并安排相应人
员执行;
安排人员专门协调备件的提供、和厂商进行沟通,确保设备维修和备件替换迅
速;
安排人员专门和海关协调,确保通关过程顺利通畅; 安排人员专门和交管局协调,确保物流运输过程通畅;
安排人员和物业进行协调,确保搬迁过程中电梯、运输通道等通畅;
第49页
某银行数据中心整体搬迁策略报告
应急预案的建立遵循以下原则:
1. 针对业务关联性高、业务影响面广的关键业务系统采用专用应急环境。在应急设备
上安装与生产环境一致的操作系统、数据库、中间件和应用程序,这样在发生设备损坏时能快速恢复生产;
2. 针对那些业务影响面相对较小的对外业务系统可以采用通用应急环境。在有限数量
的小型机和PC服务器上安装相应的操作系统,发生设备损坏时,在通用环境上安装相应的数据库、中间件和应用程序,从而可以较快的恢复生产;
3. 对于其他管理类、经营分析类业务系统,可考虑只提供应急备件支持。当发生损坏
时,现场进行硬件的故障修复。
应急环境设备可以提前布置在新机房,已进行存储数据验证和测试。基于以上的原则我们可以得出各应用系统所需的应急环境。需要搭建专用应急环境的系统如下图示。
综合客户服务密码服务平台ATMPCVODS信用卡(CCS)电子密押系统金融自助终端关键网络设备个贷总行前置平台新终端系统现代化支付EVA 存储SNA网关分行前置网上银行卡交换金卫士DMX 存储NAS 存储
其中个贷系统的APP\\DB共用备机,需增加个贷的APP备机;总行前置平台APP\\DB共用备机,需要增加备机;分行前置主备机在同一刀箱,需增加专用应急刀片;对于NAS存储,需要增加NAS应急存储进行数据保护。
需要配备通用应急环境的系统如下图示。
第50页
某银行数据中心整体搬迁策略报告
综合报表反洗钱国际业务结算电子数据存储综合理财商业汇票开放式基金代销黄金交易个人实盘外汇买卖资金交易前中后一体化电子储蓄式国债保理系统新代收代付统一消息平台信贷风险管理SAPOA客户关系管理信用卡销售人员管理征信系统财富管理信用新申请人力资源事后监督(第二部分)信用卡催收管理交易欺诈侦测离行办公系统(VPN)信用卡数据集市银税共享
可根据以上系统的设备类型和数量,按一定比例准备通用应急环境。
3.7 某银行数据中心搬迁实施组织架构建议
数据中心搬迁组织架构体系包括搬迁实施领导小组、搬迁实施工作组两层,其中搬迁实施工作组包括:总行搬迁指挥部(下设公关组、搬迁进度控制组、安保组、后勤组、联络组)、分行搬迁指挥部(下设分行搬迁组);其中搬迁进度控制组分为IT实施组(下设应用组、网络组、系统组、设备组、搬迁实施组、搬迁协调组、第三方技术支持组)、业务组,搬迁进度控制组同时对分行搬迁组进行进度管理。
组织架构如下图所示:
第51页
某银行数据中心整体搬迁策略报告
搬迁实施总行领导委员会 主席:(行长级) 副主席:搬迁实施工作组联络组 总行搬迁指挥部总指挥长:副指挥长:搬迁咨询顾问团队 分行搬迁指挥部 公关组 搬迁进度控制组 安保组 后勤组 IT实施组 业务组 (总行相关业务人员,同时负责分行业务测试协调)分行搬迁组 应用组 网络组 系统组 设备组 操作组 搬迁协调组 支持保障组 搬迁实施厂商 第三方技术支持厂商 3.7.1 搬迁实施总行领导工作委员会职责
搬迁实施总行领导工作委员会(以下简称“领导委员会”)由某银行行长级别的高层领导组成。
职责说明如下:
1. 组织公司相关部门和人员进行数据中心搬迁实施工作。
2. 负责数据中心搬迁实施中的重大事项决策,包括:搬迁启动、应急处置、回切、成功宣告。
3. 决策其它重要工作事项。
3.7.2 搬迁实施工作组职责
搬迁实施工作组主要负责整个搬迁项目的实施,负责为总行领导委员会提供重大事项决策支持,对搬迁进度进行控制,并在紧急情况下实施相应处置措施。
搬迁实施工作组包括:总行搬迁指挥部、分行搬迁指挥部、搬迁进度控制组、公关组、后勤小组、安保组,其中搬迁进度控制组又下设IT实施组、业务组、分行搬迁组。 3.7.2.1 总行搬迁指挥部
总行搬迁指挥部的总指挥长由公司IT运营负责人担任,组员由各部门负责人组成。
第52页
某银行数据中心整体搬迁策略报告
总行搬迁指挥部下设进度控制小组、公关组、后勤组、安保组。 总行搬迁指挥部的职责如下:
1. 负责为领导委员会提供重大事项决策支持。
2. 向领导委员会汇报工作进度、异常情况及问题处理情况。 3. 指挥具体搬迁实施工作,整体控制搬迁实施进度。 4. 指挥实施应急处置措施。 5. 负责与监管机构进行协调。
6. 负责向进度控制组、公共小组、后勤组、安保组的组长下达工作指令。 7. 负责与分行指挥部进行沟通与协调; 3.7.2.2 分行搬迁指挥部
分行搬迁指挥部由各分行主管科技工作的行长组成。 分行搬迁指挥部的职责如下:
1.向总行搬迁指挥部汇报工作进度、异常情况及问题处理情况。 2.指挥分行具体搬迁实施工作,控制分行搬迁实施进度。 3.指挥分行实施应急处置措施。 4.负责与当地监管机构进行协调。 3.7.2.3 联络组
联络组由总行科技运营部相关成员组成。 联络组的职责如下:
1. 作为搬迁工作组的通信中枢,协调新老机房、总行分行、各组之间的通信问题; 2. 与分行、总行相关部门的联络和协调,配合完成实施前的相关准备工作。 3. 及时向总行搬迁指挥部报告工作进度、出现问题以及问题处理进展。 4. 收集IT实施组和业务组搬迁进度信息,并及时向进度控制组汇报; 5. 向IT实施组和业务实施组传达进度控制小组发出的工作指令。
6. 对口落实和解决分行、总行相关部门在实施期间可能出现的突发问题和事件,为对口分行、总行相关部门联系落实技术支持及反馈问题或事件的处理办法。 3.7.2.4 搬迁进度控制组
搬迁进度控制组组长由科技运营部主管经理担任,组员由科技运营部、财会部、信用
第53页
某银行数据中心整体搬迁策略报告 卡中心等相关部门各一名主管经理组成。进度控制组下设IT实施组、业务实施组、分行搬迁组。
进度控制小组的职责如下:
1. 及时向总行搬迁指挥部汇报搬迁工作进展、出现的问题、以及问题处理状况。 2. 根据搬迁实施流程和进度控制表,向IT实施组和业务组发出与搬迁工作相关
的具体工作指令。 3. 收集和发布搬迁进度信息。 4. 监督搬迁工作进度。
5. 对搬迁工作中出现的各种问题进行评估,并将评估结果反馈给总行搬迁指挥
部。
IT实施组
IT实施组由总行科技运营部、信息科技部、搬迁实施合作公司及维保服务商人员组成。 IT实施组负责搬迁中的具体IT实施工作,分为应用组、网络组、系统组、设备组、搬迁协调组、支持保障组、搬迁实施厂商、第三方技术支持厂商,这些小组均向进度控制组接受指令并汇报工作进展和问题状态。
各组职责如下: 应用组
以应用为单位进行搬迁,是整个搬迁项目的核心。应用组由各个应用的应用管理员组成,应用管理员是各应用搬迁的主要负责人,应用管理员的职责如下: 搬迁前职责
1. 作为统一接口,负责整理并确认本应用所使用的IT系统及设备相关信息;(网络组、设备组、系统组提供配合)
2. 配合制定各应用的对外通知、应用及数据库启停、数据备份、系统切换、应用测试、业务验证等操作流程;
3. 熟悉相关设备存在的位置,了解设备的拆卸、清点、交接、安装方案(具体方案由设备组和搬迁实施厂商共同制定)
4. 准备各应用的备用系统(系统组、网络组、设备组提供支持),制定相应应急预案、进行应急系统的测试;
第54页
某银行数据中心整体搬迁策略报告 搬迁中职责
1. 根据进度控制小组指令进行相应批处理、换日等操作;
2. 根据进度控制组指令进行应用及数据库停止、相关数据备份(主要是本地盘上的数据文件,操作系统备份可由操作室提前进行;对个别较为重要的数据库,可请系统组提供相应支持);
3. 指挥并监督搬迁实施厂商根据事先定义的设备拆卸、搬运方案进行设备拆卸、包装;(对于大型或者特殊设备,可由设备组提供相应支持;本应用的专用网络设备,网络组提供相应支持)
4. 对本应用相关设备进行清点、包装箱标签粘贴、交接,并指挥并监督搬迁实施厂商根据事先定义的设备安装方案进行设备上架、系统启动(对于大型或者特殊设备,可由设备组提供相应支持); 5. 指挥并监督实施厂商进行服务器认盘;
6. 进行服务器相关系统恢复(卷、文件系统、群集、IP地址)操作 7. 根据进度控制组指令进行数据库及应用启动(部分重要的数据库可请系统组提供相应支持);
8. 对存储同步复制的数据进行验证;
9. 进行应用验证,并配合业务组进行相应业务检查和验证;
10.对于搬迁过程中的问题及时向搬迁进度控制小组汇报,并根据搬迁进度控制小组指令进行相应操作;
11.在紧急情况下,根据进度控制小组的指令进行应急处理;
搬迁后职责
1. 执行批处理等相关任务;
2. 和操作组一起进行临时备份设置; 3. 对系统进行监控,并加大监控频度
网络组
搬迁前职责
1. 作为统一接口,负责整理并确认网络系统设备相关信息;(设备组提
供配合)
第55页
某银行数据中心整体搬迁策略报告
2. 配合制定网络启停、配置备份、网络测试等操作流程; 3. 和搬迁实施厂商共同制定设备拆卸、清点、交接、安装方案; 4. 配合制定相应应急预案、进行应急系统的测试; 搬迁中职责
1. 对网络设备进行数据备份; 2. 网络配置调整和恢复;
3. 组织电信部门进行线路割接并测试; 4. 配合应用组进行系统连通性测试; 5. 在搬迁时对各个网络设备粘贴搬运标签;
6. 在必要时根据进度控制小组指令,启用应急环境或执行系统回切; 搬迁后职责
1. 在搬迁后进行网络监控并增加监控频度。
系统组
搬迁前职责
1. 协助完成各数据库启停流程,并递交给应用组; 2. 完成核心系统数据库切换流程;
3. 完成新购存储部署、SAN部署、数据复制同步的实施 4. 协助完成应急环境系统的搭建和测试; 5. 配合制定相应应急预案,并协助进行相应测试; 搬迁中职责
1. 对核心系统的数据库进行启停、切换;
2. 对非核心的数据库,协助应用管理员完成数据库启停; 3. 根据进度控制小组指令对相关应用的数据复制同步进行分离; 4. 将新机房的相关存储分配给对应设备;
5. 协助应用管理员进行认盘、卷组处理、群集设置等服务器相关系统操
作;
6. 对系统恢复过程中的问题进行快速响应和技术支持; 7. 在紧急情况下,根据进度控制小组的指令进行应急处理;
第56页
某银行数据中心整体搬迁策略报告
设备组
搬迁前职责
1. 协助搬迁实施商完成设备清点、标签粘贴;
2. 协助搬迁实施商制定设备拆卸、包装、运输、安装方案; 3. 制定设备维保、备件方案;
4. 协助搬迁实施商完成机柜及IT设备摆放设计; 搬迁中职责
1. 指挥和监督搬迁实施商完成设备拆卸、包装、运输、安装、固定、连
线、加电;
2. 在设备出现故障时,协调相关人员立即进行设备故障维修或处理;
操作组
搬迁前职责
1. 协助搬迁实施商制定操作间搬迁方案详细设计; 2. 协助应用管理员完成临时备份方案设计; 3. 搭建临时备份系统; 4. 提前进行系统备份; 搬迁中职责
1. 加强对系统运行状态的监控; 2. 对操作间设备搬迁进行指挥与监督;
搬迁协调组
搬迁前职责
1. 熟悉搬迁协调角色和职责(角色和职责定义具体参见详细方案); 搬迁中职责
1. 在搬迁现场和运输通道对设备搬运进行引导;具体工作地点包括:老
机房门口、电梯口、大堂、装车点、保税区门口、新机房门口、新机房电梯、新机房内。
2. 和海关保持沟通,确保设备无障碍通关;
支持保障组
第57页
某银行数据中心整体搬迁策略报告
负责数据中心搬迁实施期间,提供生产运行的技术保障,对系统运行、操作问题以及突发事件提供技术支持和后援,使出现的突发事件和问题能得到及时支持和解决。
负责数据中心搬迁实施期间的商务、设备配件、密钥的应急协调。
搬迁实施厂商
搬迁前职责
1. 设备配置信息收集与整理 2. 所有搬迁设备和连接关系清点;
3. 新机房布局设计,提出布线及机房环境需求; 4. 准备设备拆卸、安装、连线实施手册; 5. 准备设备搬运、清点、交接实施手册; 6. 单应用搬迁技术实施手册; 7. 单应用搬迁技术应急实施手册 8. 单应用搬迁技术临时备份实施手册; 9. 核心系统切换及紧急回退实施手册; 10. 单应用技术搬迁及紧急回退实施手册 11. 设备标签制定与粘贴 12. 设备健康检查
13. 协助完成应急环境基础设施搭建 14. 参与培训与演练 搬迁中职责
1. 协助完成核心系统存储切换;
2. 在搬迁进度控制组的指令下,根据事先定义的详细方案设计对设备进
行拆卸、包装、运输、清关、就位、安装、连线、加电、操作系统启动;
3. 如出现物理搬运导致的设备物理损坏进行相应赔偿;
第三方技术支持厂商
为搬迁提供产品、技术、服务、管理和决策支持的外部技术支持。包括专
第58页
某银行数据中心整体搬迁策略报告
业咨询公司、专家、产品和服务提供商、系统集成商等团队的成员。在搬迁过程中安排专人提供现场支持服务,并准备应急备件。
业务组
业务小组负责搬迁中的业务操作工作,由总、分行业务部门人员组成。其中,总行业务部门包括:办公室、清算中心、人事部、信贷管理部、信用卡中心、营业部、资产管理中心、资金部。。。。(各相关业务部门) 。
业务实施组的职责如下:
1. 从进度控制组接受指令并汇报工作进展和问题状态。 2. 在搬迁后进行本部门的业务检查。
3. 协调各分行业务部门在搬迁后进行业务检查。 4. 通过联络组,向进度控制组及时反馈业务检查结果。
5. 对本部门和各分行业务部门,在搬迁过程中,如未获进度控制组指令,禁止业务交易发生。
6. 在必要时根据进度控制组指令,并依据业务应急预案,执行业务应急预案的流程。
分行搬迁组
分行搬迁组由各分行科技部和相关业务部门组成,配合总行IT实施组和业务实施组进行系统的重启、连通性测试、应用检查、业务测试。 3.7.2.5 后勤组
后勤小组由后勤部门(包括物业管理单位)负责,向总行搬迁指挥部汇报。 后勤小组的职责如下:
1. 安排布置指挥中心,协调安排指挥通信设施(固定电话、对讲机等) 2. 负责协调搬迁沿途的交通问题,确保搬迁路径通畅;
3. 负责与海关进行沟通,确保实现清关无障碍(具体清关方式参见清关方案建议)。 4. 负责搬迁操作区域的障碍清除、照明工作。 5. 负责协调新旧机房大楼的电梯操作、现场故障维修。 6. 负责安排搬迁过程中的人员就餐、休息、用车等后勤事项。
第59页
某银行数据中心整体搬迁策略报告
7. 对搬迁工作可能引起的居民干扰进行解释和疏导工作。 8. 提供必要的简易医疗物品。 3.7.2.6 公关组
公共组由总行办公室负责,职责如下:
1. 负责与人民银行、银监会、公安机关、安全生产监督管理机关等国家相关机构的联络和信息沟通。
2. 组织做好对外媒体公告解释工作,在报纸、网站提前刊登通知,并制定向公众沟通解释的统一用语。
3. 根据《银监会<重大突发事件报告制度>的实施细则》,统一归口办公室对外报告实施期间的突发事件。 3.7.2.7 安保组
安保小组由总行保卫部负责,向总行搬迁指挥部汇报。 安保小组的职责如下:
1. 负责在搬运沿途和新旧机房大楼操作区域的安全保障。 2. 安排经警在搬运现场担任警戒工作。 3. 负责设备的押运。
第60页
某银行数据中心整体搬迁策略报告
4 总结
某银行业务的重要性,决定了其数据中心整体搬迁策略绝不是一个简单的任务。通过采用神州数码的数据中心搬迁方法学,在某银行的大力配合下,经过60多场次的访谈和大量的信息整理,我们从IT基础架构、应用关联关系、业务中断影响、批处理关联、系统保护现状、物理设备共享关系、设备冗余情况、机房现有环境、人员组织架构及搬迁风险等方面,对某银行的搬迁需求进行了分析,从而得到了相对完整的某银行数据中心整体搬迁策略,主要包括:
1. 搬迁批次:分三个大的批次进行,其中批次1主要为对内的部分系统,批次2主要为对外业务系统,批次3为剩余系统;具体搬迁的应用划分参见3.2节;
2. 搬迁时间:2月20日为批次1的主要搬迁时间,批次2的搬迁时间为3月20日,批次3为3月底或者4月初的某个周末。
2月20日2月5日EVA8100-2及相关业务系统搬迁3月6日核心类系统的备机搬迁第二批次搬迁第一批次搬迁•部分对内业务系统搬迁•网络设备搬迁•网络线路割接•核心业务系统切换•主要业务系统搬迁3月20日3月底4月初第三批次搬迁•剩余业务系统、安全、网络管理类系统•DMX1000、DMX3、EVA8100-1、STK带库搬迁•利旧设备:UPS、空调等搬迁准备工作•新旧机房网络连通、测试完成;新机房线路测试完成•DMX上第一批次系统数据同步•EVA8100-2至新机房EVA8400数据同步•过渡备份环境搭建第二次数据同步•DMX上第二批次系统数据同步•EVA8100-1至EVA8100-2数据同步(部分业务系统)及数据验证、测试第三次数据同步•EVA8100-1至EVA8100-2数据同步(剩余业务系统SAP、OA)及数据验证、测试
批次1为多个子批次,批次1完成后的1个月为试运行期,可以验证新机房的
运行环境。操作室的相关业务也在批次1后开始在新数据中心进行;批次1可以选择周末,在不影响业务的情况下进行;
批次2的设备相对较多,选择3月20日周六0点进行,在考虑业务验证、应
第61页
某银行数据中心整体搬迁策略报告
急缓冲等情况后,预计最长到周一12点结束;
批次3设备相对较少,也可以选择某个周末,在不影响业务的情况进行; 3. 搬迁方式:综合客服、SNA网关采取切换的方式,其他系统采取设备搬迁结合数据切换的方式。
4. 应急策略:
和设备厂家沟通,确立厂家现场提供支持和准备相关备件; 利用部分开发机、测试机搭建通用应急环境,
利用新购的备机、提前搬迁的冷备机搭建专用应急环境; 对于综合客服,充分利用灾备系统; 安排人员对搬迁过程中的事件进行应急处理;
5. 临时备份策略:新数据中心借用NAS设备搭建开放系统临时备份空间,将3590磁带机提前搬迁至新数据中心用于主机的临时备份;老机房利用部分存储空间搭建临时备份空间;
6. 组织架构策略:建立起以行长级别领导为总指挥的搬迁指挥部,从应用角度出发,建立面向应用的数据中心搬迁实施小组,各应用管理员负责相关应用的搬迁实施,由搬迁进度控制小组统一指挥控制,其他小组提供相应配合和支持。
需要注意的是,搬迁策略只是搬迁实施的指导方向,随着设备的详细清点和实施方案的细化设计,搬迁策略可以根据实际情况再进行适当调整。
第62页
因篇幅问题不能全部显示,请点此查看更多更全内容