Live Volume with Auto-Failover (LVAFO)是Dell SC系列存储内置的解决方案功效,艰深的讲就是两套SC系列存储树立同步复制的卷能够同时被前端主机进行读写访问,并且还可以或者实现存储级其余自动故障转移,从而实现存储的“双活”。
两台存储上的Live volume卷将使用相同的设备ID,当主机扫描到备存储上的卷时,不会将这个卷当作一个新的设备,而是主机上的卷设备衔接多了多少条路径。
以一个500GB卷为例,在已将备存储上的LV卷映射给主机前,主机上看到2条到主存储LV卷的路径。
[root@ljjr910-a ~]# multipath -ll
mpathd(36000d31000f19000000000000000020f) dm-3 COMPELNT,Compellent Vol
size=500G features="1 queueifnopath" hwhandler="0" wp=rw
`-+- policy="round-robin 0" prio=1 status=active
|- 3:0:9:2 sdb 8:16 active ready running
`- 3:0:17:2 sde 8:64 active ready running
映照备存储上的卷后,主机上看到一共看到4条路径,个中2条是到主存储的门路,2条是到备存储的路径。
[root@ljjr910-a ~]# multipath -ll
mpathd (36000d31000f19000000000000000020f) dm-3 COMPELNT,Compellent Vol
size=500G features="1 queueifnopath" hwhandler="0" wp=rw
`-+- policy="round-robin 0" prio=1 status=active
|- 3:0:9:2 sdb 8:16 active ready
running <-到主存储的路径
|- 3:0:17:2 sde 8:64 active ready
running <-到主存储的路径
|- 3:0:13:2 sdg 8:96 active ready
running <-到备存储的路径
`- 3:0:19:2 sdi 8:128 active ready
running <-到备存储的路径
关闭主存储后,主机上便只能看到到备存储的2条路径。
[root@ljjr910-a ~]# multipath -ll
mpathd(36000d31000f19000000000000000020f) dm-3 COMPELNT,Compellent Vol
size=500G features="1 queueifnopath" hwhandler="0" wp=rw
`-+- policy="round-robin 0" prio=1 status=active
|- 3:0:13:2 sdg 8:96 active ready running
`- 3:0:19:2 sdi 8:128 active ready running
LV with AFO若何实现
Live Volume with Auto-Failover的实现重要有两个要害点,一是两套SC存储外部LV卷都使用与主卷创建时雷同的设备ID,发布是经由过程主机上的多路径在完成对设备的封装后,酿成一个卷,那个卷同时有到主存储和备存储的路径。一旦主存储出现不测(如断电招致整个存储弗成用),主机上的IO只是产生路径的切换,全部切换过程应用不会中断,保证营业的连续运行。
LV with AFO 靠得住么
测验圆案是不是可靠,咱们以现实谈话,Dell部署服务团屡次以实战去检修过,实在的“双活”是没有怕测的。
如下是一个比拟完全的存在Windows、VMware、Linux平台答用皆有的存储双活典范案例。
1
VMware vSphere环境实战
在VMware主机层面,2台Dell PowerEdge 服务器部署 vSphere 6.0 U2 虚拟化平台,配置了集群并启用了HA功能,可以在一定程量上避免因为主机的硬件或软件故障引起的非规划停机和业务中断。在存储层面,Dell SC Storage Live Volume Auto-Failover (LVAFO) 提供的存储双活解决方案能避免因单套存储要素引起的服务中断,将2套存储的live volume卷同时映射给虚拟化集群内贪图的vSphere 服务器,DataStore地点卷具备如下多路径建设。
在DSM存储管理界面,关闭主存储,模拟主存储故障。
在DSM中检查live volume存储状况,可以看到LV卷的存储脚色主动故障转移胜利实现。
登录到虚拟化服务器,确认存储卷是不是能正常访问,业务系统虚拟机是不是正常运行。
文明可以正常上传,实拟机可以正常运行,不会因为主存储的关机而致使IO结束。
2
Windows平台的Oracle RAC情况实战
2台Dell PowerEdge办事器装置windows 2012 R2 效劳器草拟体系,经过进程将SC4020主备存储分别过去的磁盘经由过程ASM整开后安排Oracle Rac数据库,在必定水平上躲免由于主机的硬件或硬件故障引发的非打算停机跟营业中止。在存储层面,Dell SC Storage Live Volume Auto-Failover (LVAF) 供给的存储单活处理计划能防止果单套存储身分惹起的服务中断,将2套存储的live volume卷同时映射给2台Windows 2012办事器节点,存储卷多路径设置以下。
在每个RAC节面下,调整ASM磁盘超时的参数asmhbeatiowait,该参数在Oracle11.2.0.4中默许是15秒,提议建改成120秒。
登录到DSM治理界里,封闭主存储,模仿主存储毛病。
在DSM管理页面可以看到存储状态切换成功。
登录到Windows服务器节点,可以看到存储卷另有两条路径在线。
主机层面卷能够畸形辨认,在Oracle利用层面再确认存储卷是否是能正常拜访,最后发明RAC数据库仍旧能正常运转。
3
Linux平台的Oracle RAC环境实战
Oracle RAC运行于Linux平台是今朝比较罕见的部署款式格式,并且最年夜限制的保障业务的连气女运行是Dell宾户比较关系的话题。
经由过程将Linux仄台的Oracle RAC 取LVAFO联合,能完成一个双机双柜的架构本相。在主机层面经由过程Oracle RAC真现下可用性,当一个主机呈现故障后,RAC中的别的节点能持续提供数据库服务。在存储层面,当一台存储涌现故障后,IO切换到别的一台存储上。
在存储SC4020-A上创立一个数据卷Data Disk和一个Voting Disk,将卷同时映射给服务器R910-A、R910-B。
在服务器上使用ASMLIB启拆数据卷Data Disk和 Voting Disk。
服务器A、B之间运行Oracle RAC。
[root@ljjr910-a ~]# crsstat -t
Name Type Target State Host
————————————————-
ora.DATA.dg ora….up.type ONLINE ONLINE ljjr910-a
ora.GRID.dg ora….up.type ONLINE ONLINE ljjr910-a
ora….ER.lsnr ora….er.type ONLINE ONLINE ljjr910-a
ora….N1.lsnr ora….er.type ONLINE ONLINE ljjr910-b
ora.asm ora.asm.type ONLINE ONLINE ljjr910-a
ora.cvu ora.cvu.type ONLINE ONLINE ljjr910-b
ora.dsc.db ora….se.type ONLINE ONLINE ljjr910-a
ora.gsd ora.gsd.type OFFLINE OFFLINE
ora….SM1.asm application ONLINE ONLINE ljjr910-a
ora….-A.lsnr application ONLINE ONLINE ljjr910-a
ora….0-a.gsd application OFFLINE OFFLINE
ora….0-a.ons application ONLINE ONLINE ljjr910-a
ora….0-a.vip ora….t1.type ONLINE ONLINE ljjr910-a
ora….SM2.asm application ONLINE ONLINE ljjr910-b
ora….-B.lsnr application ONLINE ONLINE ljjr910-b
ora….0-b.gsd application OFFLINE OFFLINE
ora….0-b.ons application ONLINE ONLINE ljjr910-b
ora….0-b.vip ora….t1.type ONLINE ONLINE ljjr910-b
ora….network ora….rk.type ONLINE ONLINE ljjr910-a
ora.oc4j ora.oc4j.type ONLINE ONLINE ljjr910-b
ora.ons ora.ons.type ONLINE ONLINE ljjr910-a
ora.scan1.vip ora….ip.type ONLINE ONLINE ljjr910-b
将数据卷Data Disk和Voting Disk卷设备成Live Volume Auto Failover,将数据从SC4020-A 同步复造到SC4020-B,确保相干卷的live volume配对关联正常。
在SC4020-B大将数据卷Data Disk和 Voting Disk卷对付应的Live Volume卷也映射给服务器R910-A、R910-B;在服务器上查看,每个装备各有4条路径。
[root@ljjr910-a ~]# multipath -ll
mpathe (36000d31000f190000000000000000267) dm-2 COMPELNT,Compellent Vol
size=1.0G features="1 queueifnopath" hwhandler="0" wp=rw
`-+- policy="round-robin 0" prio=1 status=active
|- 3:0:7:1 sda 8:0 active ready running
|- 3:0:11:1 sdc 8:32 active ready running
|- 3:0:15:1 sdh 8:112 active ready running
`- 3:0:21:1 sdj 8:144 active ready running
mpathd (36000d31000f19000000000000000020f) dm-3 COMPELNT,Compellent Vol
size=500G features="1 queueifnopath" hwhandler="0" wp=rw
`-+- policy="round-robin 0" prio=1 status=active
|- 3:0:9:2 sdb 8:16 active ready running
|- 3:0:17:2 sde 8:64 active ready running
|- 3:0:13:2 sdg 8:96 active ready running
`- 3:0:19:2 sdi 8:128 active ready running
假如应用了多个Voting Disk,借须要调剂ASM磁盘超时的参数asmhbeatiowait,应参数正在Oracle11.2.0.4中默许是15秒,倡议修正为120秒。
使用HammerDB对RAC数据库禁止压力测试。
在DSM管理界面,闭失落主存储,存储脚色自动切换到备存储。
而在测试过程傍边,在HammerDB的管理界面上可以看到,运用出现长久停留后继承运止。
“功德成双”,经由过程公道的架构计划,Dell Compellent SC系列存储可以多种环境如Windows 2012、VMware vSphere、Linux情况下,启载多种应用服务如Oracle RAC数据库、NAS服务、虚构机系统、MSCS散群应用环境,实现真挚意思上的存储“双活”。