admin管理员组

文章数量:1530286

一、云计算(按需付费,集中资源对外提供服务)

1、云本身没有资源,云是资源整合者,整合底层的所有计算机资源(cpu、内存、磁盘等)
云计算不是技术,而是一种商业模式,集中资源,对外提供服务;通过云计算,用户可以使用的资源包括网络、服务器、存储、应用及服务等,这些资源全部属于IT领域,云计算的目标就是让大众像获取水电一样获取到IT服务;
通俗地讲,“云”是网络、互联网的一种比喻说法,即互联网与建立互联网所需要的底层基础设施的抽象体。“计算”指的是一台足够强大的计算机提供的计算服务(包括各种功能,资源,存储)。“云计算”可以理解为:通过互联网可以使用足够强大的计算机为用户提供的服务,这种服务的使用量可以使用统一的单位来描述。

2、云计算的5个价值:
2.1、按需自助服务:消费者可以按需部署处理能力,如服务器时间和网络存储,而不需要与每个服务供应商进行人工交互。
2.2、广泛网络接入:可以通过互联网获取各种能力, 并可以通过标准方式访问,通过各种客户端接入使用。例如移动电话,笔记本电脑,PAD等。
2.3、资源池化:供应商的计算资源被集中起来,以便以多用户租用模式服务所有客户,同时不同的物理和虚拟资源可根据客户需求动态分配和重新分配。客户一般无法控制或知道资源的确切位置。这些资源包括存储、处理器、内存、网络带宽和虚拟机等。
2.4、快速部署,弹性扩容:云计算可以迅速、弹性地提供能力,能快速扩展,也可以快速释放实现快速缩小。对客户来说,可以租用的资源看起来似乎是无限的,并且可在任何时间购买任何数量的资源。
2.5、可计量服务:云服务的收费是基于用户实际使用的资源进行计量,比如云主机的CPU、内存、存储容量,网络带宽的消耗,按小时计费或者包年包月。
3、云计算的部署模式:
3.1、公有云:云服务运营商拥有云基础设施,并且为公众或者企业用户提供云服务。云计算基础设施由一个组织拥有并且向公众或者大型的工业团体销售云计算服务,用户可以通过互联网像使用水电一样使用IT服务。
3.2、私有云:购买对应云厂商的私有云软件 HCS Huawei cloud stack 部署在你自己的数据中心或机房里面,去自己维护使用。私有云通常部署在企业或单位内部,运行在私有云上的数据全部保存在企业自有的数据中心内,如果需要访问这些数据,就需要经过部署在数据中心入口的防火墙,这样可以在最大程度上保护数据。
3.3、混合云:我是一家初创型公司,使用公有云的弹性云服务器ECS,但是我也有自己的自建机房或数据中心,有自己的核心数据库。把云上的应用业务对接到我自建机房的数据库里面,线上线下通过专线或者VPN打通。混合云是一种比较灵活的云计算模式,它可能包含了公有云、私有云或者后面要讲的行业云中的两种或两种以上的云,用户的业务可以根据需求在这几种云上切换。
3.4、行业云/政务云/社区云:它们针对的是某一个特定的行业,进行的深度定制,有全套的解决方案。
4、云计算的服务模式:
4.1、IaaS(Infrastructure as a Service),基础设施即服务,就是由云平台提供基础设施(如:服务器、存储、网络、虚拟化资源)以及负责相关资源的维护,用户只需要关注系统和应用层面的部分即可。ECS 弹性云服务器/VPC/EVS/BMS等。将计算、存储、网络等资源抽象化后将资源提供给用户使用。
4.2、PaaS(Platform as a Service),平台即服务,就是由云平台提供基础设施(如:服务器、存储、网络、虚拟化资源)+应用部署环境(如:操作系统、中间件、软件运行环境)以及负责相关资源的维护,用户只需要关注应用和数据本身即可。DB数据库/中间件/容器等。为用户提供数据库服务、容器服务、微服务开发等服务,即将一个开放平台作为服务提供给用户。
4.3、SaaS(Software as a Service)软件即服务,就是由云平台提供全部资源服务以及维护,用户只管使用应用即可。云会议/云桌面/云客服等。提供场景化的应用,即将应用作为服务提供给用户。
相比传统IT全流程全设备采购的方式,云服务模式将IT设备服务化地销售,让客户按需选择,在使用灵活性和成本上比传统IT更有优势。

应用容器化 (Docker )+ 应用支持容器的编排调度(K8S),容器类似集装箱,容器是轻量级的,容器比虚拟机更轻量。
云原生(所有应用都在云里)和微服务(一个个微服务模块拼接的,项目拆分部署)
云原生(Cloud Native),云原生应用Cloud Native Application 指应用从设计开始就是为部署在云环境上的。
华为Learning网站:http://support.huawei/learning/Index!toTrainIndex
华为Support案例库:http://support.huawei/enterprise/servicecenter?lang=zh
华为官方案例库:http://support.huawei/enterprise/zh/knowledge/cloud-computing-vid-1482614363727

二、服务器基础知识(含RAID、IPMI)


1、塔式服务器:有的塔式服务器采用大小与普通立式计算机大致相当的机箱,有的采用大容量的机箱,像个硕大的柜子。通过转换支架可转化成机架式的服务器。
2、刀片服务器:特点是每个服务器都是一个插板,在插板上配备有处理器、内存、硬盘以及相关组件。由于刀片服务器的特殊架构,所以刀片服务器的使用还需要与刀片服务器的专用机箱结合,通常在一个机箱中可以容纳几个到几十个刀片服务器,所以对于高性能计算、多种应用的前台服务器,应用服务器,以及后台的中心数据库应用都可以满足。
3、机架服务器:机架式服务器的外形看来不像计算机,而像交换机,有1U(1U=4.5cm)、2U、4U等规格。机架式服务器安装在标准的19英寸机柜里面。这种结构的多为功能型服务器。 特点是机箱尺寸比较小巧,在机柜中可以同时放置多台服务器,从而获得更高的处理能力。
TaiShan 200服务器用户指南,3D模型展示:https://info.support.huawei/computing/server3D/index_zh.html
FusionServer Pro 2288H V5 服务器 硬件安装及部件更换,https://support.huawei/enterprise/zh/doc/EDOC1100002168?section=o004

CPU:Central Processing Unit,中央处理器,CPU主要功能是解释计算机指令及处理计算机软件中的数据。
CPU:是服务器上的核心处理单元,而服务器是网络中的重要设备,要处理大量的访问需求。因此对服务器具有大数据量的快速吞吐、超强的稳定性、长时间运行等严格要求。所以说CPU是计算机的“大脑”,是衡量服务器性能的首要指标。

CPU由逻辑运算单元、控制单元和存储单元构成。
1、控制器:计算机是根据事先存储的程序对全机实行控制,而程序是指能实现某一功能的指令序列,控制器就是根据指令来对各种逻辑电路发布命令的机构,它是计算机的指挥中心,控制整个CPU的工作,决定计算机运行过程的自动化。
2、运算器:计算机中执行各种算术和逻辑运算操作的部件。运算器的基本操作包括加、减、乘、除四则运算,与、或、非、异或等逻辑操作,以及移位、比较和传送等操作,亦称算术逻辑部件。
3、寄存器:寄存器的主要作用是用来暂时存放参与运算的数据和运算结果,具有接收数据、存放数据和输出数据的功能。
CPU的频率:
1、主频:主频也叫时钟频率,单位是兆赫(MHz)或吉赫(GHz),用来表示CPU的运算、处理数据的速度。
2、外频:外频是CPU的基准频率,单位是MHz。CPU的外频决定着整块主板的运行速度。
3、总线频率:总线频率直接影响CPU与内存数据交换的速度。
4、倍频系数:倍频系数是指CPU主频与外频之间的相对比例关系。

在计算机的组成结构中,有一个很重要的部分就是存储器。存储器是用来存储程序和数据的部件,对于计算机来说,有了存储器,才有记忆功能,才能保证正常工作。
内存是电脑中的主要部件,它是相对于外存而言的。我们平常使用的程序,如Windows操作系统、打字软件、游戏软件等,一般都是安装在硬盘等外存上的,必须把它们调入内存中运行,才能真正使用其功能。我们平时输入一段文字,或玩一个游戏,其实都是在内存中进行的。通常我们把要永久保存的、大量的数据存储在外存上,而把一些临时的或少量的数据和程序放在内存上。
内存是计算机中重要的部件之一,它是与CPU进行沟通的桥梁。计算机中所有程序的运行都是在内存中进行的,因此内存的性能对计算机的影响非常大。内存由内存芯片、电路板、金手指等部分组成。
内存:
1、存储器按用途可分为主存储器和辅助存储器。主存储器又称内存储器(简称内存),是CPU能直接寻址的存储空间。
2、内存的作用是用于暂时存放CPU中的运算数据,以及与硬盘等外部存储器交换的数据。
3、内存是计算机中重要的部件之一,它是与CPU进行沟通的桥梁。
4、内存由内存芯片、电路板、金手指等部分组成。
服务器内存插槽及配置原则:
1、同一台服务器必须使用相同型号的DIMM。
2、CPU对应的内存槽位上必须至少配置一根内存条。
3、当服务器配置完全平衡的内存条时,可实现最佳的内存性能。不平衡配置会降低内存性能,因此不推荐使用。

硬盘是计算机最主要的存储设备。硬盘接口是硬盘与主机系统间的连接部件,作用是在硬盘缓存和主机内存之间传输数据。不同的硬盘接口决定着硬盘与计算机之间的连接速度,直接影响着程序运行快慢和系统性能好坏。

MTBF:Mean Time Between Failure,平均无故障工作时间。
在价格方面,通常来说SATA和NL-SAS硬盘较为便宜,SAS硬盘较贵一些,SSD最为昂贵。

网卡,又称为网络适配器或网络接口卡NIC(Network Interface Card),是构成计算机网络系统中最基本的、最重要的、必不可少的连接设备,计算机主要通过网卡接入网络。
网卡主要功能:代表固定的网络地址;数据的发送与接收;数据的封装与解封;链路管理;编码与译码。
TaiShan 200 DA121C服务器节点维护与服务指南:https://support.huawei/enterprisesearch/ebgSearch?lang=zh#keyword=TaiShan%20200%20DA121C&lang=zh&type=searchAll&outside=0


电源冗余特性:
1+1,此时每个模块承担50%的输出功率,当一个模块拔出时,另一个模块承担100%输出功率。
2+1,有三个模块,每个模块承担输出功率的1/3,拔出一个模块,其余两个模块各承担50%的输出功率。

RAID

RAID卡又名磁盘阵列卡,简称阵列卡。硬盘是插在RAID卡上,RAID卡的作用:
1、可以将若干硬盘驱动器按照一定要求组成一个整体、由阵列控制器管理的系统。
2、可以提高磁盘子系统的性能及可靠性。
LSI SAS3108 RAID控制卡用户指南:https://support.huawei/enterprise/zh/doc/EDOC1100048779/653c6b1f

RAID:Redundant Array of Independent Disks,独立磁盘冗余阵列,RAID技术将多个单独的物理硬盘以不同的方式组合成一个逻辑硬盘,从而提高了硬盘的读写性能和数据安全性。
RAID技术有2种不同的方式进行数据保护:
1、镜像,在另一块冗余的硬盘上保存数据的副本。
2、奇偶校验算法(XOR),相同为假,相异为真。对于使用奇偶校验的RAID类型,需要额外的校验磁盘。


RAID0条带化:数据条带化分布到磁盘,高的读写性能,磁盘利用率为100%,数据没有冗余策略,一块磁盘故障数据无法恢复。至少2块磁盘,也可单盘做RAID0但意义不大。
RAID1镜像:至少2块磁盘,数据同时一致写到主硬盘和镜像硬盘,磁盘利用率为50%,一块磁盘故障不会影响数据的读写。
RAID3 条带化奇偶校验:至少3块磁盘,数据条带化分布在数据盘中,同时使用专用校验磁盘存放校验数据。
RAID5 分布式条带化奇偶校验:(保证安全(奇偶校验位)和性能(条带化)),但校验数据均匀分布在各数据硬盘上,RAID成员硬盘上同时保存数据和校验信息(RAID5是最常见的)
1、至少需要3块磁盘。
2、数据条带化存储在磁盘,读写性能好,磁盘利用率为(n-1)/n。
3、以奇偶校验(分散)做数据冗余。
4、一块磁盘故障,可根据其他数据块和对应的校验数据重构损坏数据(消耗性能)。

RAID6特点:
1、至少需要4块磁盘。
2、数据条带化存储在磁盘,读取性能好,容错能力强(双重奇偶校验,允许坏两块磁盘)。
3、采用双重奇偶校验方式保证数据的安全性。
4、如果2块磁盘同时故障,可以通过两个校验数据来重建两个磁盘的数据。
RAID10特点:将镜像和条带进行两级组合的RAID级别,第一级是RAID1镜像,第二级为RAID0条带(RAID10应用比较广泛)
1、RAID10是raid1+raid0的组合。
2、至少需要4块磁盘。
3、两块硬盘为一组先做raid1,再将做好raid1的两组做raid0。
4、兼顾数据的冗余(raid1镜像)和读写性能(raid0数据条带化)。
允许两组raid1各坏一块磁盘,没有奇偶校验位,不允许一组raid1同时坏2块硬盘。


RAID热备盘:当冗余的RAID组中某个硬盘失效时,在不干扰当前RAID系统正常使用的情况下,用RAID系统中另外一个正常的备用硬盘自动顶替失效硬盘,及时保证RAID系统的冗余性。
3块硬盘的话,剩余一块硬盘可给RAID1加个热备盘,RAID1有个盘坏了正常情况是把坏的盘拿出来换个好的盘进去,即便这里有3块硬盘多了一块硬盘也不会自动顶上去的,但设置热备盘后就会兼顾RAID1,只要RAID1有个盘坏了就会自动顶上去。没有设置热备盘不会自动顶上去的,会读取卡槽位,把坏的盘拿出来,再在同一个卡槽位插一块硬盘上去,才会重新组建RAID1,热备盘是个千年备胎,RAID1有个盘坏了它就顶上去,但把坏的盘拔出来插上新的硬盘,热备盘再回去继续当热备盘。

RAID的实现方式有2种,硬件实现、软件实现。
基于硬件的RAID是利用硬件RAID适配卡来实现的。
硬件RAID又可分为内置插卡式和外置独立式磁盘阵列 。
RAID卡上集成了处理器,能够独立于主机对RAID存储子系统进行控制。因为拥有自己独立的处理器和存储器,RAID卡可以自己计算奇偶校验信息并完成文件定位,减少对主机CPU运算时间的占用,提高数据并行传输速度。

RAID的实现 - 软件方式
软件RAID是指在操作系统中,通过安装软件的方式来实现RAID相应的功能。
软件RAID不需要昂贵的RAID控制卡,提供了廉价的解决办法。
RAID功能完全依靠CPU执行,主机的CPU占用严重,如RAID 5的大量异或(XOR)操作。
软件RAID中不能提供如下功能:硬盘热拔插;硬盘热备份;远程阵列管理;可引导阵列支持;在硬盘上实现阵列配置;SMART硬盘支持。

RAID不可作为数据备份的替代方案,它对非磁盘故障等造成的数据丢失无能为力,比如病毒、人为破坏、意外删除等情形。所以,数据备份、灾备等数据保护措施是非常必要的,与RAID相辅相成,保护数据在不同层次的安全性,防止发生数据丢失。

IPMI

IPMI:Intelligent Platform Management Interface,智能平台管理接口,是一种开放标准的硬件管理接口规格,定义了嵌入式管理子系统进行通信的特定方法。在服务器主板上的基板管理控制器BMC,嵌入IPMI。IPMI信息通过基板管理控制器(BMC)进行交流。用户可以利用IPMI监视服务器的物理健康特征,如温度、电压、风扇工作状态、电源状态等。IPMI是一个开放的免费标准协议。
BMC:Baseboard Management Controller,主板管理控制单元,是IPMI规范的核心,负责各路传感器的信号采集、处理、储存,以及各种器件运行状态的监控。BMC向机框管理板提供被管理对象的硬件状态及告警等信息,从而实现机框管理模块对被管理对象的设备管理功能。
BMC主要实现以下功能:远程控制;告警管理;状态检测;设备信息管理;散热控制;支持ipmitool工具;支持Web界面管理;支持集中账号管理。

Mgmt=management 管理口,服务器上有个远程管理卡口,是管理物理服务器的,通过IPMI标准协议来实现的。所有厂商底层都是走IPMI协议,发出的指令都是ipmitool 指令,IPMI协议是Intel开发并开源的协议。
远程管理口有内置芯片,芯片内置mini-OS(迷你操作系统),不像普通网卡用来传数据的,通电不开机也算是被激活了。远程管理口的默认出厂ip等信息(可修改)在服务器后面,浏览器输入管理口ip访问服务器。

各个服务器厂商他们的远程管理名称不一样。
戴尔服务器DELL:iDRAC 远程访问控制

华为服务器Huawei,iBMC远程访问控制

远程管理口可以对服务器进行监控温度、风扇、健康状态、开机(上电)、关机(下电)、重启、安装操作系统等。远程管理口就能直接安装操作系统,不用U盘安装操作系统。

跳板机和BMC远程管理口上ip可以不是一个网段,只要打通其网络就行。
想在公司远程连接远程管理口,公司内网要和远程管理口网络互通。
服务器远程管理口–>交换机–>防火墙–>外部远程
服务器网卡口–>交换机–>防火墙–>外部远程

BIOS:Basic Input/Output System,基本输入输出系统。BIOS实际上是固化到计算机中的一组程序,为计算机系统提供最底层的、最直接的硬件控制服务,解决硬件的实时需求。
BIOS是系统内核和硬件层之间桥梁。
BIOS的功能:检测和初始化硬件;操作系统引导;高级电源管理。
BIOS特点:软件升级、加载和装载功能;基本OAM功能;串口管理功能;故障恢复功能;ECC管理功能;硬件诊断功能。

三、华为产品手册及软件下载

华为产品手册及软件下载:https://e.huawei/cn/
华为帮助中心:https://support.huaweicloud/

案例库(华为云官方的比百度排错靠谱)

华为文档阅读器,打开以.hdx结尾的文件(华为产品手册很详细)。


四、华为虚拟化平台FusionCompute8.2.0

FusionCompute主要负责硬件资源的虚拟化,以及对虚拟资源、业务资源、用户资源的集中管理。它采用虚拟计算、虚拟存储、虚拟网络等技术,完成计算资源、存储资源、网络资源的虚拟化。同时通过统一的接口,对这些虚拟资源进行集中调度和管理,从而降低业务的运行成本,保证系统的安全性和可靠性,协助运营商和企业构筑安全、绿色、节能的云数据中心能力。
VRM: Virtual Resource Management 虚拟资源管理,并提供web界面。
CNA: Compute Node Agent 计算节点代理。

1、虚拟化计算,将服务器物理资源抽象成逻辑资源,让一台服务器变成几台甚至上百台相互隔离的虚拟服务器,不再受限于物理上的界限,而是让CPU、内存、磁盘、I/O等硬件变成可以动态管理的“资源池”,从而提高资源的利用率,简化系统管理。同时硬件辅助虚拟化技术提升虚拟化效率,增加虚拟机的安全性。

2、虚拟化存储,存储设备的能力、接口协议等差异性很大,存储虚拟化技术可以将不同存储设备进行格式化,将各种存储资源转化为统一管理的数据存储资源。用户不需要再关注存储设备的类型和能力,存储虚拟化可以将存储设备进行抽象,以逻辑资源的方式呈现,统一提供全面的存储服务。

3、网络虚拟化,FusionCompute支持分布式虚拟交换机,可以向虚拟机提供独立的网络平面。像物理交换机一样,不同的网络平面间通过VLAN进行隔离。分布式虚拟交换机的功能类似于普通的物理交换机,每台主机都连接到分布式虚拟交换机中。分布式虚拟交换机的一端是与虚拟机相连的虚拟端口,另一端是与虚拟机所在主机上的物理以太网适配器相连的上行链路。通过它可以连接主机和虚拟机,实现系统网络互通。

BMC平面:服务器主机远程管理口所使用的网络。
管理平面:VRM和CNA走就是管理网络。
存储平面:FC连接存储,走的就是存储网络。
业务平面:上层应用访问FC的虚拟机(ERP),走的就是业务网络。

安装FusionCompute软件包可以从http://support.huawei/enterprise下载
产品文档链接:https://support.huawei/hedex/hdx.do?docid=EDOC1100215352&lang=zh
VRM有两种部署方式:
1、物理机部署,性能好(VRM管理的CNA超过50台,建议使用物理机部署)
2、虚拟化部署(VRM管理的CNA小于50台,建议使用虚拟化部署)
CNA必须物理机部署,因为未来要在CNA中安装虚拟机(如果CNA是虚拟机,虚拟机里跑虚拟机性能差)通过PXE方式批量安装主机,通过手动挂载ISO安装单台主机。
VRM虚拟化部署,要先安装两台CNA(物理机部署),再使用华为部署工具部署VRM(VRM要主备部署,把两台VRM当做虚拟机部署在两台CNA中)。
ios是物理机部署,zip压缩包模板是虚拟化部署,华为部署工具把VRM的zip压缩包模板导入CNA中成为虚拟机运行。
X86架构:复杂型指令集,ARM架构:精简型指令集(手机都是ARM架构)华为服务器是基于ARM架构的。

云下面是虚拟化平台,虚拟化只提供基础架构,云可以提供服务。
OpenStack 开源云操作系统
KVM 开源虚拟化
大部分云厂商都是基于OpenStack 做二次开发。虚拟化是所有云的基础,云的底层是虚拟化(也可以是物理裸机)。

FusionCompute 华为企业级虚拟化是基于开源KVM做二次开发,KVM是基于CPU的硬件辅助虚拟化方案,它需要CPU虚拟化特性的支持。

VRM虚拟资源管理,VRM提供web界面来管理整个集群资源,所有虚拟机都是运行在CNA上。

怎样让物理服务器具备虚拟化能力?物理服务器最终都是要安装操作系统的(windows/linux等)
CNA是个定制的欧拉系统EulerOS,基于centos内核只保留和kvm虚拟化相关的代码,CNA默认已经部署好kvm虚拟化的软件。通过加载华为提供的cna.iso镜像去在物理服务器上安装这个操作系统,安装好之后,这台物理服务器就具备了虚拟化能力。称这台安装了cna.iso 的物理服务器为 CNA。

五、虚拟机VM模拟物理机部署CNA和VRM

CNA必须物理机部署,只是体验CNA安装过程。



CNA是欧拉系统EulerOS,是基于centos内核的








小于150G不让安装的,实际没有150G没关系用不了150G的。


CNA和VRM要求最低内存8192M(8G),硬盘200G



把仅主机模式的网卡VMnet1(NAT模式是VMnet8)设置成和物理机同一个网段就能相互ping通。

挂载光盘iso,并开启此虚拟机




虚拟机模拟物理机部署CNA这里就不设置网关了(虚拟机NAT网关,默认都是 .2),选第三个不带VLAN




初始化甘道夫(gandalf)密码

默认情况下CNA(EulerOS欧拉操作系统)不能ssh连root登录,只能普通用户ssh登录再su切换root,
# id gandalf   无该用户信息,默认没有创建gandalf用户
# cnaInit      cna init 初始化的意思,cnaInit这里I是大写的i,
输入这个命令后默认创建gandalf用户,然后你给gandalf设置密码
# ssh gandalf@192.168.8.66
$ su – 切换到root用户
CNA01:~ # TMOUT=0  
正常情况是TMOUT=60,60秒超时,超时了会退出让重新登入,
TMOUT=0是timeout=0的缩写,永不超时(临时生效的,防止超时)

虚拟机模拟物理机部署VRM
物理机部署,性能好(VRM管理的CNA超过50台,建议使用物理机部署)
设置gandalf用户密码和web端用户密码

# vrmInit      vrm init 初始化的意思,vrmInit这里I是大写的i,
输入这个命令后默认创建gandalf用户,然后你给gandalf设置密码

选择模式1(common)后
这时候提示输入admin的password
未来登录VRM的web界面(ip加8443端口)的密码,账号 admin,密码就是这里设置的密码。


VRM对接CNA
资源池下面默认会有一个集群(clustermanagement),当然也可以存在多个集群,集群下面就是主机,主机下面就是虚拟机。
VRM物理部署之后,默认登录FusionCompute界面,是没有集群名称的,可以手工创建集群。
集群里面有很多高可用的配置,如创建一个集群aaa,在集群下面添加主机。
如果未来aaa集群里面的资源不够了,加cna主机进行扩容。

对接的时候注意:8.1.0版本及之前版本
这里只有一个ip地址,是没有让输入密码的。这里默认使用内置账号gandalf对接。

从8.1.1版本开始,添加主机显示了一个密码:这里的密码指的是root密码。

会添加失败的,因为cna是虚拟机模拟安装的。

VRM单节点扩展为主备架构



仲裁ip取不会变化的ip,一般是网关


虚拟机模拟虚拟化部署VRM
虚拟化部署(VRM管理的CNA小于50台,建议使用虚拟化部署)
VRM虚拟化部署,要先安装两台CNA(物理机部署),再使用华为部署工具部署VRM(VRM要主备部署,把两台VRM当做虚拟机部署在两台CNA中)。
CNA如果数量很少,可以用手工安装。如果50台,100台?需要通过PXE(dhcp)进行批量化安装。
将华为部署工具FusionCompute-LinuxInstaller-8.2.0-X86_64.zip上传到CNA01的gandalf用户家目录/home/GalaX8800/并在此目录解压安装 # cd /home/GalaX8800/

# unzip FusionCompute-LinuxInstaller-8.2.0-X86_64.zip
# cd /home/GalaX8800/FusionCompute-LinuxInstaller-8.2.0-X86_64/bin
# sh webInstaller.sh install  安装
# sh webInstaller.sh uninstall 卸载

华为部署工具安装在linux,win提供浏览器web访问这个安装工具就行。
重点: 华为部署工具,VRM,CNA版本必须一致,否则安装失败。

华为部署工具安装成功后会返回一个web界面网址,浏览器输入https://主机ip:8080打开部署工具web界面。
初始帐号信息:admin
初始密码:IaaS@PORTAL-CLOUD8!
第一次登录需要修改默认密码。
当前仅支持单用户登录。
安装VRM,不要勾选主机(CNA),只勾选VRM选项,因为CNA之前已经安装完毕。

在“VRM包上传”页面,上传VRM的安装包(zip文件),单击“开始上传”

六、物理服务器安装RAID1

安装CNA,装CNA最好做RAID1可容错,只需要两块硬盘组成RAID1
操作系统对数据读写性能要求不高,服务器出厂默认两块硬盘,两块硬盘做RAID1再装操作系统,所有数据是放后端存储的,数据通常不放在服务器本身。
出厂服务器默认没做RAID,怎么在服务器做RAID?然后把系统装在RAID上。
为什么要做RAID磁盘阵列,单盘性能不好,单盘没有容错性,根据不同商业目标既要保证性能又要能容错。两块硬盘,RAID0能提升性能但不容错,RAID1不保证性能但能容错。


留意重启过程中提示,按什么快捷键进入RAID配置界面。(装系统前要先做RAID)


硬盘插在RAID卡上的,按ctrl+r能进来RAID卡的BIOS界面(主板有主板的BIOS界面),进入RAID卡的BIOS界面是RAID卡提供的功能,有很多RAID卡不同的RAID卡按的快捷键不同,具体什么快捷键看启动时的提示,在主板上有个RAID卡,硬盘都是插在RAID卡上的,所有服务器的硬件都是支持热插拔的(带电操作)

一个RAID卡能创建多个不同RAID级别只要有硬盘够,但不是所有RAID卡支持所有RAID级别。

删除RAID1

快速格式化RAID1


3块硬盘的话,剩余一块硬盘可给RAID1加个热备盘,RAID1有个盘坏了正常情况是把坏的盘拿出来换个好的盘进去,即便这里有3块硬盘多了一块硬盘也不会自动顶上去的,但设置热备盘后就会兼顾RAID1,只要RAID1有个盘坏了就会自动顶上去。没有设置热备盘不会自动顶上去的,会读取卡槽位,把坏的盘拿出来,再在同一个卡槽位插一块硬盘上去,才会重新组建RAID1,热备盘是个千年备胎,RAID1有个盘坏了它就顶上去,但把坏的盘拔出来插上新的硬盘,热备盘再回去继续当热备盘。

RAID卡是否支持直通模式(看RAID卡有无JBOD选项,有的话说明支持直通模式)
直通模式,就是这个硬盘能直接被读取到,否则要经过RAID卡才能被读取的。
因为所有的硬盘都是插到RAID卡上的,OS读到的是虚拟磁盘,如果RAID卡支持直通模式,则OS可以直接读到裸硬盘,如果不支持,则必须创建RAID,这样磁盘才可以被OS读取到。
RAID卡不支持直通模式,第三块如果一定要被读到,则必须给这一块盘创建RAID0(单盘创建RAID0就变成虚拟磁盘了,才可以被OS读取到)单盘创建RAID0从性能上讲没有意义。
RAID卡开启直通模式,上层操作系统可以直接读到该硬盘。RAID卡不支持直通模式,需要每块硬盘创建RAID0,操作系统只能识别虚拟磁盘,不能直接读硬盘。

七、物理服务器安装CNA

注意:管理口安装系统,第一次选择光驱启动,让光驱加载iso镜像,安装完系统后面启动选择本地硬盘启动。
安装RAID1后重启再安装CNA操作系统,重启快捷键按“Ctrl+Alt+Delete”键
通过BMC远程管理口登录,把iso放在光驱里,让光驱加载iso,相当于在服务器插入一张光盘。




选择iso之后,点击“连接”,待出现 断开,弹出 的时候,就证明光盘映像文件被加载了。

重启服务器,服务器启动的时候,会有些慢,因为启动要检测很多东西。等待出现安装界面。


规划IP时最好提前ping一下自己规划的ip地址,这个ip地址如果你能ping通,就不要使用了,找一个同网段ping不通的ip地址。


按空格键选择确认,选择第四个带VLAN的(这里vlan 是22)





为什么要设置Grubpassword
就是进入启动引导程序菜单选择需要输入密码,为了防止他人通过GRUB修改root密码,类似windows系统进入BIOS如果设置了密码需要输入密码才能进入设置pe启动修改你的administrator账号密码一样

linux引导程序叫GRUB2
如何破解grub密码,# vim /etc/grub2.cfg 把root密码这三行注释掉,后面重启时按e输入rd.break破解密码时就不会让你输入grub密码进行校验。

安装完CNA后可从本地磁盘启动

登录进来后输入# hostconfig可修改网络信息,使用root用户登录,执行 cnaInit 初始化,设置甘道夫密码。

ssh远程不能改网络信息,只能远程管理口连接BMC控制台改网络信息。

八、部署VRM

  1. 如果物理部署,则跟安装CNA步骤类似
  2. 如果虚拟化部署,则需要使用华为部署工具
    远程传输文件 win向linux传输华为部署工具,FusionCompute-LinuxInstaller-8.2.0-X86_64.zip
    文件要上传到gandalf用户家目录/home/GalaX8800/并在此目录解压安装 # cd /home/GalaX8800/
# unzip FusionCompute-LinuxInstaller-8.2.0-X86_64.zip
# cd /home/GalaX8800/FusionCompute-LinuxInstaller-8.2.0-X86_64/bin
# sh webInstaller.sh install  安装
# sh webInstaller.sh uninstall 卸载
为了防止连接会话超时,# TMOUT=0

重点: 华为部署工具,VRM,CNA版本必须一致,否则安装失败。

安装成功后会返回一个web界面网址,浏览器输入https://主机ip:8080打开华为部署工具web界面。
初始帐号信息:admin
初始密码:IaaS@PORTAL-CLOUD8!
第一次登录需要修改默认密码。
当前仅支持单用户登录。

安装VRM,这里主机指CNA,CNA手工配置完了,这里就不勾选了。

在“VRM包上传”页面,上传VRM的安装包(zip文件),单击“开始上传”


VIP: Virtual IP,虚拟IP也叫浮动IP




GRUB : Linux引导程序,给VRM的Linux机器设置root密码 gandalf密码 GRUB密码

指定VRM安装在哪台CNA中,这里的主机指CNA。主机01指的是现在华为部署工具运行的CNA01上所以不需要gandalf密码,CNA02是ssh远程过去的需要gandalf密码。
VRM主备部署: 两台CNA主机时间误差不得超过5分钟,否则会报错。
建议VRM部署在CNA的本地硬盘(VRM不会迁移),虚拟机一般不安装在本地磁盘而是安装在共享磁盘,其他业务虚拟机比如windows2016, CentOS建议部署在共享存储中,方便未来迁移。


格式化可以是RAID1之外的硬盘(前提是RAID卡可以识别到的硬盘),这里格式化的是RAID1安装完系统后剩余空间。



最后通过浮动ip加8443端口进行登录FusionCompute
一旦设置浮动ip,主备ip就不对外暴露,只能通过浮动ip登入FusionCompute

九、 运营FusionCompute

1.加载商用版License(FusionCompute要付费的)

2.配置时间
VRM主备部署: 两台CNA主机时间误差不得超过5分钟,否则会报错。

# date  查看CNA当前系统时间   # date --help |more 求帮助
# date -s “2023-07-02 15:00:00” 修改时间
# hwclock -w  将修改的时间写入硬件中永久生效,不执行这条命令重启后刚设置的时间会失效

在环境中配置NTP服务器

3. 什么是集群
如果使用华为部署工具安装VRM,系统会自动创建一个管理集群ManagementCluster,并且将CNA加入到该集群中。


由两台或者两台以上的主机,为了一个共同的商业目标,根据商业目标不同,集群分为以下三类
(1) HA 高可用集群

(2) 负载均衡集群 LBC Load Balance Cluster

(3)HPC 高性能集群
所有的机器一起计算,能提高算力。
4. 在FusionCompute中安装虚拟机,创建第一台windows虚拟机。






(1)硬盘和网卡选择virtIO类型(待会装WIN到一半会提示找不到硬盘,原因是没有virtIO类型的驱动) linux默认自带virtIO驱动,硬件都要装驱动,装完后网卡也缺少virtIO驱动。
磁盘和网卡设置virtIO类型,装virtIO驱动就是标记机器是虚拟机,通过虚拟交换机交换数据,虚拟交换机在内存中很快的,装virtIO驱动是提高性能的。如果不设置这个驱动,系统不认为它是虚拟机,以为它是物理机,所有数据流按物理机流量来走。




(2)安装tools(linux和win装完后要安装tools)tools是虚拟机的驱动程序,装完WIN没有网卡驱动是因为没有安装tools,很多高级特性依赖tools。装完tools(tools自带网卡驱动)后就有网卡驱动能配置以太网了。
装WIN过程中没识别到硬盘,系统盘都驱动不了,用了虚拟软驱解决的(vhd驱动放在软驱里),为什么不把网卡驱动放虚拟软驱里?虚拟软驱才1.44MB怎么可能放那么多驱动呢,先把系统装好后面再装其它驱动更方便。


安装并启动Tools后,用户无需做任何操作,Tools即可提供以下功能:
为虚拟机提供高性能的磁盘I/O和网络I/O功能;为虚拟机提供虚拟硬件监控功能;获取虚拟机指定网卡IP信息;获取虚拟机内部各CPU利用率、内存利用率;获取虚拟机内各个磁盘/分区的空间使用信息;为虚拟机提供高级功能:在线调整虚拟机的CPU规格,创建虚拟机快照,(Intel)虚拟机蓝屏检测,虚拟机与主机时钟同步;虚拟机网卡的高级功能,如QoS(服务质量控制,做流量管控);自动升级虚拟机的驱动程序,如Tools驱动。
5.在Linux系统中安装tools



为什么装完linux有网卡呢,因为linux默认自带virtIO驱动,但没有自带安装tools


在虚拟机上挂载tools,进入Linux操作系统,挂载/dev/sr0

# mount  /dev/cdrom  /media  
/dev/cdrom是/dev/sr0的软链接,如果没有自动挂载光驱到挂载点 就手工挂载光驱/dev/cdrom到/media 
# mkdir /data
# cd /media  进入光驱挂载点里面有vmtools压缩包,光驱挂载点是只读的不能在光驱中直接解压
# tar -jxvf vmtools-3.0.0.019.tar.bz2 -C /data  解压到/data目录
# cd /data/vmtools
# sh install 执行脚本
# reboot  重启生效

virsh是EulerOS欧拉系统才有的命令
# virsh list --all  查看所有虚拟机运行情况
# virsh start vm1 开启某台虚拟机
# lsmod |grep kvm 显示已载入系统的模块


注意解压过程看报错提示说没有bzip2,原因是最小化安装的CentOS没有安装解压缩软件包( gzip、bzip2 、xz)

十、计算虚拟化

FusionCompute 华为企业级虚拟化是基于开源KVM做二次开发,KVM是基于CPU的硬件辅助虚拟化,它需要CPU虚拟化特性的支持。
创建集群,先创建集群再往集群里添加主机,按照集群的设置来管理主机。多个集群是独立的,不会彼此帮助的。为什么创建多个集群,为了隔离业务,一个集群就是一个故障域,一个集群故障了也不会影响另一个集群。


虚拟机NUMA结构自动调整和主机内存复用不能同时开启,开启NUMA会提升虚拟机性能,开启主机内存复用会影响虚拟机性能。

主机内存复用:所有虚拟机分配的内存会超出宿主机内存,能提高虚拟机开机密度(开多台虚拟机)
宿主机内存200G,将来在这上面开启的虚拟机加起来的内存可超过宿主机内存200G,默认内存复用率150%,宿主机内存200G虚拟机加起来内存可用300G。
缺点: 影响性能,默认关闭以提高虚拟机的性能。
虚拟机启动策略:
负载均衡:系统自动根据使用CPU和内存各50%的加权值计算,选择占用率最小的主机。当发放虚拟机选择集群的时候,集群策略为负载均衡,那么vrm会计算整个集群的cna负载,挑选一个负载较轻的cna进行发放,保证整个集群相对均衡。
自动分配:虚拟机启动时,在集群中满足资源条件的节点中随机进行节点的选择。当发放虚拟机选择集群的时候,集群策略为自动分配,其实就是轮询。

1、内存气泡:系统主动回收虚拟机暂时不用的物理内存,分配给需要复用内存的虚拟机。内存的回收和分配均为系统动态执行,虚拟机上的应用无感知。
2、内存交换:将外部存储虚拟成内存给虚拟机使用,将虚拟机上暂时不用的数据存放到外部存储上。系统需要使用这些数据时,再与预留在内存上的数据进行交换。
3、内存共享:多台虚拟机共享数据内容相同的内存页。

NUMA(Non Uniform Memory Access)非一致性内存访问,把CPU、内存来分区管理,开启NUMA会提升虚拟机性能的
虚拟机NUMA结构自动调整:开启意味着虚拟机在运行时给这个虚拟机分了4个cpu8g内存,尽可能在一个Node里面分配,而尽量不用跨Node去分配,这样cpu跟内存间访问速度是最快的。
虚拟cpu(vCPU)计算方法:

vCPU数量和物理CPU的对应关系:vcpus=cpu个数*每个cpu多少核数*线程数(一般是两个处理线程)
以RH服务器使用2.6 GHz主频CPU为例,单台服务器有2个物理CPU,每颗CPU有8核,
又因为超线程技术可以提供每个物理内核两个处理线程,因此每颗CPU有16线程,
总vCPU数量为2*8*2=32个vCPU。总资源为32*2.6 GHz=83.2 GHz。


主机故障处理策略:HA虚拟机 。虚拟机故障处理策略:重启虚拟机
HA不是一个特定的技术,而是一种架构,High Availability 高可用(主备、集群)
一旦cna故障了,运行在其上面的虚拟机会自动ha到集群的其它cna上,ha会短暂停业务。
HA虚拟机不是热迁移虚拟机,HA虚拟机的时候,上层业务是要中断;热迁移的时候,上层业务是不中断的。


虚拟机热迁移:迁移过程不会关机。支持在不影响用户使用或中断服务的情况下在服务器之间实时迁移虚拟机,虚拟机热迁移是DRS动态资源调度和DPM分布式电源管理技术的基础。
DRS:动态资源调度 (Dynamic Resource Scheduler),采用智能负载均衡调度算法,通过周期性检查同一集群资源内各个主机的负载情况,在不同的主机间迁移虚拟机,从而实现同一集群内不同主机间的负载均衡,并最大程度降低系统的功耗。
系统轻载时,将迁移部分虚拟机,并将其集中在部分物理主机,随即将空闲主机下电。
系统重载时,将启动部分物理主机,并将虚拟机均衡分布在各主机中,以保证资源的供应和用户的体验。
通过计划任务,可根据系统运行的情况,分时段采取不同的资源调度策略,以满足不同场景的用户需求。


DPM:动态电源管理 (Dynamic Power Management),添加CNA主机时,需要添加BMC信息(服务器远程管理口),才能实现该功能。电源管理自动化功能会周期性地检查集群中服务器的资源使用情况,如果集群中资源利用率不足,则会将多余的主机下电节能,下电前会将虚拟机迁移至其他主机;如果集群资源过度利用,则会将离线的主机上电,以增加集群资源,减轻主机的负荷。

10台CNA,100个VMS(VMS虚拟机),9:00-18:00 业务繁忙,22:00-8:00 空闲
VRM检测到整个集群资源利用率低于20%,则触发DPM动态电源管理,关闭一部分CNA主机,但是所有的业务不能中止,在关闭CNA之前,将待关闭CNA主机上的虚拟机迁移到其他CNA中。
保守:能不关机尽量不关机
激进:能不开机尽量不开机,只要5台机器扛得住就不开6台
通过远程管理口的ipmi标准协议,下发一个开机指令就行,就把集群的第6台机器打开。

IMC,不兼容迁移集群(Incompatible Migration Cluster),为了实现不同型号版本cpu之间,可以进行虚拟机的迁移。

设定规则组可以控制虚拟机与主机之间的位置关系,以满足不同应用场景的需求。

1.聚集虚拟机: 选中的虚拟机必须在同一台CNA主机上运行。web+tomcat 前端+中间件,数据交互特别频繁,建议放置同一台主机上,通过OVS虚拟交换机在内存中交换数据,性能好。
2. 互斥虚拟机: 选中的虚拟机不能在同一台CNA主机上运行。主备部署的两台虚拟机。
3. 虚拟机到主机:指定一部分虚拟机只能运行在特定的几台CNA主机上,有些应用特别消耗CPU资源,有些应用特别消耗内存资源,指定消耗内存资源的虚拟机,运行在几台内存资源充足的CNA主机上。

模板,未来可以通过这个模板创建/发放很多的虚拟机。
安装一台windows,之后可以有3种方式生成模板。
转为模板:虚拟机必须在关机状态下,才能转为模板。原虚拟机就不存在了。
导出为模板:原虚拟机存在,仅仅是导出来一份文件。未来可以将模板拿到其他平台进行导入。
克隆为模板:虚拟机必须在关机状态下,才能克隆为模板。原虚拟机也在,之后在虚拟机模板下面多了一个模板。
剔除个性化信息,Windows依靠windows自身的sysprep这个工具。像操作系统网卡信息、systemid信息等,默认是没有被剔除掉的(个性化信息没有删除)。有些应用软件它是依靠系统id来识别操作系统的,比如搭建一个集群,就会把所有的机器节点识别为1台,就会出现一些应用上的问题。



安全组

删除
普通删除:通过破坏磁盘文件系统对磁盘空间进行删除,删除速度快,但存在通过残余信息恢复数据的可能,安全性差。
安全删除:通过覆盖性查写对磁盘空间进行删除,避免数据被恢复,安全性高,但删除速度较慢,且删除时会占用系统资源。

本文标签: 华为企业级HCIAFusionCompute