腾讯TCS230部署记录
好方
好方
发布于 2023-06-05 / 77 阅读 / 0 评论 / 0 点赞

腾讯TCS230部署记录

说明

本文中出现的各种物料(规划工具,配置包,组件包等)均需要从腾讯认证的相关对接人获取

腾讯的产品,极为垃圾,部署过程中可能需要各种黑盒操作,本文的部署环境是centos 7.9,其他环境可能无法部署成功,本人曾试过,一模一样的操作在tlinux上部署,无法成功——但腾讯的人说可以部署成功

规划

角色

cpu

mem

硬盘

数量

master

16

32

系统盘:100G,数据盘:500*3

3

node

16

32

系统盘:100G,数据盘:500*2

3

  1. 采用后缀015的规划工具

    master上的磁盘要求必须为裸盘,这是安装csp的前提

    规划部署中的az和region必须是同一个

    内存填写,使用free -mg查看Mem行中total的数值,如图

    部署tcs至少需要6个vip,少于4个会有问题,vip可以给多,但不可以少

    lb为vrrp模式

    主域名为极光客制化信息中的域名,如图

    pod cidr和svc cidr与主机不冲突即可

    ntp最好配置

    dns一定要配置,后续下载组件包,会从公网下载各种资源包,否则会出现解析不了域名的情况

    物料地址一定不能该,必须为/data1/tcs.tar.gz

    HDD普通盘路径需要注意,此处为csp裸盘的路径,与第一页的路径规划中的一致

  2. 上传资源包

    格式化部署机器中的硬盘sdc,并挂载为/data1,部署机器一般是master中的第1个

    disk=/dev/sdc
    mkfs.xfs -n ftype=1 $disk -f
    mkdir -p /data1
    echo "`blkid | grep $disk | awk '{print $2}'` /data1 xfs defaults,noatime,nodiratime,prjquota 0 2" >> /etc/fstab 
    cat /etc/fstab 
    systemctl daemon-reload
    mount -a
    lsblk

    将下载好的资源包放在/data1/tcs.tar.gz中,必须为这个位置,即规划中的位置

  3. 上传刚才规划后生成的配置包

    将生成的conf.zip上传到/root/下,并解压到/root/tcs/目录下

    unzip -o -d /root/tcs/ conf-tcs-20230404.zip
  4. 所有机器统一配置

    使用ansible统一修改所有机器,保证配置一致

    yum install ansible -y

    ansible的配置举例如下

    
    [root@localhost lwl]# cat host.ini 
    [presetup]
    192.168.161.20 ansible_ssh_user='root' ansible_ssh_pass='Admin12345...' ansible_ssh_port=22
    192.168.161.21 ansible_ssh_user='root' ansible_ssh_pass='Admin12345...' ansible_ssh_port=22

    统一yum源

    sed -e 's|^mirrorlist=|#mirrorlist=|g' \
         -e 's|^#baseurl=http://mirror.centos.org/centos|baseurl=https://mirrors.tuna.tsinghua.edu.cn/centos|g' \
         -i.bak \
         /etc/yum.repos.d/CentOS-*.repo
    sed -e 's!^metalink=!#metalink=!g' \
        -e 's!^#baseurl=!baseurl=!g' \
        -e 's!http://download\.fedoraproject\.org/pub/epel!https://mirrors.tuna.tsinghua.edu.cn/epel!g' \
        -e 's!http://download\.example/pub/epel!https://mirrors.tuna.tsinghua.edu.cn/epel!g' \
        -i /etc/yum.repos.d/epel*.repo

    统一密码

    echo Admin12345... | passwd root --stdin

    安装工具

    yum makecache fast && yum install -y jq mariadb redis ntpdate ansible

部署

  1. 部署

    bash /root/tcs/deploy.sh 
  2. 部署成功如图

    将部署后输出的host写入本地host文件

    界面验证,

    登录http://o.auto-deploy.tcs230-x86.fsphere.cn/

    默认账号密码如下:

    tceadmin/aaaaaaaa1!

    注意集群基础信息中,此时没有hotfix字样,说明没有还没有打补丁

打补丁

  1. 上传修复包

    将修复包放到/data/tce_dc/software/目录下,解压

    在sortware目录中执行

    kaleido_refresh index

    进入解压后的TCS2.3.0.289目录中执行

    ./bugfix

    等待修复,大概20分钟,出现如下exit status 1

    再次执行

    kaleido upgrade upgrade,出现如下

    重新登录页面查看集群基础信息,发现有hotfix字段,说明补丁成功,如下


评论