(1) 明确流量峰值、并发数、带宽和地域(新加坡/亚太)。(2) 确定预算(月付/年付),优先选择VPS或轻量云服务器以节省成本;预算有限时优先1-2台VPS+云防护。(3) 列出应用组件(Web、DB、缓存、对象存储)并估算资源,产出采购清单与SLA目标(RTO/RPO)。
(1) 推荐候选:DigitalOcean/Hetzner/Vultr/阿里云新加坡区/AWS(廉价实例)。比较点:带宽上行、是否含DDoS基础防护、价格、数据中心位置。(2) 若预算极紧,选VPS+Cloudflare免费/付费;若需更强高防,优先选含“高防IP”或“云端清洗”服务的供应商。
(1) 注册并实名认证;(2) 在控制台选择新加坡机房,选择Ubuntu 22.04或CentOS 7/8镜像;(3) 选择CPU/RAM/带宽,建议Web层2vCPU+4GB起,DB独立或托管;(4) 选附加IP(弹性IP/浮动IP)便于切换;(5) 下单并记录控制台返回的IP/密码或SSH key。
(1) 登录:ssh root@IP;(2) 建立普通用户并授权sudo:adduser deploy && usermod -aG sudo deploy;(3) 配置SSH key并禁用密码登录:编辑 /etc/ssh/sshd_config,设置 PermitRootLogin no、PasswordAuthentication no、Port 2222;systemctl restart sshd;(4) 安装fail2ban:apt install fail2ban;启用基本规则。
(1) 使用ufw:ufw default deny incoming; ufw allow 2222/tcp; ufw allow 80,443/tcp; ufw enable。(2) 若用iptables,示例:iptables -A INPUT -p tcp --dport 2222 -m conntrack --ctstate NEW -j ACCEPT;保存规则:apt install iptables-persistent。
(1) 安装Nginx:apt install nginx;(2) 配置server块反向代理到后端应用;(3) 安装Certbot并申请证书:apt install certbot python3-certbot-nginx;certbot --nginx -d example.com;(4) 设置自动续期:systemctl enable certbot.timer。
(1) 若预算允许两台实例做主/备,使用Keepalived做VIP漂移,示例配置 /etc/keepalived/keepalived.conf,设置VRRP优先级与脚本检测服务健康;(2) 对外用轻量级负载均衡(HAProxy)分发至后端;(3) 若使用云厂商提供的负载均衡器,可降低运维复杂度。
(1) 对MySQL:配置主从复制或组复制;使用mysqldump定时备份到对象存储(rsync或rclone同步到S3兼容存储)。(2) 制定备份频率:逻辑备份每日,二进制日志(binlog)持续备份;(3) 编写恢复演练脚本并周期性验证。
(1) 第一层:启用供应商基础高防或购买高防IP;(2) 第二层:使用Cloudflare或其他CDN做流量清洗与WAF,DNS指向Cloudflare,由其转发到真实IP(注意只在高度信任的场景暴露真实IP);(3) 配置速率限制、WAF规则、黑/白名单;(4) 与供应商确认流量清洗阈值与应急联系方式。
(1) 部署Prometheus+node_exporter或Zabbix监控CPU/内存/流量/磁盘;(2) 配置基线阈值与告警(邮件/Slack/短信);(3) 使用Ansible编写可重复的安装脚本(playbook)实现一键扩容与配置,一旦检测异常可通过脚本快速替换实例。
(1) 定期更新系统:apt update && apt upgrade -y;(2) 最小化暴露端口、关闭不必要服务;(3) 部署WAF、开启HTTP安全头、定期漏洞扫描(如OpenVAS或商业扫描);(4) 保存审计日志并使用Logrotate与远端集中日志服务。
(1) 使用按需+预付混合策略,低峰关闭非必要实例;(2) 利用云厂商快照代替长期手工备份以节省时间;(3) 定期进行故障演练(切换VIP、恢复DB、流量切换到备用机房)并记录RTO/RPO是否满足目标。
问:预算有限,如何兼顾高防与成本? 答:优先购买具备基础DDoS清洗的VPS并配合Cloudflare免费/付费线路;把业务拆为静态资源走CDN、动态接口走小容量后端;对流量大且暴露风险的接口使用WAF与速率限制,必要时按需启用供应商的高防IP。
问:若遭遇大流量攻击,第一时间做什么? 答:立即启动流量清洗(切换到Cloudflare“放置在代理”模式或启用供应商清洗),将IP切换到高防IP或替换为新的弹性IP,开启速率限制并临时屏蔽异常源;同时通知供应商并启动流量/访问日志保存用于溯源。
问:给出几条可复制的运维命令示例。 答:常用命令示例:apt update && apt upgrade -y;ufw allow 80,443,2222/tcp && ufw enable;systemctl enable --now fail2ban;rsync -avz /var/www/ backup@backupserver:/backup/;Ansible启动:ansible-playbook -i hosts site.yml。将这些脚本加入CI或cron以实现自动化与快速扩容。