客户把游戏系统迁移AWS基于如下:
1、友商云最近出现多次宕机异常影响到业务,希望能提供更高稳定性的云服务
2、客户原云平台使用了大量的自建服务,比如MySQL数据库、redis缓存数据库,运维团队需 要付出大量的精力维持底层安全和版本。
1、设计评审:在迁移之前需要对整体设计进行评审,包含AWS 架构师和客户工程师,需要满足高可用性,可 扩展性和安全性等要求。
2、停机时间要求:迁移停机不能超过2个小时。
3、可用性和稳定:服务采用MAZ部署,切换时间小于10分钟。

1、业务核心主要使用的资源有:AWS EC2、Amazon Aurora for MySQL、Amazon ElastiCache、Elastic Load Balancer (ELB)、Amazon CloudFront、Amazon S3、Amazon Route 53等。
2、在业务架构上采用了多可用区 (AZ) 部署,以确保高可用性,并结合 ELB 将流量分发到位于不同可用区的服务器上。
3、利用 Amazon CloudFront 实现内容分发网络 (CDN),以确保用户可以就近接入,降低网络时延,提供更好的用户体验。
4、结合自动伸缩功能 (autoscaling),在高峰负载期间动态调整资源规模,既保证高性能,又降低成本。
5、为了提升数据库性能和稳定性,并降低运维投入,本次迁移将原先的自建 MySQL 数据库迁移到 Amazon RDS for MySQL。
6、为了更好地降低运维投入,本次迁移还将原先的自建 Redis 迁移到 Amazon ElastiCache for Redis。

1、业务核心主要使用的资源有:AWS EC2、Amazon Aurora for MySQL、Amazon ElastiCache、Elastic Load Balancer (ELB)、Amazon CloudFront、Amazon S3、 Amazon Route 53等。
2、在业务架构上采用了多可用区 (AZ) 部署,以确保高可用性,并结合 ELB 将流量分发到位于 不同可用区的服务器上。
3、利用 Amazon CloudFront 实现内容分发网络 (CDN),以确保用户可以就近接入,降低网络 时延,提供更好的用户体验。
4、结合自动伸缩功能 (autoscaling),在高峰负载期间动态调整资源规模,既保证高性能,又 降低成本。
5、为了提升数据库性能和稳定性,并降低运维投入,本次迁移将原先的自建 MySQL 数据库迁 移到 Amazon RDS for MySQL。
6、为了更好地降低运维投入,本次迁移还将原先的自建 Redis 迁移到 Amazon ElastiCache for Redis。
迁移过程中的关键问题:
(1)由于服务器迁移,用户在使用过程中会断开连接,请尽量缩短断开连接的时间,确保用户的稳定使用。
(2)分项目进行迁移。迁移过程中完成数据传输后,需要对数据进行校验,如果数据丢失,需要判断是否需要回退。
项目成功的标志:
(1)用户可以流畅使用游戏平台、游戏APP。
(2)用户数据没有丢失。
(3)宕机时间控制在 1 小时以内。
(4)服务器在负载均衡器后端稳定处理请求。


客户最重要的核心交易系统基于K8s 来构建,数据分析系统使用GreenPlum,迁移过程中需要 跟AWS 进行适配,客户要求迁移前能完成所有的架构适配工作并迁移过程没有数据丢 失:
1.使用Aurora PostgreSQL同步并替代GreenPlum,减少线上运维的难度
2.使用EKS 替代GKE,减少容器架构的变动
项目成功的标志:
1.在迁移之前需要对整体设计进行评审,包含AWS 架构师和客户工程师,需要满足高可用性,可 扩展性和安全性等要求
迁移停机不能超过4个小时。
2.宕机时间控制在 1 小时以内。
其他要求:
No. | Descriptions | Measurements |
1. | 数据库正常迁移,数据完整性通过验证 | 通过测试 |
2. | EKS集群弹性扩展完成时间≤ 10 min | 通过测试 |
3. | DMS可以实时同步到核心Aurora Postgre SQL数据库 | 通过测试 |
该架构设计综合考虑了运营、安全、高可用、性能、成本和可持续性等因素,通过合理利用AWS 服务和最佳实践,为客户提供了一个安全、可靠、灵活和经济的云上业务平台。
1. 采用AWS Landing Zone解决方案,通过合理的网络层级划分和安全组策略,实现内外网隔离, 确保内部业务数据和模型训练环境的安全性。
2. 利用多可用区部署资源,提高业务可用性和容错能力,降低单点故障风险。
3. 使用AWS Identity and Access Management (IAM)、AWS CloudTrail等服务,加强对账 号、资源和操作的管理和审计,提高安全性。
4. 配置AWS CloudWatch监控和告警,全面监控EC2实例、数据库、Kubernetes集群等核心资 源的运行状态和性能指标,并根据需求集成企业微信或飞书等通知渠道。
5.部署Amazon Elastic Kubernetes Service (EKS)集群作为核心业务平台,采用多可用区部署 Worker节点,确保高可用性。
6.使用Karpenter作为Kubernetes自动扩缩容工具,根据业务需求快速灵活地调整计算资源。
7.在EKS集群内部署Jasmine Mint核心业务应用,使用AWS Application Load Balancer (ALB) Ingress Controller暴露服务。
8.初始部署16台EC2实例作为Worker节点,配置50GB gp3存储卷,后续可根据需求扩展节点数 量和存储。考虑使用Amazon Elastic File System (EFS)集中存储脚本和日志。
9.将Worker节点部署在私有子网,禁止公网访问,仅允许来自EKS控制平面和ELB的入站流量,提 高安全性。
客户最重要的核心交易系统基于K8s 来构建,数据分析系统使用GreenPlum,迁移过程中需要 跟AWS 进行适配,客户要求迁移前能完成所有的架构适配工作并迁移过程没有数据丢 失:
1.使用AWS的托管服务为主,减少线上运维的负担
2. 客户希望系统上线后能稳定运行,实现高可用,自动弹性扩展和高安全性。
项目成功标准
1. 压力测试需要能承担1W 人同时在线
2. 系统顺利上线并运行没有报错
3. 上线后针对AWS平台进行成本优化
项目不包含内容
如下工作不包含在我方职责范围之内:
- 修改系统代码,测试各系统功能
- 实现业务逻辑,业务功能的调整
1. 架构图

2. 架构说明
在架构设计过程中遵循良好架构原则:
序号 | 交付内容 | 所属项目阶段 |
1. | 工作范围说明书SOW | 计划和设计 |
2. | 项目进度计划(WBS) | 规划和设计 |
3. | POC测试报告 | 规划和设计 |
4. | 部署设计方案 | 计划和设计 |
5. | 实施部署文档 | 实施部署 |
6. | 系统测试报告 | 迁移执行 |
7. | 上线计划 | 交付阶段 |