欢迎来到阿里云 DAS (Database Autonomy Service,数据库自治服务) 的世界!
对于新手来说,DAS 就像给你的数据库请了一位 24 小时在线的“AI DBA 专家”。它不仅能帮你监控数据库健康,还能自动发现慢 SQL、推荐索引,甚至在危险时自动限流保护数据库。
以下是为你准备的 新手快速入门指南,只需 4 步,即可让 DAS 为你的数据库保驾护航。
🚀 第一步:确认环境与接入 (5 分钟)
DAS 支持多种数据库(RDS MySQL/PostgreSQL, PolarDB, ECS 自建库等)。
场景 A:你使用的是阿里云 RDS 或 PolarDB (最简单)
状态:通常 自动接入。
操作:
登录 阿里云 DAS 控制台。
在左侧点击 “实例监控”。
你应该能直接看到你的 RDS/PolarDB 实例列表。
注意:如果是新买的实例,可能需要等待 5-10 分钟数据同步。如果没看到,点击页面上的 “接入实例” 按钮手动添加。
场景 B:你使用的是 ECS 自建数据库 (需手动配置)
状态:需要手动授权和安装插件。
操作:
提示:账号需要有
PROCESS,SHOW VIEW等监控权限(建议新建一个专供 DAS 使用的账号)。在 DAS 控制台点击 “接入实例” -> 选择 “ECS 自建数据库”。
填写信息:输入 ECS 的内网 IP、端口、数据库账号密码。
网络打通:确保 ECS 的安全组放行了 DAS 的访问(通常向导会提示你添加白名单)。
安装插件:根据向导,在 ECS 终端运行一行命令安装
das-agent,用于采集深层指标。
📊 第二步:看懂“全局概览” (核心仪表盘)
接入成功后,点击任意实例进入详情页。新手只需关注这三个核心区域:
健康得分 (Health Score):
位于页面顶部。满分 100 分。
< 60 分:数据库有严重风险(如 CPU 爆满、磁盘已满、主从延迟),立即处理!
80-90 分:有一些小问题(如少量慢 SQL),可以优化。
100 分:非常健康,继续保持。
核心负载趋势图:
查看 CPU 使用率、IOPS、连接数 曲线。
技巧:如果看到 CPU 突然飙升到 100%,把鼠标悬停在峰值点上,DAS 通常会直接告诉你“是由哪条 SQL 引起的”。
异常检测与诊断 (最强大的功能):
找到 “异常检测” 或 “智能诊断” 标签页。
这里列出了 DAS 自动发现的问题,例如:“检测到慢 SQL 导致 CPU 升高”、“存在死锁风险”。
新手福利:点击每一条异常,DAS 会给出 根因分析 和 优化建议(甚至直接给出优化后的 SQL 语句)。
🛠️ 第三步:体验三大“杀手锏”功能
作为新手,先掌握这三个最实用、风险最低的功能:
1. 慢 SQL 分析与优化 (必用 ⭐⭐⭐⭐⭐)
入口:左侧菜单 -> “慢 SQL”。
作用:找出拖慢数据库的罪魁祸首。
操作:
查看“执行耗时最长”或“扫描行数最多”的 SQL。
点击 SQL 旁边的 “优化建议”。
DAS 会告诉你:“建议在字段
user_id上添加索引”,并给出ALTER TABLE ...语句。复制语句,在你的数据库客户端执行即可。
2. 空间分析 (防止磁盘爆满 ⭐⭐⭐⭐)
入口:左侧菜单 -> “空间分析”。
作用:预测磁盘何时写满,找出占用空间最大的表。
操作:
查看“空间增长趋势”。
如果发现某张表(如
logs表)增长异常快,DAS 会建议清理或归档。设置 “空间预警”,当磁盘使用率超过 80% 时发短信通知你。
3. 会话管理与自动限流 (救急用 ⭐⭐⭐)
入口:左侧菜单 -> “会话管理”。
作用:当数据库卡死时,一键杀掉故障会话。
进阶:开启 “自动限流” 功能。
当检测到某个烂 SQL 把 CPU 跑满时,DAS 会自动拦截该 SQL 的执行,保护数据库不宕机。
新手提示:首次开启建议选“观察模式”或“人工确认”,熟悉后再开“自动执行”。
⚙️ 第四步:设置报警规则 (睡个安稳觉)
不要等到数据库挂了才知道。
进入 “告警中心” 或 “阈值报警”。
创建规则:
指标:CPU 使用率。
条件:平均值 > 80% 持续 5 分钟。
通知方式:短信、邮件、钉钉群机器人。
保存。现在,一旦数据库压力大,你的手机会立刻收到通知。
💡 新手避坑指南 & 最佳实践
不要盲目执行自动优化:
虽然 DAS 的建议很准,但在生产环境执行
CREATE INDEX或ALTER TABLE前,务必在测试环境验证,或在业务低峰期操作。大表加锁可能会短暂影响业务。关注“一键诊断”报告:
每周点击一次 “生成诊断报告”。DAS 会生成一份 PDF,总结过去一周的健康状况和优化点,非常适合发给老板或团队看。
免费版 vs 专业版:
基础监控和慢 SQL 分析通常是免费的。
自动限流、自动索引创建、AI 深度诊断 可能需要开通 DAS 专业版 (按量付费或包年)。新手可以先用免费功能,遇到瓶颈再考虑升级。
自建库的 Agent 维护:
如果是 ECS 自建库,记得定期检查
das-agent进程是否存活,否则监控数据会中断。
🎓 学习路径推荐
第 1 天:接入实例,看懂健康得分,设置 CPU 报警。
第 3 天:查看“慢 SQL”列表,尝试优化 1-2 条最简单的 SQL。
第 7 天:阅读生成的“周诊断报告”,了解数据库的整体趋势。
第 1 个月:研究“自动限流”和“空间自动扩容”功能,实现初步的无人值守运维。
现在,打开 DAS 控制台,看看你的数据库健康得分是多少吧!如果有红色警告,那就从解决第一个“慢 SQL”开始你的 DBA 进阶之路。