阿里云数据库自治服务(DAS, Database Autonomy Service)是一款基于机器学习和专家经验,实现数据库自感知、自修复、自优化、自运维、自安全的云服务。
对于大多数用户,基础功能(通常对应 DAS 经济版或免费部分) 已经能够满足日常的性能监控、异常诊断和基础优化需求。以下是使用 DAS 基础功能的完整指南:
第一步:接入数据库实例
在使用任何功能前,必须先将您的数据库实例接入 DAS 控制台。
登录控制台:
访问 阿里云 DAS 控制台。
接入实例:
在左侧导航栏选择 “实例监控” 或点击首页的 “接入数据库实例”。
阿里云 RDS/PolarDB 实例:系统通常会自动发现同账号下的实例,您只需勾选目标实例并点击 “接入” 即可。
自建数据库(ECS 或本地):需要安装 DAS Agent 或通过数据库账号密码直接连接(需开放白名单)。选择“其他来源实例”,按照向导输入 IP、端口、账号密码进行接入。
确认状态:
接入成功后,实例列表中的状态应显示为 “连接正常”。
第二步:核心基础功能使用指南
接入后,您可以点击实例 ID 进入详情页,使用以下核心基础功能:
1. 实时性能监控与拓扑图 (自感知)
这是最基础的看板,用于实时查看数据库健康度。
入口:实例详情页 -> “性能趋势” 或 “实时监控”。
功能:
关键指标:查看 CPU 使用率、IOPS、连接数、磁盘空间、QPS/TPS 等核心指标的趋势图。
会话分析:查看当前活跃会话,识别哪些 SQL 正在占用大量资源。
空间分析:直观展示表空间占用情况,预测剩余可用天数。
操作技巧:点击右上角的 “更多指标”,可以自定义添加您关心的特定监控项(如锁等待、慢日志数量等)。
2. 慢日志分析 (自优化基础)
快速定位导致数据库变慢的 SQL 语句。
入口:实例详情页 -> “慢日志”。
功能:
统计排行:按执行时间、执行次数、扫描行数对慢 SQL 进行排序。
详情洞察:点击某条 SQL,查看其执行计划、样本详情以及优化建议(如是否缺少索引)。
全局分析(如果管理多个实例):在 DAS 首页使用 “全局慢日志” 功能,跨实例对比分析,找出共性问题。
3. 智能诊断与异常检测 (自诊断)
DAS 会自动扫描实例,发现潜在风险并给出报告。
入口:实例详情页 -> “智能诊断” 或首页的 “健康评分”。
功能:
健康评分:系统会根据性能、安全、稳定性给数据库打分(满分 100)。
异常事件:自动列出检测到的异常(如 CPU 突增、死锁、主从延迟),并提供根因分析和处理建议。
一键优化:部分简单问题(如创建索引建议),系统会提供“一键执行”按钮(需谨慎操作,建议先在测试环境验证)。
4. 安全基线检查 (自安全)
自动检查数据库配置是否符合安全规范。
入口:实例详情页 -> “安全中心” 或 “安全基线”。
功能:
扫描弱密码、高危权限(如超级管理员权限滥用)、未开启审计、白名单设置过宽(如 0.0.0.0/0)等风险。
提供整改建议,帮助您加固数据库安全。
5. 基础自治开关 (自修复/自运维)
控制 DAS 是否自动执行某些运维操作。
入口:实例详情页 -> “自治中心” -> “自治功能开关”。
基础版支持的功能:
异常事件自动通知:当检测到严重问题时,通过短信、钉钉或邮件报警。
自动 SQL 限流(部分场景):当检测到某个 SQL 导致数据库负载过高时,可配置自动限流策略(需注意,高级的自动限流和自动扩缩容通常需要企业版)。
存储空间自动扩展:对于云盘版 RDS,可开启磁盘空间不足时自动扩容(依赖底层云产品能力,DAS 做触发)。
第三步:日常运维工作流建议
为了最大化利用 DAS 基础功能,建议建立以下日常习惯:
每日必看:打开 DAS 首页,查看 “健康评分” 和 “告警事件”。如果有红色告警,优先处理。
每周优化:进入 “慢日志” 页面,筛选出“执行次数多且耗时较长”的 Top 10 SQL,联系开发人员进行索引优化或代码重构。
每月体检:运行一次 “安全基线检查”,确保没有新增的安全隐患(如临时开放的公网 IP 未关闭)。
容量规划:关注 “空间分析” 中的磁盘增长趋势,提前预判是否需要扩容,避免业务高峰期磁盘写满。
注意事项:基础版 vs 企业版
基础版(经济版):免费提供大部分监控、慢日志分析、健康诊断和安全检查功能。适合日常运维和被动式优化。
企业版:如果您需要 SQL 洞察(全量 SQL 记录)、自动 SQL 限流/杀会话、自动弹性伸缩(Auto Scaling)、流量回放 等高级自动化功能,则需要付费开通企业版。
提示:您可以在“自治中心”查看当前实例的版本,并根据需求升级。
通过以上步骤,您可以充分利用阿里云 DAS 的基础功能,以较低的成本实现数据库的可视化监控和智能化运维。