如何开启和关闭数据库自治服务 DAS 的自治功能

阿里云服务器

在阿里云数据库自治服务(DAS)中,“自治功能” 指的是系统自动执行优化操作的能力(如自动限流、自动索引推荐执行、自动扩缩容等)。

默认情况下,为了安全起见,大部分高风险的自动执行功能是关闭的(仅开启“自动检测”和“告警”)。您需要手动开启具体的自治策略。

以下是开启和关闭 DAS 自治功能的详细步骤:

第一步:进入自治中心

  1. 登录 阿里云 DAS 控制台

  2. 在左侧导航栏中,点击 “自治中心” (Autonomy Center)。

    • 注意:如果您有多个实例,可以先在顶部选择具体实例,或者在“全局自治”中批量管理。

  3. 点击 “自治功能开关”“全局设置” 标签页。


第二步:开启/关闭具体的自治策略

DAS 的自治功能是按策略划分的,您可以单独控制每一项。常见的核心策略包括:

1. 异常事件自动通知 (基础功能)

  • 功能:当检测到 CPU 飙高、死锁、慢 SQL 突增时,自动发送短信、邮件或钉钉通知。

  • 操作

    • 找到 “异常事件自动通知” 开关。

    • 开启:系统发现异常立即报警。

    • 关闭:仅在控制台显示,不发送通知。

    • 建议:始终保持开启,并配置好接收人。

2. 自动 SQL 限流 (高危功能,需谨慎)

  • 功能:当检测到某个 SQL 导致数据库负载过高(如 CPU > 80%)时,DAS 自动拦截该 SQL,防止数据库宕机。

  • 操作

    • 找到 “自动 SQL 限流” 开关。

    • 开启前配置:必须设置触发阈值(例如:CPU > 80% 持续 1 分钟)和限流时长。

    • 开启:系统满足条件时自动执行 KILL 或限流操作。

    • 关闭:系统仅生成限流建议,需人工点击“执行”。

    • 建议:生产环境建议先开启“推荐模式”(人工确认),运行稳定一段时间后再开启“自动模式”。

3. 自动索引优化 (推荐功能)

  • 功能:分析慢日志,自动创建缺失的索引或删除冗余索引。

  • 操作

    • 找到 “自动索引优化”“空间优化” 开关。

    • 开启:系统评估后自动执行创建/删除索引操作(部分版本支持设置“自动执行阈值”,如预计提升性能 > 20% 则自动执行)。

    • 关闭:仅提供优化建议报告,需人工审核执行。

    • 建议:对于核心库,建议保持“关闭自动执行”,定期人工审核建议;对于非核心库,可开启全自动。

4. 自动弹性伸缩 (Auto Scaling)

  • 功能:当磁盘空间不足或 CPU 持续高位时,自动升级实例规格或扩容磁盘。

  • 操作

    • 找到 “自动弹性伸缩” 开关。

    • 开启:设置最大规格上限和触发条件,系统自动变配。

    • 关闭:仅发送扩容建议。

    • 注意:此功能通常依赖于底层 RDS/PolarDB 的产品能力,且可能产生额外费用。


第三步:设置“观察期”与“回滚” (安全兜底)

在开启任何自动执行类功能(如限流、索引)时,务必配置安全兜底策略:

  1. 观察期 (Observation Period)

    • 设置一个时间段(如 7 天),在此期间内,系统只记录建议不执行,让您观察建议的准确性。

  2. 自动回滚 (Auto Rollback)

    • 对于自动限流或自动索引,开启 “效果不佳自动回滚”

    • 如果执行后数据库负载未下降反而上升,系统会自动撤销操作(如恢复被限流的 SQL 或删除刚建的索引)。


第四步:批量管理 (多实例场景)

如果您管理几十上百个实例,逐个设置很麻烦:

  1. “自治中心” 首页,选择 “全局策略”

  2. 创建一个策略模板(例如:生产环境-保守策略测试环境-激进策略)。

  3. 将该策略应用到选中的实例组。

  4. 后续修改模板,所有关联实例会自动同步更新。


💡 最佳实践建议

环境类型推荐配置策略理由
生产核心库半自动模式开启“自动检测”和“自动通知”;关闭“自动限流”和“自动索引执行”,改为“人工审核建议”。防止误杀正常业务或索引导致锁表。
生产非核心库谨慎自动模式开启“自动限流”(设高阈值);开启“自动索引”(仅限删除冗余索引);创建索引仍需人工确认。
开发/测试库全自动模式开启所有自治功能。便于快速发现问题,自动优化,减少运维人力投入。

⚠️ 注意事项

  1. 版本限制:部分高级自治功能(如全自动 SQL 限流)可能需要 DAS 专业版企业版,基础版可能仅提供诊断建议。您可以在“自治中心”查看当前实例的版本。

  2. 权限要求:执行自动限流或索引操作需要数据库账号具备相应的 SUPERALTER 权限。如果接入时使用的是只读账号,自动执行会失败。

  3. 费用影响:自动弹性伸缩会导致实例规格变高,直接增加账单金额,请务必设置规格上限

通过以上配置,您可以让 DAS 从“被动监控”转变为“主动治理”,在保证安全的前提下最大化自动化收益。