考试大纲 | Azure DP-100(最新版)


■ 考试名称

Azure Data Scientist Associate

■ 版本编号

DP-100

■ 技能概览

• 设计和准备机器学习解决方案 (20–25%)
• 浏览数据和运行试验 (20–25%)
• 训练和部署模型 (25–30%)
• 优化 AI 应用程序的语言模型 (25–30%)

■ 设计和准备机器学习解决方案 (20–25%)

设计机器学习解决方案

识别数据集的结构和格式
确定机器学习工作负载的计算规范
选择训练模型的开发方法

创建和管理 Azure 机器学习工作区的资源

创建和管理工作区
创建和管理数据存储
创建和管理计算目标
为源代码管理设置 Git 集成

创建和管理 Azure 机器学习服务工作区的资产

创建和管理数据资产
创建和管理环境
使用注册表跨工作区共享资产

■ 浏览数据和运行试验 (20–25%)

使用自动化机器学习探索最佳模型

将自动化机器学习用于表格数据
将自动化机器学习用于计算机视觉
将自动化机器学习用于自然语言处理
选择并了解训练选项,包括预处理和算法
评估自动化机器学习运行,包括负责任 AI 准则

使用笔记本进行自定义模型训练

使用终端配置计算实例
在笔记本中访问和整理数据
使用附加的 Synapse Spark 池和无服务器 Spark 计算以交互方式整理数据
在特征存储中检索特征以训练模型
使用 MLflow 跟踪模型训练
评估模型,包括负责任 AI 准则

自动超参数优化

选择采样方法
定义搜索空间
定义主要指标
定义提前终止选项

■ 训练和部署模型 (25–30%)

运行模型训练脚本

在作业中使用数据
为作业运行配置计算
为作业运行配置环境
在作业运行中使用 MLflow 跟踪模型训练
定义作业的参数
将脚本作为作业运行
使用日志排查作业运行错误

实现训练管道

创建自定义组件
创建管道
在管道中的步骤之间传递数据
运行和计划管道
监视管道运行并对其进行故障排除

管理模型

在 MLmodel 文件中定义签名
将特征检索规范与模型项目打包
注册 MLflow 模型
使用负责任 AI 原则评估模型

部署模型

为联机部署配置设置
将模型部署到联机终结点
测试联机部署的服务
为批处理部署配置计算
将模型部署到批处理终结点
调用批处理终结点以启动批量评分作业

■ 优化 AI 应用程序的语言模型 (25–30%)

准备模型优化

从模型目录中选择和部署语言模型
使用基准比较语言模型
在操场中测试已部署的语言模型
选择优化方法

通过提示工程和提示流进行优化

使用手动评估测试提示
定义和跟踪提示变体
创建提示模板
使用提示流 SDK 定义链接逻辑
使用跟踪评估流

通过检索增强生成 (RAG) 进行优化

为 RAG 准备数据,包括清理、分块和嵌入
配置矢量存储
配置基于 Azure AI 搜索的索引存储
评估 RAG 解决方案

通过微调进行优化

准备数据进行微调
选择适当的基础模型
运行微调作业
评估经过微调的模型