Azure Data Scientist Associate
DP-100
• 设计和准备机器学习解决方案 (20–25%)
• 浏览数据和运行试验 (20–25%)
• 训练和部署模型 (25–30%)
• 优化 AI 应用程序的语言模型 (25–30%)
识别数据集的结构和格式
确定机器学习工作负载的计算规范
选择训练模型的开发方法
创建和管理工作区
创建和管理数据存储
创建和管理计算目标
为源代码管理设置 Git 集成
创建和管理数据资产
创建和管理环境
使用注册表跨工作区共享资产
将自动化机器学习用于表格数据
将自动化机器学习用于计算机视觉
将自动化机器学习用于自然语言处理
选择并了解训练选项,包括预处理和算法
评估自动化机器学习运行,包括负责任 AI 准则
使用终端配置计算实例
在笔记本中访问和整理数据
使用附加的 Synapse Spark 池和无服务器 Spark 计算以交互方式整理数据
在特征存储中检索特征以训练模型
使用 MLflow 跟踪模型训练
评估模型,包括负责任 AI 准则
选择采样方法
定义搜索空间
定义主要指标
定义提前终止选项
在作业中使用数据
为作业运行配置计算
为作业运行配置环境
在作业运行中使用 MLflow 跟踪模型训练
定义作业的参数
将脚本作为作业运行
使用日志排查作业运行错误
创建自定义组件
创建管道
在管道中的步骤之间传递数据
运行和计划管道
监视管道运行并对其进行故障排除
在 MLmodel 文件中定义签名
将特征检索规范与模型项目打包
注册 MLflow 模型
使用负责任 AI 原则评估模型
为联机部署配置设置
将模型部署到联机终结点
测试联机部署的服务
为批处理部署配置计算
将模型部署到批处理终结点
调用批处理终结点以启动批量评分作业
从模型目录中选择和部署语言模型
使用基准比较语言模型
在操场中测试已部署的语言模型
选择优化方法
使用手动评估测试提示
定义和跟踪提示变体
创建提示模板
使用提示流 SDK 定义链接逻辑
使用跟踪评估流
为 RAG 准备数据,包括清理、分块和嵌入
配置矢量存储
配置基于 Azure AI 搜索的索引存储
评估 RAG 解决方案
准备数据进行微调
选择适当的基础模型
运行微调作业
评估经过微调的模型