学习指南

您所在的位置:网站首页 数据科学家认证考试 学习指南

学习指南

2024-07-12 05:53| 来源: 网络整理| 查看: 265

学习指南 - 考试 DP-100:在 Azure 上设计和实现数据科学解决方案 项目 05/23/2024 本文档的目的

本学习指南应帮助你了解考试的预期内容,并包含考试可能涵盖的主题摘要以及指向其他资源的链接。 本文档中的信息和材料可以帮助你在准备考试时集中精力学习。

有用链接 说明 查看自 2024 年 7 月 17 日起测试的技能 此列表表示在提供的日期之后测试的技能。 如果你计划在该日期之后参加考试,请学习此列表。 查看 2024 年 7 月 17 日之前测试的技能 如果在提供的日期之前参加考试,请学习此技能列表。 更改日志 如果想要查看将在提供的日期所做的更改,可以直接转到更改日志。 如何获得认证 有些认证只需要通过一项考试,而另一些认证则需要通过多项考试。 认证续订 Microsoft 助理、专业和专家认证每年都会过期。 你可以通过 Microsoft Learn 上的免费在线评估进行续订。 Microsoft Learn 个人资料 通过将认证个人资料连接到 Microsoft Learn,可以安排和续订考试以及共享和打印证书。 考分和成绩报告 需要 700 分或更高的分数才能通过。 考试沙盒 可以通过访问我们的考试沙盒来探索考试环境。 请求便利设施 如果你使用辅助设备、需要额外时间或需要修改考试体验的任何部分,你可以申请住宿。 进行免费的练习评估 通过练习题测试技能,帮助你为考试做准备。 考试更新

我们的考试会定期更新,以反映执行某一角色所需的技能。 我们提供了两个版本的技能测评目标,具体取决于你参加考试的时间。

我们始终首先更新考试的英语版本。 一些考试已本地化为其他语言,在英语版本更新后大约八周进行更新。 虽然 Microsoft 会尽一切努力更新本地化版本,但有时考试的本地化版本可能未按此计划进行更新。 其他可用语言列在“考试详细信息”网页的“安排考试”部分。 如果考试不以你的首选语言提供,你可以请求额外 30 分钟时间来完成考试。

注意

每项技能下面的项目符号旨在说明我们如何评估该技能。 考试中可能会涉及到相关的主题。

注意

大多数问题都涉及正式发布 (GA) 的功能。 如果经常使用预览功能,该考试可能会包含有关这些功能的问题。

自 2024 年 7 月 17 日起测试的技能 受众概况

作为此考试的考生,你应具备应用数据科学和机器学习在 Azure 上实现和运行机器学习工作负载的学科专业知识。

此角色的责任包括:

为数据科学工作负载设计并创建合适的工作环境。

浏览数据。

训练机器学习模型。

实现管道。

运行作业以准备生产。

管理、部署和监视可缩放的机器学习解决方案。

作为此考试的考生,你应该通过以下方式获得数据科学方面的知识和经验:

Azure 机器学习

MLflow

技能概览

设计和准备机器学习解决方案 (20–25%)

探索数据和训练模型 (35–40%)

准备要部署的模型 (20–25%)

部署并重新训练模型 (10–15%)

设计和准备机器学习解决方案 (20–25%) 设计机器学习解决方案

确定训练工作负载的相应计算规范

描述模型部署要求

选择要用于生成或训练模型的开发方法

管理 Azure 机器学习工作区

创建 Azure 机器学习工作区

使用用于工作区交互的开发人员工具管理工作区

为源代码管理设置 Git 集成

创建和管理注册表

管理 Azure 机器学习工作区中的数据

选择 Azure 存储资源

注册和维护数据存储

创建和管理数据资产

在 Azure 机器学习中为试验管理计算

为试验和训练创建计算目标

为机器学习用例选择环境

配置附加的计算资源,包括 Azure Synapse Spark 池和无服务器 Spark 计算

监视计算利用率

探索数据和训练模型 (35–40%) 使用数据资产和数据存储浏览数据

在交互式开发期间访问和整理数据

使用附加的 Synapse Spark 池和无服务器 Spark 计算整理交互式数据

使用 Azure 机器学习设计器创建模型

创建训练管道

使用设计器中的数据资产

在设计器中使用自定义代码组件

评估模型,包括负责任 AI 准则

使用自动化机器学习探索最佳模型

将自动化机器学习用于表格数据

将自动化机器学习用于计算机视觉

将自动化机器学习用于自然语言处理

选择并了解训练选项,包括预处理和算法

评估自动化机器学习运行,包括负责任 AI 准则

使用笔记本进行自定义模型训练

使用计算实例开发代码

使用 MLflow 跟踪模型训练

评估模型

使用 Python SDK v2 训练模型

使用终端配置计算实例

使用 Azure 机器学习优化超参数

选择采样方法

定义搜索空间

定义主要指标

定义提前终止选项

准备要部署的模型 (20–25%) 运行模型训练脚本

为脚本配置作业运行设置

为作业运行配置计算

在作业中使用来自数据资产的数据

使用 Azure 机器学习将脚本作为作业运行

使用 MLflow 记录作业运行的指标

使用日志排查作业运行错误

为作业运行配置环境

定义作业的参数

实现训练管道

创建管道

在管道中的步骤之间传递数据

运行和计划管道

监视管道运行

创建自定义组件

使用基于组件的管道

在 Azure 机器学习中管理模型

描述 MLflow 模型输出

确定用于打包模型的适当框架

使用负责任 AI 原则评估模型

部署并重新训练模型 (10–15%) 部署模型

为联机部署配置设置

为批处理部署配置计算

将模型部署到联机终结点

将模型部署到批处理终结点

测试联机部署的服务

调用批处理终结点以启动批量评分作业

应用机器学习运营 (MLOps) 做法

触发 Azure 机器学习作业(包括从 Azure DevOps 或 GitHub 触发)

根据新添加的数据或数据更改自动重新训练模型

定义基于事件的重新训练触发器

学习资源

我们建议你在参加考试之前进行培训并获得实践经验。 我们提供自学选项和课堂培训,以及指向文档、社区网站和视频的链接。

学习资源 学习和文档链接 参加培训 从自定进度学习路径和模块中进行选择,或参加讲师引导式课程 查找文档 Azure DatabricksAzure 机器学习Azure Synapse AnalyticsMLflow 和 Azure 机器学习 提问 Microsoft Q&A | Microsoft Docs 获取社区支持 AI - 机器学习 - Microsoft Tech CommunityAI - 机器学习博客 - Microsoft Tech Community 关注 Microsoft Learn Microsoft Learn - Microsoft Tech Community 查找视频 Microsoft Learn 节目 更改日志

理解表的关键:主题组(也称为功能组)以粗体字样显示,后跟每个组中的目标。 下表比较了两个版本的考试测评技能,第三列描述了更改程度。

2024 年 7 月 17 日之前的技能领域 自 2024 年 7 月 17 日起的技能领域 更改 受众概况 没有变化 设计和准备机器学习解决方案 设计和准备机器学习解决方案 无更改 设计机器学习解决方案 设计机器学习解决方案 没有变化 管理 Azure 机器学习工作区 管理 Azure 机器学习工作区 没有变化 管理 Azure 机器学习工作区中的数据 管理 Azure 机器学习工作区中的数据 没有变化 在 Azure 机器学习中为试验管理计算 在 Azure 机器学习中为试验管理计算 次要 探索数据和训练模型 探索数据和训练模型 无更改 使用数据资产和数据存储浏览数据 使用数据资产和数据存储浏览数据 次要 使用 Azure 机器学习设计器创建模型 使用 Azure 机器学习设计器创建模型 没有变化 使用自动化机器学习探索最佳模型 使用自动化机器学习探索最佳模型 没有变化 使用笔记本进行自定义模型训练 使用笔记本进行自定义模型训练 没有变化 使用 Azure 机器学习优化超参数 使用 Azure 机器学习优化超参数 没有变化 准备好要部署的模型 准备好要部署的模型 无更改 运行模型训练脚本 运行模型训练脚本 没有变化 实现训练管道 实现训练管道 没有变化 在 Azure 机器学习中管理模型 在 Azure 机器学习中管理模型 没有变化 部署并重新训练模型 部署并重新训练模型 无更改 部署模型 部署模型 没有变化 应用机器学习运营 (MLOps) 做法 应用机器学习运营 (MLOps) 做法 没有变化 2024 年 7 月 17 日之前测试的技能 受众概况

作为此考试的考生,你应具备应用数据科学和机器学习在 Azure 上实现和运行机器学习工作负载的学科专业知识。

此角色的责任包括:

为数据科学工作负载设计并创建合适的工作环境。

浏览数据。

训练机器学习模型。

实现管道。

运行作业以准备生产。

管理、部署和监视可缩放的机器学习解决方案。

作为此考试的考生,你应该通过以下方式获得数据科学方面的知识和经验:

Azure 机器学习

MLflow

技能概览

设计和准备机器学习解决方案 (20–25%)

探索数据和训练模型 (35–40%)

准备要部署的模型 (20–25%)

部署并重新训练模型 (10–15%)

设计和准备机器学习解决方案 (20–25%) 设计机器学习解决方案

确定训练工作负载的相应计算规范

描述模型部署要求

选择要用于生成或训练模型的开发方法

管理 Azure 机器学习工作区

创建 Azure 机器学习工作区

使用用于工作区交互的开发人员工具管理工作区

为源代码管理设置 Git 集成

创建和管理注册表

管理 Azure 机器学习工作区中的数据

选择 Azure 存储资源

注册和维护数据存储

创建和管理数据资产

在 Azure 机器学习中为试验管理计算

为试验和训练创建计算目标

为机器学习用例选择环境

配置附加的计算资源,包括 Apache Spark 池

监视计算利用率

探索数据和训练模型 (35–40%) 使用数据资产和数据存储浏览数据

在交互式开发期间访问和整理数据

使用 Apache Spark 整理交互式数据

使用 Azure 机器学习设计器创建模型

创建训练管道

使用设计器中的数据资产

在设计器中使用自定义代码组件

评估模型,包括负责任 AI 准则

使用自动化机器学习探索最佳模型

将自动化机器学习用于表格数据

将自动化机器学习用于计算机视觉

将自动化机器学习用于自然语言处理

选择并了解训练选项,包括预处理和算法

评估自动化机器学习运行,包括负责任 AI 准则

使用笔记本进行自定义模型训练

使用计算实例开发代码

使用 MLflow 跟踪模型训练

评估模型

使用 Python SDK v2 训练模型

使用终端配置计算实例

使用 Azure 机器学习优化超参数

选择采样方法

定义搜索空间

定义主要指标

定义提前终止选项

准备要部署的模型 (20–25%) 运行模型训练脚本

为脚本配置作业运行设置

为作业运行配置计算

在作业中使用来自数据资产的数据

使用 Azure 机器学习将脚本作为作业运行

使用 MLflow 记录作业运行的指标

使用日志排查作业运行错误

为作业运行配置环境

定义作业的参数

实现训练管道

创建管道

在管道中的步骤之间传递数据

运行和计划管道

监视管道运行

创建自定义组件

使用基于组件的管道

在 Azure 机器学习中管理模型

描述 MLflow 模型输出

确定用于打包模型的适当框架

使用负责任 AI 原则评估模型

部署并重新训练模型 (10–15%) 部署模型

为联机部署配置设置

为批处理部署配置计算

将模型部署到联机终结点

将模型部署到批处理终结点

测试联机部署的服务

调用批处理终结点以启动批量评分作业

应用机器学习运营 (MLOps) 做法

触发 Azure 机器学习作业(包括从 Azure DevOps 或 GitHub 触发)

根据新添加的数据或数据更改自动重新训练模型

定义基于事件的重新训练触发器



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3