使用 Core ML 转换器为设备获取模型

您所在的位置：网站首页 › ml转换 › 使用 Core ML 转换器为设备获取模型

使用 Core ML 转换器为设备获取模型

2024-06-18 22:13| 来源: 网络整理| 查看: 265

下载

（你好 WWDC 2020）

你好欢迎来到 WWDC

（使用 Core ML 转换器为设备获取模型）你好我是 Core ML 团队的 Aseem 在本视频中我想与大家分享 Core ML 转换器几个令人兴奋的新进展我们一直在努力优化将模型转换为 Core ML 的使用体验并且我们对转换工具进行了重大更新

不过让我们首先来看一下为什么说 Core ML 刚好为将机器学习集成到你的 app 中提供了一个绝佳的解决方案自从 2017 年发布 Core ML 以来我们的任务一直是让机器学习模型可以尽可能轻松地部署到你的 app 中从而创造出各种引人入胜的体验通过 Core ML 我们可以很方便地将同一个模型部署到所有类型的 Apple 设备中并且保证了跨 OS 和不同代设备之间的最佳兼容性和性能 Core ML 模型无缝地利用了设备上所有可用的硬件加速不管是中央处理器、图形处理器还是专门为加速神经网络而设计的 Apple 神经网络引擎此外随着每次新版本的发布你都可以获得最佳的 Apple 生态系统例如今年我们推出了 Core ML 模型部署以使你可以轻松地更新模型而且现在还可以加密 Core ML 模型想了解更多详情请查看 “Core ML 模型部署与安全”视频因此说实话 Core ML 模型开启了通向这些出色体验的大门本视频的主题就是如何创建 Core ML 模型 Core ML 可以表达多种机器学习模型从深度学习模型到基于树的模型都可以通过 Core ML 进行表达当然 Create ML app 是创建 Core ML 的最佳资源之一但是你也可以使用 Core ML Tools Python 套件从你最喜爱的框架中轻松地创建一个 ML 模型随着时间的推移 ML 生态系统不断发展 Core ML 转换器会不断向更多的框架提供支持今年我们发布了一些激动人心的消息是有关我们对神经网络库的支持

目前我们已支持转换其中一个框架之中的神经网络模型今年我们重点介绍了深度学习社区最常用的两个资料库分别是 PyTorch 和 TensorFlow 让我们首先来看一下 TensorFlow

目前如果你想要将 TensorFlow 模型转换为 Core ML 则必须另外安装 tfcoreml 并使用其 API 该 API 的内部依赖于 Core ML Tools 套件但这已经发生了变化现在你只需要 Core ML Tools 我们现已将 TensorFlow 转换完全集成到 Core ML Tools 中了我们也很高兴地宣布对 TensorFlow 2 的支持得到极大扩展 TensorFlow 1 现已通过 TF Core ML 得到了一段时间的支持并且在去年我们增加了对 TF 2 卷积模型的支持今年我们的支持大大地扩展至动态模型例如 LSTM、编解码器等

新型转换器支持 TensorFlow 模型导出的所有不同格式让我们现在看看从 PyTorch 进行的转换目前我们是使用 PyTorch 导出工具来生成一个 ONNX 模型进行转换的然后使用 ONNX Core ML 以获得 ML 模型但是很多时候第一个导出步骤可能会失败因为 ONNX 是一个独立进化的开放式标准因此它可能缺少 PyTorch 的新增特性或者是 torch 导出器未更新又或者是可能存在错误因为我们使用了新的 PyTorch 转换器所以消除了这一额外依赖性现在从 torch_script_model 开始只需一步就可完成这一过程

你可能已经注意到调用 PyTorch 转换器的 API 与之前 TensorFlow 使用的 API 完全相同这是因为我们重新设计了 API 以保留一个调令来调用所有转换器它都可以进行调用不管模型需要从哪个源框架进行转换

通过这些变化 Core ML Tools 现在成为了从 TensorFlow 和 PyTorch 进行模型转换的一站式商店并且不仅仅是 API 发生了更改我们不只是添加了两个新的转换器通道相反我们付出了巨大的努力来重新设计转换器架构以显著提升用户体验和代码质量因此我们从之前拥有分开的转换器管道这些管道是在不同时间点通过添加不同的转换器所建立的转变成了一个最大限度重用代码的单一转换器堆栈而为了实现这种整合我们引入了一种新的内存表式法称为模型中间语言简称 MIL MIL 旨在简化转换过程并使为新框架添加支持更加简单它通过提供一个共同的接口来统一堆栈以从不同的框架中获取信息

它具有一套运算、优化过程和模型构建器 API 作为终端用户你通常不会与 MIL 进行交互但它在某些场景中确实非常有用我们会在本视频稍后部分再次讨论 MIL 我们首先来看一些使用新转换器的示例

让我们从简单的图像分类器示例开始以熟悉新的统一 API 为此让我切换到 Jpyter 笔记本这是在 Jpyter 笔记本中而且我已经导入了 Core ML Tools 让我们首先从 TensorFlow 2 进行转换这个我也已经导入了我会从 TensorFlow 2 模型 zoo 中抓取一个模型

我正在使用 MobileNet 模型这是用于图像分类最流行的卷积模型让我们加载它

然后进行转换

为此我只需键入 ct.convert

并为其提供 TensorFlow 模型对象然后按下回车键

转换器就会自动检测模型的类型它的输入形状、输出等然后继续通过 MIL 进行转换好了完成这非常简单我们为什么不再试一次呢？这次我们使用 PyTorch 的模型

为此我先导入 torch 和 torchvision 我这次从 torchvision 中抓取 mobilenet v2 模型

现在我们需要一个 TorchScript 模型转换为 Core ML 这可以通过脚本编制或追踪来实现在这里我将使用追踪的方法

我们可以通过 PyTorch 提供的函数进行追踪让我们来看看这是如何进行的我们首先使用 eval 以在推理模式下获得该模型然后调用 jit.trace 方法该方法需要一个示例输入才能起作用让我们按下回车键好了我们有追踪模型了现在我们可以使用 Core ML Tools 来进行转换

我再次键入 ct.convert 这次我提供了追踪模型现在还有一件事通常输入形状的信息不存在于 TorchScript 模型中但这是进行转换所必需的因此让我们将其提供给转换器这可以通过使用输入参数来完成我会提供输入的类型和形状而我可以通过 TensorType 类来实现这点 TensorType 类可接受形状

就是这样让我们按下回车键

我们看到了转换到 MIL 的熟悉步骤经过几次优化最后转换到 ML 模型这样就完成了让我们通过打印 ML 模型对象来检查模型界面

让我们一起来看看我们看到这有个名为 input.1 的输入并且它是 multiArray 类型因为我们在这里提供了 TensorType 这里有个名为 1648 的输出嗯这有一点奇怪实际上这是 torch 模型中输出张量的名称转换器自动地从这里取得了它好的我们可以很容易地将其重命名为更有意义的名称让我们来看看如何进行

因此我使用 Core ML Tools 中的重命名功能实用程序将输入和输出重命名为我想要的名称在本例中我使用了占位符名称让我们按下回车键然后再次打印 ML 模型对象很好因此我们看到输入和输出的名称已更新为我所提供的名称

现在让我进行最后一次转换这次从 TensorFlow 1 进行转换为此我换个笔记本在这里我已经设置好了 TensorFlow 1 环境我也提前下载了 mobilenet TensorFlow 1 模型它的格式是 protobuf pb 随着该模型一起的还有 label.txt 文件其中包含了这个模型所训练的类的名称我们来转换下该模型

我们会调用熟悉的转换 API 现在我们可以为其提供 protobuf pb 文件这样就可以了但是这次我们通过一些额外的事情来构建一个不错的 Core ML 模型之前我们使用过 TensorType 但你知道由于此模型确实可以在图像上运行所以最好让转换器知道这一点我可以通过使用 ct.ImageType 类来实现这点我将向该类提供几个预处理参数为每个

RGB 图像中的通道提供偏差和比例

这将按照 mobilenet 模型的预期将图像标准化

我要更改的另一件事是由于该模型执行分类因此生成一个分类器 Core ML 模型可能是一个好主意这可以通过使用 ClassifierConfig 类来实现它可以原样采用 label.txt 文件是不是很棒？让我们按下回车键

我们完成了让我们把该模型保存到磁盘上不过在此之前我将添加一些关于许可证和作者的有用的元数据然后我将键入 mlmodel.save 来保存该模型

我会将模型命名为 mobilenet.mlmodel

现在我可以看到它已经在磁盘上了让我们在 Finder 中检查该模型我们可以看到模型在这里让我单击打开它它会在 Xcode 中自动打开今年我们更新了 Xcode 用户界面对于现在的分类器来说可以在这里看到类标签如我们所见该模型大概有 1000 类还有一个名为 Preview 的新标签这非常方便我非常喜欢这个标签我们可以在这里简单地拖放一些图像它将自动在这些图像上运行我们的模型并显示预测结果就像我们在这里看到的那样我们的模型在这些图像上看起来表现不错转换 API 演示到此结束了让我们一起来回顾一下我们使用不同的模型类型调用了转换函数并且该函数起作用了现在让我们尝试转换一个稍微复杂的模型为此我想邀请我的同事 Gitesh 他将对用于将音频转换为文本的模型进行转换谢谢 Aseem 你好我是 Core ML 团队的工程师 Gitesh 在此次演示中我将演示灵活形状的自动处理以及新的 Core ML Tools 转换 API 的相关功能我将使用自动语音识别任务进行演示在此任务中输入的是一个语音音频文件而输出的是其文本转录自动语音识别有很多方法我在示例中使用的系统包括三个阶段有预处理和后处理阶段中间还有一个完成主要工作的神经网络模型

预处理包括从原始音频文件中提取 mel 频谱也称为 MFCC 这些 MFCC 会输入给神经网络模型该模型返回一个概率分布的字符级时间序列

然后由 CTC 解码器进行后处理生成最终的转录

预处理和后处理阶段采用了很容易实现的标准技术因此我的重点是转换此模型的中间部分我使用了一个名为 DeepSpeech 的预训练 TensorFlow 模型

在高层次上该模型使用一个 LSTM 和几个堆叠的密集层而这样的架构对于 seq2seq 模型来说相当常见现在让我们直接进入 Jupyter 笔记本将模型转换为 Core ML 并对一些音频样本进行尝试我们从导入一些套件开始我从 Mozilla 的 GitHub 存储库中找到了 DeepSpeech 模型的预训练权重并且已经下载了这些权重和一个脚本以从该存储库中导出 TensorFlow 1 模型让我们运行此脚本

我们现在有一个 protobuf 格式的 TensorFlow 冻结图让我们来看看该图的输出内容为此我已经编写了一些检查应用程序

所以这个模型有四个输出这是第一个输出名为”mfccs“ 代表预处理阶段的输出这意味着输出的 TensorFlow 图不仅包含 DeepSpeech 模型还包含了预处理子图让我们把剩下的三个输出名提供给统一的转换器函数从而将这个预处理组件剥离出来有了这些信息让我们调用 Core ML 转换器

非常好转换很成功现在让我们在音频样本上运行此转换后的模型首先我们加载并播放音频文件

从前这里有一只怒气冲冲的鸡他遇到了一只金色的老虎他们一起穿过绿色的森林完接下来我们对其进行预处理为了使整个管道都能在此笔记本中使用我已经使用 DeepSpeech 存储库中的代码构造了这些预处理和后处理函数

所以这个预处理已经把音频文件转化成了这个形状的张量对象这个形状可以看作是一个音频文件被预处理成 636 个序列每个序列的宽度是 19 且包含 26 个系数这些序列的数量会随着音频长度的变化而变化对于这个 12 秒的音频文件我们有 636 个序列现在让我们检查下模型期望的输入形状

我们看到这个模型的第一个输入几乎有了正确的形状唯一的区别是它可以一次处理 16 个序列因此我将编写一个循环把输入的特性分成几块并把每一段逐一提供给模型我已经写了这段代码让我把它粘贴在这里你不需要遵循所有这些代码基本上我们将预处理后的特性分解为大小为 16 的切片并在循环中通过状态管理在每个切片上运行预测让我们运行它

很好转录看起来非常准确现在一切看起来都不错但是如果我们可以一次就对整个预处理特性进行预测那不是很棒吗？这是有可能的为此我们需要一个动态的 TensorFlow 模型让我们从 DeepSpeech 存储库中重新运行相同的脚本以获得动态图这次我们提供了一个名为“n_steps”的附加标志该标志对应于序列长度并且默认值为 16 但是现在我们把它设置为 -1 这意味着序列长度可以取任意的正值

我们有了新的 TensorFlow 模型让我们对其进行转换

太棒了转换完成让我们看看这个模型与前一个有何不同

我看到的一个区别是这种 Core ML 模型可以处理任意序列长度的输入而区别不仅仅在于形状在后台这种动态 Core ML 模型比前面的静态模型要复杂得多它有很多动态运算比如获取形状动态重塑等等但是我们进行转换的体验是完全相同的转换器可以像之前一样轻松地进行处理现在让我们在相同的音频文件上验证模型

这次我们不需要循环可以直接将整个输入特性提供给模型让我们运行它

太棒了转录看起来又是非常完美的让我们回顾一下在演示中看到的内容我们使用了 DeepSpeech 模型的两种变体在静态 TensorFlow 图表中转换器生成了 Core ML 模型该模型具有固定形状的输入利用动态变体我们获得了接受任何序列长度输入的 Core ML 模型转换器清晰明了地处理了这两种情况

并且没有对转换调用进行任何的更改在演示中我没有机会展示的一件事是我们可以从一个动态 TensorFlow 图形开始然后得到一个静态 Core ML 模型让我们看看这是如何进行的首先我们定义一个 Type 描述对象

其输入名称为

其形状为

然后我们将该对象提供给转换 API

这样就可以了在后台类型和值推断会传播此形状信息从而删除掉所有不必要的动态运算因此静态模型可能会表现更好而动态模型肯定会更灵活

使用哪种模型取决于你的 app 需求至此我们看到了成功转换为 Core ML 的几个案例然而在某些情况下我们可能会遇到一个不支持的操作错误事实上我最近遇到了这个问题让我来给大家演示一下我正在这个资料库中探索称为”transformers“的自然语言模型一个名为 T5 的近期模型引起了我的注意让我们对它进行转换首先我们从资料库中加载预训练的模型因为返回的对象是 tf.keras 模型的实例

所以我们可以直接将其传到 Core ML 转换器中让我们一起做一下

在这里我们看到“Einsum”运算不受支持的操作错误现在我把时间交回给 Aseem 他将介绍一些处理该问题的方法然后我们再回来转换这个模型我们认识到在不断发展的机器学习领域遇到此错误是一个挑战因为新的操作会定期添加到 TensorFlow 或 PyTorch 中或者你可能正在使用自己定制的操作在这种情况下该怎么做呢？那么一个选择是使用 Core ML 自定义层它允许你将 ML 模型与自己的操作的 swift 实施一起使用这很好但是在许多情况下可以采用另一种更简单的方法你可以使用我们所说的“composite op” 因为它可以将所有内容绑定在 ML 模型文件中所以不需要编写额外的 Swift 代码 composite op 是根据现有的 MIL 操作构建的让我们深入研究一下 MIL 是什么以及如何使用它来构建 composite op 我们开发了模型中间语言来统一转换器堆栈如果我们展开看其内部结构这个堆栈由三个部分组成前端、中间 MIL 部分和后端每一个源框架都有一个单独的前端它用于捕获框架特定的表达式之后将构建一个 MIL 程序此时该表达式将与源无关许多常见的优化过程如运算符融合、死代码消除常量传播等都是在这里进行的之后图会被序列化为 protobuf ML 模型格式看待同一张图片的另一种方式是每个源框架都有自己的方言这些方言被转换为 MIL 作为一个整合点再转换为 ML 模型这是转换器转换为 MIL 格式的一种方法但是还有另一种方法可以使用 builder API 直接写出 MIL 程序 MIL 是一种独立语言可用于直接表达神经网络模型它的 API 和很多人已经很熟悉的 API 非常相似无论你是 TensorFlow 2 还是 PyTorch 用户让我们来看看这个 builder API 下面是我们如何用 Python 编写 MIL 程序的方法我们导入这一 builder 并通过指定其形状来定义输入在本例中为 1、100、100、3 我们只需调用打印就可打印程序的描述在下面的描述中我们可以看到输入的类型被推断为 Float32 这是默认类型现在我们添加第一个 op 我们使用这个简单的句法添加了一个 ReLu op 让我们添加另一个 op 这次是转置 op MIL builder 的一大优点是它可以立即执行类型和形状推断我们可以看到在下面的描述中转置输出的形状已正确更新让我们在最后两个轴上添加归约运算我们看到和预期一样现在张量的形状是1, 3 让我们添加最后一个 op 最后程序返回日志 op 的输出因此我们看到用于在 MIL 中定义网络的 API 非常简单现在让我们来看看如何将其用于实施复合操作并绕过不受支持的操作错误让我交回给 Gitesh 由他为大家进行说明我们正在转换 T5 模型然后遇到了 Einsum 不受支持的操作错误我阅读了 TensorFlow 说明文档发现它引用了 Einstein 求和标记法许多运算比如 reduce_sum、transpose、trace 等都可以在这种标记法中使用字符串来表达对于这种特定的转换让我们集中讨论一下该模型使用的标记法通过查看错误跟踪我们可以看到这个模型使用了 Einsum 和这个标记也就是下面的数学表达式这可能看起来很复杂但实际上它只是第二个输入上带有转置的批处理矩阵乘法这非常棒因为 MIL 直接支持此运算让我们编写一个复合操作首先我们导入 MIL Builder 和一个修饰符

然后我们定义一个与 TensorFlow 运算同名的函数在本例中是 Einsum 接下来我们修饰该函数以将其注册到转换器中这样可以确保在转换过程中每当遇到 Einsum 运算都会调用正确的函数

最后我们抓取输入并使用 MIL Builder 定义 MatMul 运算好了让我们再次调用 Core ML 转换器

完成转换让我们通过打印 ML 模型来验证转换是否成功

完美！回顾一下在转换 T5 模型时我们遇到了 Einsum 不受支持的操作错误一般来说 Einsum 是一个复杂的运算可以表达很多张量运算但是我们不必担心所有可能的情况我们只要处理此模型所需的特定参数化并且可以通过复合操作轻松实现总而言之我们在 Core ML Tools 中加入了许多新特性比如强大的类型推断用户友好的 API 等等这些特性使得 Core ML 转换器更易于使用和扩展要了解有关这些功能的更多信息请访问我们的新说明文档里面提供了几个示例本视频中的演示内容也包含在内最后我们宣布了新的 PyTorch 转换器和对 TensorFlow 2 所增强的支持这些可以通过新的统一 API 进行获取并可以通过 MIL 进行获取

我们邀请大家进行尝试你们的反馈有助于让 Core ML Tools 变得更好谢谢大家

【本文地址】

使用 Core ML 转换器为设备获取模型

使用 Core ML 转换器为设备获取模型

今日新闻

推荐新闻

使用 Core ML 转换器 为设备获取模型

使用 Core ML 转换器 为设备获取模型

今日新闻

推荐新闻

使用 Core ML 转换器为设备获取模型

使用 Core ML 转换器为设备获取模型