图数据集加载与处理 |
您所在的位置:网站首页 › 图数据集 › 图数据集加载与处理 |
图数据集加载与处理
MindSpore提供的mindspore.dataset模块可以帮助用户构建数据集对象,分批次地读取文本数据。同时,在各个数据集类中还内置了数据处理和数据分词算子,使得数据在训练过程中能够像经过pipeline管道的水一样源源不断地流向训练系统,提升数据训练效果。 本章将简要演示如何使用MindSpore加载和处理图数据。 图的概念在介绍图数据的读取及增强之前,先介绍图的基本概念进行,有助于后续内容更好地理解。通常一个图(graph) G是由一系列的节点(vertices) V以及边(edges)E组成的,每条边都连接着图中的两个节点,用公式可表述为: \[G = F(V, E)\]简单的图如下所示。 图中包含节点V = {a, b, c, d},和边E = {(a, b), (b, c), (c, d), (d, b)},针对图中的连接关系通常需借助数学的方式进行描述,如常用的基于邻接矩阵的方式,用于描述上述图连接关系的矩阵C如下,其中a、 b、c、d对应为第1、2、 3、4个节点。 \[\begin{split}C=\begin{bmatrix} 1&1&0&0\\ 1&1&1&1\\ 0&1&1&1\\ 0&1&1&1\\ \end{bmatrix}\end{split}\] 数据集准备环节数据集介绍 常用的图数据集包含Cora、Citeseer、PubMed等,在 |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |