点云数据处理Python(点云 python)

2024-12-06

PyG使用教程:(一)基本介绍

PyG 中内置了大量通用基础数据集,如 Planetoid datasets、图分类数据集、QM7和QM9数据集、少量的3D网格/点云数据集等。初始化一个数据集十分简单,PyG 会自动处理成 Data 格式。对于 ENZYMES 数据集,包含37个节点,每个节点有3个特征,同时有 168/2=84条无向边。

综上所述,`Data` 对象的基本属性包括 `x`(节点特征)、`edge_index`(边的索引)、`pos`(节点位置)和 `y`(样本标签)。在构建 Dataset 时,可以使用 PyG 提供的工具,如 `TUDataset`,通过简单的代码加载数据集,并通过索引访问每个数据。

这种表达也被叫做COO格式(coordinate format),它通常被用作表达稀疏矩阵。与在密集表达内持有邻接信息[公式]不同,PyG稀疏地表达图,也就是只持有[公式]里非零的坐标或值。而且,PyG并不区分有向和无向图,它将无向图视作有向图的一个特例。

PyTorch Geometric (PyG) 是一个基于 PyTorch 的图神经网络库,便于实现论文复现和数据处理,其接口设计与PyTorch相近,适合熟悉该框架的用户使用。构建图的基础是PyG中的torch_geometric.data.Data对象,它包含节点和边信息,非必需属性可为空。Data对象可扩展,如存储三维网格的三角形连接性。

PyG提供了两个数据集的抽象类:torch_geometric.data.Dataset 和 torch_geometric.data.InMemoryDataset。torch_geometric.data.InMemoryDataset 继承自 torch_geometric.data.Dataset,如果整个数据集可以放入CPU内存中,就应该使用它。每个数据集都会传递一个 root 文件夹,用于指示应将数据集存储在何处。