深度学习 3d 数据集,准备管道的最佳方法是什么?哪种算法最好?

Deep learning for 3d datasets, what is the best way to prepare a pipeline? and which algorithm would be best?

所以我有一个点云或一个 3D 网格,每个网格包含以下数据 (features/attributes):网格类型(建筑物、树木、草地、土壤或空白)。但是 space 类型“建筑物”具有子属性,例如电导率和反射值。此外,单元格的属性还有一些适用于整个数据集的其他属性,这些属性的示例有风速、温度等。我想知道哪种深度学习算法有助于根据我上面解释的 3d 属性预测每个网格单元(仅在 x、y 方向)的气温值。另外,为此准备管道的最佳方法是什么?目标是在我为训练模型提供具有几何模型信息、风向和风速的数据集时预测气温值)

这是我有 300 张图像的示例图像(有图像,我有每个网格单元的所有属性的数据集,以及气温值)。图像在 60x60x60 单元格的立方体中建模,当单元格包含建筑物时,space 类型设置为“建筑物”,当单元格有空气时,space 类型设置为“空白”等等……,正如我提到的,每个“建筑”单元格都包含额外的子属性。我试图预测的值是每个空白单元格(建筑物周围)在 x,y 平面(假设高度 z=2)处的空气温度值,在此图像中,x,y 平面是彩色平面.我有数字值,而不仅仅是彩色平面。

这也是我拥有的一小部分数据和结果(y 值 = 空气温度)。

您的问题是 3D 的事实并不意味着您的数据集必须是。

在我看来,这是一个非常直接的机器学习问题,您可以将数据重新格式化为一个数据集,每行包含:单元格位置 (x, y, z)、cell typesub_attribute... 和目标:temperature.

所需的预处理将取决于您选择的模型类型,有些不支持 categorical 输入,有些则支持。

如果您愿意,可以使用深度学习,但它们通常不适用于分类变量,因此您必须对所有文本信息进行编码,而 300 个实例对于训练这种模型来说非常小。 作为第一步,您可能会更幸运地使用 Random Forest 算法。