我可以将本地服务器(文件或 dbs..)的自定义源和接收器直接设置为数据流吗?
Can i make the custom source&sink from local server(file or dbs..) to dataflow directly?
我想将本地服务器(文件或数据库)的自定义源和接收器直接制作成数据流。所以我想知道这是否可能。
如果可以的话,需要注意什么?
仅供参考,我从未制作过自定义源和接收器。
但是我用过一次GCS,dataflow。
Dataflow 的 custom IO framework 可以从任意源读取并写入任意接收器。您当然可以为各种类型的文件和数据库编写连接器。
但是,在远程服务上执行管道时,例如云端的 Google Cloud Dataflow,根据多种因素,它可能无法访问本地计算机上的服务 运行。此外,此类本地服务的扩展性可能不足以获得高性能的数据处理管道。
因此,将数据移动到基于云的服务可能会更好,例如 Google Cloud Storage 或 Google BigQuery。
我想将本地服务器(文件或数据库)的自定义源和接收器直接制作成数据流。所以我想知道这是否可能。
如果可以的话,需要注意什么? 仅供参考,我从未制作过自定义源和接收器。 但是我用过一次GCS,dataflow。
Dataflow 的 custom IO framework 可以从任意源读取并写入任意接收器。您当然可以为各种类型的文件和数据库编写连接器。
但是,在远程服务上执行管道时,例如云端的 Google Cloud Dataflow,根据多种因素,它可能无法访问本地计算机上的服务 运行。此外,此类本地服务的扩展性可能不足以获得高性能的数据处理管道。
因此,将数据移动到基于云的服务可能会更好,例如 Google Cloud Storage 或 Google BigQuery。