Google Cloud Dataproc - 传输中加密?
Google Cloud Dataproc - Encryption in transit?
有谁知道常见问题解答 (https://cloud.google.com/dataproc/docs/resources/faq) 中的以下内容究竟是什么意思?
"Data can be user encrypted in transit to and from a cluster, upon
cluster creation or job submission."
我找不到在集群创建期间启用加密的选项。这是否基本上意味着,您自己配置所有组件以确保通信被加密。
我们很想知道 Spark/Hive/Tez 作业在执行作业时是否使用加密通信通道,或者通过 jdbc 连接连接到 Hive。
是否有针对此的任何现有初始化操作,或者此声明是否基本上意味着它完全取决于您?
我假设在与 GCP API 交谈时是在谈论 authentication/authorization/encryption。重要的是,如果您的数据位于 GCS 或 BigQuery 中,则数据传输是安全的。此外,与 Dataproc 控制平面的所有通信(例如创建集群、提交作业)都是安全的。
集群内的通信不安全是正确的,但它是本质上是气隙的。节点到节点通信发生在您隔离的内部 IP 上 VPC network. Dataproc has guidance 关于如何配置防火墙规则。
您还可以使用 Dataproc private IP clusters 来避免虚拟机上有外部 IP 地址。
我不知道有任何初始化操作来设置 Kerberos -- 所以是的,您必须自己动手。
有谁知道常见问题解答 (https://cloud.google.com/dataproc/docs/resources/faq) 中的以下内容究竟是什么意思?
"Data can be user encrypted in transit to and from a cluster, upon cluster creation or job submission."
我找不到在集群创建期间启用加密的选项。这是否基本上意味着,您自己配置所有组件以确保通信被加密。
我们很想知道 Spark/Hive/Tez 作业在执行作业时是否使用加密通信通道,或者通过 jdbc 连接连接到 Hive。
是否有针对此的任何现有初始化操作,或者此声明是否基本上意味着它完全取决于您?
我假设在与 GCP API 交谈时是在谈论 authentication/authorization/encryption。重要的是,如果您的数据位于 GCS 或 BigQuery 中,则数据传输是安全的。此外,与 Dataproc 控制平面的所有通信(例如创建集群、提交作业)都是安全的。
集群内的通信不安全是正确的,但它是本质上是气隙的。节点到节点通信发生在您隔离的内部 IP 上 VPC network. Dataproc has guidance 关于如何配置防火墙规则。
您还可以使用 Dataproc private IP clusters 来避免虚拟机上有外部 IP 地址。
我不知道有任何初始化操作来设置 Kerberos -- 所以是的,您必须自己动手。