aws emr with glue:如何指定数据库名称?
aws emr with glue: how to specify database name?
我正在尝试 运行 使用 Glue 元数据的配置单元作业。来自 aws 文档
Under AWS Glue Data Catalog settings select Use for Hive table
metadata.
我创建了一个集群,它显然从 glue 连接到 default
数据库(我可以通过 hive 的 运行ning show tables;
来判断,它列出了一个 table 来自default
数据库。
现在有人知道如何提供从胶水连接到另一个数据库的选项吗?我在文档中唯一能找到的是提供 hive.metastore.glue.catalogid
的机会,您可以在其中提供来自另一个帐户的目录,但我在文档中找不到任何关于使用正确数据库的信息。
或者可能所有数据库都已加载。如果是这样,您知道如何在配置单元中访问它们吗?
好的,原来所有的数据库都加载到hive中了。您可以使用 select * from my_database_name.my_table_name
或使用 use my_database_name
设置一次数据库名称来简单地访问它们
我正在尝试 运行 使用 Glue 元数据的配置单元作业。来自 aws 文档
Under AWS Glue Data Catalog settings select Use for Hive table metadata.
我创建了一个集群,它显然从 glue 连接到 default
数据库(我可以通过 hive 的 运行ning show tables;
来判断,它列出了一个 table 来自default
数据库。
现在有人知道如何提供从胶水连接到另一个数据库的选项吗?我在文档中唯一能找到的是提供 hive.metastore.glue.catalogid
的机会,您可以在其中提供来自另一个帐户的目录,但我在文档中找不到任何关于使用正确数据库的信息。
或者可能所有数据库都已加载。如果是这样,您知道如何在配置单元中访问它们吗?
好的,原来所有的数据库都加载到hive中了。您可以使用 select * from my_database_name.my_table_name
或使用 use my_database_name