Azure SQL 数据仓库

Azure SQL Data Warehouse

如果我知道将数据加载到 Azure SQL 数据仓库的各种方法,那就太好了。

我可以使用 JDBC 从我的 Ubuntu 机器连接到 Azure SQL DW。

  1. 是否有任何直接方法可以在不使用 Azure 数据工厂的情况下从 Azure Blob 存储加载到 Azure SQL DW?

  2. 将数据从 Ubuntu 加载到 Azure SQL DW 的方法。

  3. Java API 与 Azure 交谈。

  4. 直接从 HDInsights 加载数据到 SQL DW。

谢谢

这个提示有点疯狂,但它会起作用。使用本地 sql 服务器虚拟机并配置 Azure SQL 数据库事务复制。 -> https://channel9.msdn.com/Shows/Data-Exposed/Azure-SQL-DB-Transactional-Replication

走这条路会填满你的 azure sql 数据库。您必须连接 ubuntu(JDBC) 才能将所有内容插入 sql 服务器。这会将您的数据复制到 azure sql db。并且 azure sql db 可以通过两个步骤轻松迁移到 azure sql dw ;-)

https://azure.microsoft.com/en-us/documentation/articles/sql-data-warehouse-get-started-provision/

您的优势是,您可以低延迟连接到本地 sql 服务器,只需等待事务复制完成即可。 ;-)

问候 帕特里克

将数据加载到 Azure SQL DW 的最佳和最快方法是使用 Polybase 加载位于 Azure Blob 存储中的带分隔符的平面文件。请参阅描述的 Polybase here

对于从 HDInsight 加载我想你可以使用 SQOOP(虽然我没有尝试加载 Azure SQL DW)但最好的方法是让 HDInsight 写入一个平面文件(例如通过插入到 Hadoop 中的外部 table)然后使用 Azure SQL DW 中的 Polybase 来读取文件。

抱歉,我无法解决您关于 Java 和 Ubuntu 的其他问题。