将 DataBricks 连接到 Azure Blob 存储
Connecting DataBricks to Azure Blob Storage
我正在尝试将 Azure Blob 存储容器装载到 DataBricks 实例,虽然装载确实有效,但它似乎没有在使用存储容器。
这是我用来创建坐骑的代码...
storageAccountName = 'x'
blobContainerName = 'files'
storageAccountAccessKey = 'x'
dbutils.fs.mount(
source = f'wasbs://{blobContainerName}@{storageAccountName}.blob.core.windows.net',
mount_point = '/mnt/files/',
extra_configs = {'fs.azure.account.key.' + storageAccountName + '.blob.core.windows.net': storageAccountAccessKey}
)
挂载似乎成功了。
然后我将文件下载到安装位置...
%sh
wget https://www.stats.govt.nz/assets/Uploads/Annual-enterprise-survey/Annual-enterprise-survey-2019-financial-year-provisional/Download-data/annual-enterprise-survey-2019-financial-year-provisional-csv.csv -P /mnt/files/
然后我列出挂载位置中的文件
%sh
ls /mnt/samplefiles/
这确实显示了下载的文件 (annual-enterprise-survey-2019-financial-year-provisional-csv.csv),但不显示存储帐户中已有的文件,下载的文件也不显示文件每次出现在存储帐户中。
我在这里错过了什么?
我需要将 /dbfs/ 添加到挂载位置。
例如...
ls /dbfs/mnt/samplefiles
我正在尝试将 Azure Blob 存储容器装载到 DataBricks 实例,虽然装载确实有效,但它似乎没有在使用存储容器。
这是我用来创建坐骑的代码...
storageAccountName = 'x'
blobContainerName = 'files'
storageAccountAccessKey = 'x'
dbutils.fs.mount(
source = f'wasbs://{blobContainerName}@{storageAccountName}.blob.core.windows.net',
mount_point = '/mnt/files/',
extra_configs = {'fs.azure.account.key.' + storageAccountName + '.blob.core.windows.net': storageAccountAccessKey}
)
挂载似乎成功了。
然后我将文件下载到安装位置...
%sh
wget https://www.stats.govt.nz/assets/Uploads/Annual-enterprise-survey/Annual-enterprise-survey-2019-financial-year-provisional/Download-data/annual-enterprise-survey-2019-financial-year-provisional-csv.csv -P /mnt/files/
然后我列出挂载位置中的文件
%sh
ls /mnt/samplefiles/
这确实显示了下载的文件 (annual-enterprise-survey-2019-financial-year-provisional-csv.csv),但不显示存储帐户中已有的文件,下载的文件也不显示文件每次出现在存储帐户中。
我在这里错过了什么?
我需要将 /dbfs/ 添加到挂载位置。
例如...
ls /dbfs/mnt/samplefiles