使用本地依赖项部署 GCP Cloud 函数
Deploy GCP Cloud function with local dependencies
我一直在尝试部署具有一些私有依赖项 (pyodbc
) 的 Cloud Function,因为我无法通过 requirements.txt
使其正常工作。请注意,我不想在这里使用 Docker。所以我在这里建立的只是下面的文件,
1. main.py
2. process.py ( this one use pyodbc to connect to teradata)
3. libs (folder)
3.1 pyodbc-4.0.30.dist-info (package)
3.2 pyodbc (python extension module)
3.3 __init.py__ ( this is to make this folder as module)
4.requirements.txt
我还更新了 process.py 文件以导入 pyodbc 模块,如下所示,
import libs.pyodbc
请注意:我使用 GCP 文档安装 pyodbc
包并使用 https://cloud.google.com/functions/docs/writing/specifying-dependencies-python 放入库
除此之外,我还requirements.txt
默认导入。
但我仍然收到如下模块错误。
Error message: Code in file main.py can't be loaded.
Did you list all required modules in requirements.txt?
Detailed stack trace: Traceback (most recent call last):
File "/env/local/lib/python3.7/site-packages/google/cloud/functions/worker.py", line 305, in check_or_load_user_function
_function_handler.load_user_function()
File "/env/local/lib/python3.7/site-packages/google/cloud/functions/worker.py", line 184, in load_user_function
spec.loader.exec_module(main)
File "<frozen importlib._bootstrap_external>", line 728, in exec_module
File "<frozen importlib._bootstrap>", line 219, in _call_with_frames_removed
File "/user_code/main.py", line 9, in <module>
from process import process
File "/user_code/process.py", line 6, in <module>
import libs.pyodbc
ModuleNotFoundError: No module named 'libs.pyodbc'
非常感谢来自这里的任何线索或帮助。我在这里想要实现的是,从 GCP 存储桶中读取 CSV 文件并通过加载到 teradata 中的数据帧对其进行处理,并将输出文件生成回另一个 GCP 存储桶中。我正在尝试仅使用 Cloud Functions 来实现所有目标。谢谢
pyodbc
项目在这里可能有点特殊,因为:
- 该项目需要一些特定于平台的代码;
- 他们尚未发布最新版本的源代码分发版(仅构建分发版)。
以下是我为使其正常工作所做的工作。从一个空的 libs
目录开始,首先下载最新的可用源代码分发:
$ pip download pyodbc --no-binary :all:
为模块创建一个目录:
$ mkdir libs/pyodbc
将源分发解压到模块中:
$ tar xf pyodbc-4.0.28.tar.gz -C libs/pyodbc
然后,在函数中你可以这样做:
import libs.pyodbc
我一直在尝试部署具有一些私有依赖项 (pyodbc
) 的 Cloud Function,因为我无法通过 requirements.txt
使其正常工作。请注意,我不想在这里使用 Docker。所以我在这里建立的只是下面的文件,
1. main.py
2. process.py ( this one use pyodbc to connect to teradata)
3. libs (folder)
3.1 pyodbc-4.0.30.dist-info (package)
3.2 pyodbc (python extension module)
3.3 __init.py__ ( this is to make this folder as module)
4.requirements.txt
import libs.pyodbc
请注意:我使用 GCP 文档安装 pyodbc
包并使用 https://cloud.google.com/functions/docs/writing/specifying-dependencies-python 放入库
除此之外,我还requirements.txt
默认导入。
但我仍然收到如下模块错误。
Error message: Code in file main.py can't be loaded.
Did you list all required modules in requirements.txt?
Detailed stack trace: Traceback (most recent call last):
File "/env/local/lib/python3.7/site-packages/google/cloud/functions/worker.py", line 305, in check_or_load_user_function
_function_handler.load_user_function()
File "/env/local/lib/python3.7/site-packages/google/cloud/functions/worker.py", line 184, in load_user_function
spec.loader.exec_module(main)
File "<frozen importlib._bootstrap_external>", line 728, in exec_module
File "<frozen importlib._bootstrap>", line 219, in _call_with_frames_removed
File "/user_code/main.py", line 9, in <module>
from process import process
File "/user_code/process.py", line 6, in <module>
import libs.pyodbc
ModuleNotFoundError: No module named 'libs.pyodbc'
非常感谢来自这里的任何线索或帮助。我在这里想要实现的是,从 GCP 存储桶中读取 CSV 文件并通过加载到 teradata 中的数据帧对其进行处理,并将输出文件生成回另一个 GCP 存储桶中。我正在尝试仅使用 Cloud Functions 来实现所有目标。谢谢
pyodbc
项目在这里可能有点特殊,因为:
- 该项目需要一些特定于平台的代码;
- 他们尚未发布最新版本的源代码分发版(仅构建分发版)。
以下是我为使其正常工作所做的工作。从一个空的 libs
目录开始,首先下载最新的可用源代码分发:
$ pip download pyodbc --no-binary :all:
为模块创建一个目录:
$ mkdir libs/pyodbc
将源分发解压到模块中:
$ tar xf pyodbc-4.0.28.tar.gz -C libs/pyodbc
然后,在函数中你可以这样做:
import libs.pyodbc