从 SSIS 包执行 R 脚本
Execute R script from SSIS Package
我想从 SSIS 包执行 R 代码。如何添加执行 R 代码的数据控制步骤? SSIS 仅支持 vb.net 和 asp.net.
SSIS 有许多可用的数据转换,但 R 在数据操作方面非常友好。
我想 运行 来自 SSIS 脚本或其他一些 way.Basically 的 R 代码,我正在尝试将 R 集成到 ETL 过程中。
我想从 CSV 文件中提取数据 (E)。
在 R 中转换 (T) 并在 Microsoft 数据库中加载 (L)。
是否可以通过使用 SSIS 数据控制项执行 R 脚本在 SSIS 包中完成此工作流程?谢谢!
这里有几种方法可以将 R 集成到 ETL 过程中。
粗糙、快速和肮脏 - 在控制流中执行流程任务。这类似于从命令行调用 RScript。您可能会进行转换,将其保存到磁盘上的文件中,然后从执行流程任务中获取该文件名,以便将其输入数据流任务。好的一面是您保持 R 干净并与 C#/VB.
分开
通过 Rdotnet 集成 - 您可以使用 RDotNet library (I believe, haven't tried to integrate it). You would need to register the DLLs in the GAC, and then you can either work with .NET objects in your SSIS scripts or call R scripts directly。
集成在 SQL Server 2016 - Microsoft 已通过扩展存储过程添加了 R 支持。您通过存储过程调用 R 脚本并使用 sql 查询输入数据并可以存储输出。参见 more detail here。这意味着在 SSIS 中使用 Execute SQL 任务。
我希望它对你或其他人有帮助,因为你想要数据处理,你可以将你的数据集放入 CSV 文件中(通过数据流任务),使用以下命令执行文件:"Rscript "(它可能是作为带有执行进程任务的命令执行),在文件中,您必须将数据集上传到数据框中(使用 readLines() 函数调用它),然后执行您请求的所有 math/Calculation,写入数据或计算生成一个 CSV 文件并从 SSIS 再次读取它。
这不是一个优雅的解决方案,但它有效:),至少在微软将 R 集成为 control/data 流程之前。
CYA
PS。在这里,您可以了解如何从命令行执行文件:Run R script from command line
我想从 SSIS 包执行 R 代码。如何添加执行 R 代码的数据控制步骤? SSIS 仅支持 vb.net 和 asp.net.
SSIS 有许多可用的数据转换,但 R 在数据操作方面非常友好。
我想 运行 来自 SSIS 脚本或其他一些 way.Basically 的 R 代码,我正在尝试将 R 集成到 ETL 过程中。
我想从 CSV 文件中提取数据 (E)。
在 R 中转换 (T) 并在 Microsoft 数据库中加载 (L)。 是否可以通过使用 SSIS 数据控制项执行 R 脚本在 SSIS 包中完成此工作流程?谢谢!
这里有几种方法可以将 R 集成到 ETL 过程中。
粗糙、快速和肮脏 - 在控制流中执行流程任务。这类似于从命令行调用 RScript。您可能会进行转换,将其保存到磁盘上的文件中,然后从执行流程任务中获取该文件名,以便将其输入数据流任务。好的一面是您保持 R 干净并与 C#/VB.
分开
通过 Rdotnet 集成 - 您可以使用 RDotNet library (I believe, haven't tried to integrate it). You would need to register the DLLs in the GAC, and then you can either work with .NET objects in your SSIS scripts or call R scripts directly。
集成在 SQL Server 2016 - Microsoft 已通过扩展存储过程添加了 R 支持。您通过存储过程调用 R 脚本并使用 sql 查询输入数据并可以存储输出。参见 more detail here。这意味着在 SSIS 中使用 Execute SQL 任务。
我希望它对你或其他人有帮助,因为你想要数据处理,你可以将你的数据集放入 CSV 文件中(通过数据流任务),使用以下命令执行文件:"Rscript "(它可能是作为带有执行进程任务的命令执行),在文件中,您必须将数据集上传到数据框中(使用 readLines() 函数调用它),然后执行您请求的所有 math/Calculation,写入数据或计算生成一个 CSV 文件并从 SSIS 再次读取它。
这不是一个优雅的解决方案,但它有效:),至少在微软将 R 集成为 control/data 流程之前。
CYA
PS。在这里,您可以了解如何从命令行执行文件:Run R script from command line