在 Java 中执行 PigServer 时出错
Error executing PigServer in Java
我正在尝试从我的 java 机器远程 运行 pig 脚本,为此我写了下面的代码
代码:
import java.io.IOException;
import java.util.Properties;
import org.apache.pig.ExecType;
import org.apache.pig.PigServer;
import org.apache.pig.backend.executionengine.ExecException;
public class Javapig{
public static void main(String[] args) {
try {
Properties props = new Properties();
props.setProperty("fs.default.name", "hdfs://hdfs://192.168.x.xxx:8022");
props.setProperty("mapred.job.tracker", "192.168.x.xxx:8021");
PigServer pigServer = new PigServer(ExecType.MAPREDUCE, props);
runIdQuery(pigServer, "fact");
}
catch(Exception e) {
System.out.println(e);
}
}
public static void runIdQuery(PigServer pigServer, String inputFile) throws IOException {
pigServer.registerQuery("A = load '" + inputFile + "' using org.apache.hive.hcatalog.pig.HCatLoader();");
pigServer.registerQuery("B = FILTER A by category == 'Aller';");
pigServer.registerQuery("DUMP B;");
System.out.println("Done");
}
}
但是在执行时出现以下错误。
错误
ERROR 4010: Cannot find hadoop configurations in classpath (neither hadoop-site.xml nor core-site.xml was found in the classpath).
我不知道我做错了什么。
嗯,自我描述错误...
neither hadoop-site.xml nor core-site.xml was found in the classpath
您的应用程序的类路径中需要这两个文件。
理想情况下,您可以从 $HADOOP_CONF_DIR
文件夹中获取它们,然后将它们复制到 Java 的 src/main/resources
中,假设您有一个 Maven 结构
此外,对于这些文件,您应该为 Hadoop
使用 Configuration
对象
PigServer(ExecType execType, org.apache.hadoop.conf.Configuration conf)
我正在尝试从我的 java 机器远程 运行 pig 脚本,为此我写了下面的代码
代码:
import java.io.IOException;
import java.util.Properties;
import org.apache.pig.ExecType;
import org.apache.pig.PigServer;
import org.apache.pig.backend.executionengine.ExecException;
public class Javapig{
public static void main(String[] args) {
try {
Properties props = new Properties();
props.setProperty("fs.default.name", "hdfs://hdfs://192.168.x.xxx:8022");
props.setProperty("mapred.job.tracker", "192.168.x.xxx:8021");
PigServer pigServer = new PigServer(ExecType.MAPREDUCE, props);
runIdQuery(pigServer, "fact");
}
catch(Exception e) {
System.out.println(e);
}
}
public static void runIdQuery(PigServer pigServer, String inputFile) throws IOException {
pigServer.registerQuery("A = load '" + inputFile + "' using org.apache.hive.hcatalog.pig.HCatLoader();");
pigServer.registerQuery("B = FILTER A by category == 'Aller';");
pigServer.registerQuery("DUMP B;");
System.out.println("Done");
}
}
但是在执行时出现以下错误。
错误
ERROR 4010: Cannot find hadoop configurations in classpath (neither hadoop-site.xml nor core-site.xml was found in the classpath).
我不知道我做错了什么。
嗯,自我描述错误...
neither hadoop-site.xml nor core-site.xml was found in the classpath
您的应用程序的类路径中需要这两个文件。
理想情况下,您可以从 $HADOOP_CONF_DIR
文件夹中获取它们,然后将它们复制到 Java 的 src/main/resources
中,假设您有一个 Maven 结构
此外,对于这些文件,您应该为 Hadoop
使用Configuration
对象
PigServer(ExecType execType, org.apache.hadoop.conf.Configuration conf)