在 Rcpp 中的字符串类型之间转换时出错
Error converting between string types in Rcpp
我是 RCPP 的新手,并尝试编写一些代码,这些代码本质上是在 R 中重新创建 "outer" 函数的一个特例。我必须使用字符串向量,第一个包含模式,然后第二个包含句子。我正在检查所有句子的所有模式,并尝试 return 一个矩阵,该矩阵是每个句子中每个模式出现的次数。
我取得了一些进展(尽管我相信你们中的一些人会被我的代码吓坏):
#include <Rcpp.h>
#include <string.h>
#include <string>
#include <algorithm>
using namespace Rcpp;
// [[Rcpp::plugins("cpp11")]]
int addOccurrences(std::vector< std::string > &txt, std::vector< std::string > &pat)
{
int M = pat.size();
int N = txt.size();
int res = 0;
/* A loop to slide pat[] one by one */
for (int i = 0; i <= N - M; i++)
{
/* For current index i, check for
pattern match */
int j;
for (j = 0; j < M; j++)
if (txt[i+j] != pat[j])
break;
// if pat[0...M-1] = txt[i, i+1, ...i+M-1]
if (j == M)
{
res++;
j = 0;
}
}
return res;
}
//[[Rcpp::export]]
NumericMatrix freqMatrix (Rcpp::StringVector x,Rcpp::StringVector y)
{
Rcpp::NumericMatrix matrx(x.size(),y.size());
int i = 1;
int j = 1;
std::vector<std::string> xstrings(x.size());
int k;
for (k = 0; k < x.size(); k++){
xstrings[k] = x(k);
}
std::vector<std::string> ystrings(y.size());
int l;
for (l = 0; l < y.size(); l++){
ystrings[l] = y(l);
}
for(i = 1; i<=x.size(); i++)
{
std::vector< std::string > txt = xstrings[i];
for(j = 1; j<=y.size(); j++)
{
std::vector< std::string > pat = ystrings[j];
matrx(i,j) = addOccurrences(txt, pat);
j = j + 1;
}
i = i + 1;
}
return matrx;
}
我已经摆脱了大部分错误,但我被卡在了底部附近。我收到的错误是:
"conversion from '__gnu_cxx::__alloc_traits<std::allocator<std::basic_string<char> > >::value_type {aka std::basic_string<char>}' to non-scalar type 'std::vector<std::basic_string<char> >' requested
std::vector< std::string > txt = xstrings[i];"
第二次转换`ystrings[j]'时出现同样的错误
我尝试了几种不同的方法来使它与 'std::vector' 和 'Rcpp::StringVector' 一起工作,但我很困惑。
您将变量 xstrings
声明为字符串向量。
std::vector<std::string> xstrings(x.size());
然后在这个循环中,由于未知原因从 1 而不是 0 开始(当 i
等于 x.size()
时似乎可以调用未定义的行为)
for(i = 1; i<=x.size(); i++)
{
std::vector< std::string > txt = xstrings[i];
//
您声明了另一个字符串向量 txt
并试图用类型 std;:string
的对象 xstrings[i];
初始化它。
标准容器 std;:vector 中没有这样的非显式构造函数。所以编译器报错。
你可以这样写
std::vector< std::string > txt( 1, xstrings[i] );
编译器报错是因为您声明了一个可以保存字符串的向量(即 txt)并试图将其初始化为字符串(即 xstrings[i])。它可能还会抱怨这条线:
std::vector< std::string > pat = ystrings[j];
鉴于 addOccurrences(...) 检查单个句子的单个模式,它不应该将类型 std::string 的变量作为输入参数吗?这意味着它应该声明如下:
int addOccurrences(const std::string & txt, const std::string & pat)
{
// do stuff...
}
freqMatrix 中的最终循环可以写成:
for(i = 1; i<=x.size(); i++)
{
for(j = 1; j<=y.size(); j++)
{
matrx(i,j) = addOccurrences(xstrings[i], ystrings[j]);
}
}
我是 RCPP 的新手,并尝试编写一些代码,这些代码本质上是在 R 中重新创建 "outer" 函数的一个特例。我必须使用字符串向量,第一个包含模式,然后第二个包含句子。我正在检查所有句子的所有模式,并尝试 return 一个矩阵,该矩阵是每个句子中每个模式出现的次数。
我取得了一些进展(尽管我相信你们中的一些人会被我的代码吓坏):
#include <Rcpp.h>
#include <string.h>
#include <string>
#include <algorithm>
using namespace Rcpp;
// [[Rcpp::plugins("cpp11")]]
int addOccurrences(std::vector< std::string > &txt, std::vector< std::string > &pat)
{
int M = pat.size();
int N = txt.size();
int res = 0;
/* A loop to slide pat[] one by one */
for (int i = 0; i <= N - M; i++)
{
/* For current index i, check for
pattern match */
int j;
for (j = 0; j < M; j++)
if (txt[i+j] != pat[j])
break;
// if pat[0...M-1] = txt[i, i+1, ...i+M-1]
if (j == M)
{
res++;
j = 0;
}
}
return res;
}
//[[Rcpp::export]]
NumericMatrix freqMatrix (Rcpp::StringVector x,Rcpp::StringVector y)
{
Rcpp::NumericMatrix matrx(x.size(),y.size());
int i = 1;
int j = 1;
std::vector<std::string> xstrings(x.size());
int k;
for (k = 0; k < x.size(); k++){
xstrings[k] = x(k);
}
std::vector<std::string> ystrings(y.size());
int l;
for (l = 0; l < y.size(); l++){
ystrings[l] = y(l);
}
for(i = 1; i<=x.size(); i++)
{
std::vector< std::string > txt = xstrings[i];
for(j = 1; j<=y.size(); j++)
{
std::vector< std::string > pat = ystrings[j];
matrx(i,j) = addOccurrences(txt, pat);
j = j + 1;
}
i = i + 1;
}
return matrx;
}
我已经摆脱了大部分错误,但我被卡在了底部附近。我收到的错误是:
"conversion from '__gnu_cxx::__alloc_traits<std::allocator<std::basic_string<char> > >::value_type {aka std::basic_string<char>}' to non-scalar type 'std::vector<std::basic_string<char> >' requested
std::vector< std::string > txt = xstrings[i];"
第二次转换`ystrings[j]'时出现同样的错误
我尝试了几种不同的方法来使它与 'std::vector' 和 'Rcpp::StringVector' 一起工作,但我很困惑。
您将变量 xstrings
声明为字符串向量。
std::vector<std::string> xstrings(x.size());
然后在这个循环中,由于未知原因从 1 而不是 0 开始(当 i
等于 x.size()
时似乎可以调用未定义的行为)
for(i = 1; i<=x.size(); i++)
{
std::vector< std::string > txt = xstrings[i];
//
您声明了另一个字符串向量 txt
并试图用类型 std;:string
的对象 xstrings[i];
初始化它。
标准容器 std;:vector 中没有这样的非显式构造函数。所以编译器报错。
你可以这样写
std::vector< std::string > txt( 1, xstrings[i] );
编译器报错是因为您声明了一个可以保存字符串的向量(即 txt)并试图将其初始化为字符串(即 xstrings[i])。它可能还会抱怨这条线:
std::vector< std::string > pat = ystrings[j];
鉴于 addOccurrences(...) 检查单个句子的单个模式,它不应该将类型 std::string 的变量作为输入参数吗?这意味着它应该声明如下:
int addOccurrences(const std::string & txt, const std::string & pat)
{
// do stuff...
}
freqMatrix 中的最终循环可以写成:
for(i = 1; i<=x.size(); i++)
{
for(j = 1; j<=y.size(); j++)
{
matrx(i,j) = addOccurrences(xstrings[i], ystrings[j]);
}
}