在 Rcpp 中的字符串类型之间转换时出错

Error converting between string types in Rcpp

我是 RCPP 的新手,并尝试编写一些代码,这些代码本质上是在 R 中重新创建 "outer" 函数的一个特例。我必须使用字符串向量,第一个包含模式,然后第二个包含句子。我正在检查所有句子的所有模式,并尝试 return 一个矩阵,该矩阵是每个句子中每个模式出现的次数。

我取得了一些进展(尽管我相信你们中的一些人会被我的代码吓坏):



#include <Rcpp.h>
#include <string.h>
#include <string>
#include <algorithm>
using namespace Rcpp;
// [[Rcpp::plugins("cpp11")]]

int addOccurrences(std::vector< std::string > &txt, std::vector< std::string > &pat) 
{ 
  int M = pat.size(); 
    int N = txt.size(); 
    int res = 0; 

    /* A loop to slide pat[] one by one */
    for (int i = 0; i <= N - M; i++) 
    {  
        /* For current index i, check for  
           pattern match */
        int j; 
        for (j = 0; j < M; j++) 
            if (txt[i+j] != pat[j]) 
                break; 

        // if pat[0...M-1] = txt[i, i+1, ...i+M-1] 
        if (j == M)   
        { 
           res++; 
           j = 0; 
        } 
    } 
    return res; 


} 


//[[Rcpp::export]]
NumericMatrix freqMatrix (Rcpp::StringVector x,Rcpp::StringVector y)
{

    Rcpp::NumericMatrix matrx(x.size(),y.size());
    int i = 1;
    int j = 1;



    std::vector<std::string> xstrings(x.size());
    int k;
    for (k = 0; k < x.size(); k++){
        xstrings[k] = x(k);
    }

    std::vector<std::string> ystrings(y.size());
    int l;
    for (l = 0; l < y.size(); l++){
        ystrings[l] = y(l);
    }




    for(i = 1; i<=x.size(); i++)
        {
        std::vector< std::string > txt = xstrings[i];

        for(j = 1; j<=y.size(); j++)
            {
            std::vector< std::string > pat = ystrings[j];
            matrx(i,j) = addOccurrences(txt, pat);
            j = j + 1;
            }
         i = i + 1;
        }
return matrx;
}


我已经摆脱了大部分错误,但我被卡在了底部附近。我收到的错误是:

"conversion from '__gnu_cxx::__alloc_traits<std::allocator<std::basic_string<char> > >::value_type {aka std::basic_string<char>}' to non-scalar type 'std::vector<std::basic_string<char> >' requested
   std::vector< std::string > txt = xstrings[i];"

第二次转换`ystrings[j]'时出现同样的错误

我尝试了几种不同的方法来使它与 'std::vector' 和 'Rcpp::StringVector' 一起工作,但我很困惑。

您将变量 xstrings 声明为字符串向量。

std::vector<std::string> xstrings(x.size());

然后在这个循环中,由于未知原因从 1 而不是 0 开始(当 i 等于 x.size() 时似乎可以调用未定义的行为)

for(i = 1; i<=x.size(); i++)

    {
    std::vector< std::string > txt = xstrings[i];
    //

您声明了另一个字符串向量 txt 并试图用类型 std;:string 的对象 xstrings[i]; 初始化它。

标准容器 std;:vector 中没有这样的非显式构造函数。所以编译器报错。

你可以这样写

    std::vector< std::string > txt( 1,  xstrings[i] );

编译器报错是因为您声明了一个可以保存字符串的向量(即 txt)并试图将其初始化为字符串(即 xstrings[i])。它可能还会抱怨这条线:

std::vector< std::string > pat = ystrings[j];

鉴于 addOccurrences(...) 检查单个句子的单个模式,它不应该将类型 std::string 的变量作为输入参数吗?这意味着它应该声明如下:

int addOccurrences(const std::string & txt, const std::string & pat) 
{
     // do stuff...
}

freqMatrix 中的最终循环可以写成:

for(i = 1; i<=x.size(); i++)
{
    for(j = 1; j<=y.size(); j++)
    {
        matrx(i,j) = addOccurrences(xstrings[i], ystrings[j]);
    }
}