boost::rtree 受gcc编译器影响较大

boost::rtree is affected by gcc compiler greatly

由于整个公司都在用gcc 3.4.5,所以只好用boost 1.57的rtree,因为boost 1.59的rtree编译有问题。 我只是按以下方式使用 rtree:

namespace bg = boost::geometry;
namespace bgi = boost::geometry::index;

typedef bg::model::point<double, 2, bg::cs::cartesian> point;
typedef bg::model::box<point> box;
typedef std::pair<box, size_t> value;

// create the rtree using default constructor
bgi::rtree<value, bgi::linear<500> > rtree;

// create some values
ifstream ifs(bbox_filename);
if (!ifs.is_open()) return;

std::vector<box> boxes;

boost::timer t;

// ... (read box from test file)

std::cout << "read bbox file: " << t.elapsed() << " sec." << std::endl;

t.restart();
for (size_t i = 0; i < boxes.size(); ++i)
{
    // insert new value
    rtree.insert(std::make_pair(boxes[i], i));
}
std::cout << "build rtree with " << boxes.size() << " boxes in total: " << t.elapsed() << " sec." << std::endl;

在我的用例中,元素个数是千万级,查询速度很快,可以接受,但是构建rtree的速度很慢(当然要启用O2)。

当我用gcc 4.4.7编译同一个测试程序,对比测试结果,发现是gcc版本问题

测试环境:

CentOS 6.6
Intel(R) Xeon(R) CPU E5-2670 0 @ 2.60GHz

gcc 4.4.7 的测试日志:

read bbox file: 22.13 sec.
build rtree with 42517937 boxes in total: 163.28 sec.

gcc 3.4.5 的测试日志:

read bbox file: 22.28 sec.
build rtree with 42517937 boxes in total: 468.73 sec.

gcc 3.4.5 编译的测试程序生成 rtree 的时间似乎是 4.4.7 的 3 倍。

有没有人以前遇到过这个问题?有什么建议可以提高 gcc 3.4.5 下的性能吗? (目前无法选择编译器:()

感谢大家的帮助和post.

使用packing算法(range constructor)后,构建rtree的性能大大提升

std::vector<value> boxes;

boost::timer t;

// ... (read box from test file)

std::cout << "read bbox file: " << t.elapsed() << " sec." << std::endl;

t.restart();
bgi::rtree<value, bgi::linear<500> > rtree(boxes);
std::cout << "build rtree with " << boxes.size() << " boxes in total: " << t.elapsed() << " sec." << std::endl;

gcc 4.4.7 + 打包算法的测试日志:

read bbox file: 23.07 sec.
build rtree with 42517937 boxes in total: 8.15 sec.

gcc 3.4.5 + 打包算法的测试日志:

read bbox file: 23.06 sec.
build rtree with 42517937 boxes in total: 10.94 sec.

现在可以接受 gcc 3.4.5 和 4.4.7 之间的运行时差异。

PS: 在我的测试中,在没有 O2 和打包算法的情况下构建 rtree 的运行时间可能会慢 1000 倍。希望这个 post 可以给以后使用 boost::rtree 的人一些提示。