for循环中,为什​​么i++在第二次使用后变为1?

In for loop, why does i++ change to 1 after second use?

为什么我的for循环中的var i从0变为1?

这一行:for for (var i = 0; i < siteDatabase.length; i++) 在第一个循环中从 0 递增到 1?然后导致 siteDatabase[i] 访问索引 1 而不是 0 处的元素。我认为 i++ 在第二个循环中递增?

结果是对未定义元素的方法调用(推送)出错。

var newsUpdates = {};
var siteDatabase = [
    "http://example.to"
];

var scraperjs = require('scraperjs');
for (var i = 0; i < siteDatabase.length; i++) {
    news[siteDatabase[i]] = [];

    scraperjs.StaticScraper.create(siteDatabase[i])
        .scrape(function($) {
            return $(".lang_English").map(function() {
                return $(this).children('td').eq(1).children(
                    'a').last().text();
            }).get();
        }, function(news) {
            for (var x = 0; x < news.length; x++) {
                if (news[x] == '') {
                    news.splice(x, 1);
                }
            }
            for (var x = 0; x < news.length; x++) {
                // i in siteDatabase[i] is not 0, but 1??
                newsUpdates[siteDatabase[i]].push({
                    "title": news[x]
                });
                // TypeError: Cannot call method 'push' of undefined
            }
            console.log(newsUpdates);
        })
}

问题出在我在代码之间评论的区域。

您传递给 .scrape 的函数有一个 持久引用 i 变量,而不是它作为函数时的副本被创建。所以它使用函数 运行 时的 i 的值,这(大概)是在循环完成之后,当 i 的值有改变了。

在这种情况下,我可能会使用构建器函数来构建回调,以便回调关闭不会改变的内容:

var newsUpdates = {};
var siteDatabase = [
    "http://example.to"
];

var scraperjs = require('scraperjs');
for (var i = 0; i < siteDatabase.length; i++) {
    news[siteDatabase[i]] = [];

    scraperjs.StaticScraper.create(siteDatabase[i])
        .scrape(function($) {
            return $(".lang_English").map(function() {
                return $(this).children('td').eq(1).children(
                    'a').last().text();
            }).get();
        }, buildCallback(i))
}

function buildCallback(index) {
    return function(news) {
        for (var x = 0; x < news.length; x++) {
            if (news[x] == '') {
                news.splice(x, 1);
            }
        }
        for (var x = 0; x < news.length; x++) {
            newsUpdates[siteDatabase[inindex]].push({
                "title": news[x]
            });
        }
        console.log(newsUpdates);
    };
}

在那里,我们从 buildCallback 中 return 的函数关闭了 index 参数,其值永远不会改变。然后我们将 i 传递给它,以便构建我们的回调。

因为 siteDatabase 看起来是一个数组,解决这个问题的另一种方法是使用 siteDatabase.forEach,它会为每次迭代提供一个单独的闭包变量。与构建器函数方法相比,我更喜欢这种方法,因为它更直接且易于遵循:

var newsUpdates = {};
var siteDatabase = [
    "http://example.to"
];

var scraperjs = require('scraperjs');

siteDatabase.forEach(function (site) {
    scraperjs.StaticScraper.create(site)
    .scrape(function($) {
        return $(".lang_English").map(function() {
            return $(this).children('td').eq(1)
                          .children('a').last().text();
        }).get();
    }, function(news) {
        newsUpdates[site] = news.filter(function (item) {
            return item != '';
        }).map(function (item) {
            return { title: item };
        });
        console.log(newsUpdates);
    });
});

您可以进一步将其分解为函数,使其更清晰、更具表现力:

var newsUpdates = {};
var siteDatabase = [
    "http://example.to"
];

var scraperjs = require('scraperjs');

function scrapePageNewsItems($) {
    return $(".lang_English").map(function() {
        return $(this).children('td').eq(1)
                      .children('a').last().text();
    }).get();
}

function notBlank(item) {
    return item != '';
}

function convertNewsItem(item) {
    return { title: item };
}

function convertNewsItems(news) {
    return news.filter(notBlank).map(convertNewsItem);
}

siteDatabase.forEach(function (site) {
    scraperjs.StaticScraper.create(site)
    .scrape(scrapePageNewsItems, function(news) {
        newsUpdates[site] = convertNewsItems(news);
        console.log(newsUpdates);
    });
});