CloudKit 使用 CKReference 与 CKRecord 的性能

CloudKit performance using a CKReference vs. CKRecord

假设我有 CKRecordrecordType Post。 Post 保留一些值,例如标题和描述。当应用程序中显示 Post 时,它会附有编写它的用户的姓名和头像(我们称他们为作者)。我的问题是 – 将 CKReference 存储到作者个人资料中会更好(个人资料是另一种保存作者详细信息的记录),还是直接将作者的详细信息添加到 Post 他们什么时候写的?

从数据库架构的角度来看,第一个选项非常合理,但从性能的角度来看,它似乎很糟糕。这个系统上有成千上万的用户,提取的数量和加载它们的时间似乎都不合理。

第一部分涉及加载所有 Posts。

func loadPosts() {
    // ...Setup the query
    publicData.performQuery(query, inZoneWithID: nil) { (results: [CKRecord]?, error: NSError?) in
        if let posts = results {
            self.loadProfiles(posts)
        }
    }
}

一个查询完成,现在我们调用 loadProfiles

func loadProfiles(posts: [CKRecord]) {
    // Get the reference IDs out of the Posts
    var referenceIDs = [CKRecordID]()
    for post in posts {
        // Get the reference from the post
        // Append the recordID to the referenceIDs array
    }

    // Perform the Profiles fetch
    let fetchOperation = CKFetchRecordsOperation(recordIDs: referenceIDs)
    fetchOperation.fetchRecordsCompletionBlock = { records, error in
        // ...Handle the fetched Profiles

        // Everything has been fetched, update the UI now
        dispatch_async(dispatch_get_main_queue(), {
            self.tableView.reloadData()
        })
    }
    CKContainer.defaultContainer().publicCloudDatabase.addOperation(fetchOperation)
}

在那个函数中,我们花了一些时间来获取 referenceID。然后我们花时间进行配置文件获取。请注意,所有这些都是在原始 Post 获取之后发生的!

...哎呀。即使使用某种缓存系统,原始提取也会很疯狂(尤其是有很多用户)。

那么,写的时候直接在Post中加上Writer的详细信息会不会更好?这样做的优点:更少的获取,更快的加载。缺点:如果作者更改了他们的个人资料详细信息,该应用程序将不得不遍历他们所有的 Post 并手动更新详细信息。

这整个困境让人感觉像是选择毒药的场景。有更好的方法吗?

您描述的权衡术语是 denormalization。这是你描述的困境。权衡取舍取决于底层技术以及应用程序领域和预期行为。

您已经描述了两个模型对象,一个 Post 和一个配置文件,其中 Writer 引用了 Post 上的配置文件。您没有确切描述它们是如何使用的,但我将假设为 post 的滚动列表,在 table 视图中,每个单元格上都有作者姓名和个人资料图片名单。很明显为什么您担心为每个人提取参考。

CloudKit 的首要任务是尽量减少到服务器的往返次数。但是,一次获取 posts 和第二次获取链接的个人资料名称并不是特别繁重。 非常重要: 在这里尽可能使用 desiredKeys 属性 获取和查询。 CloudKit 默认获取整条记录,您可能会通过网络传递无关信息——这是获取用户姓名和获取用户完整配置文件之间的区别。

尽可能使用 desiredKeys 的要点在文档中没有充分说明其对优化的重要性和实施的简单性。

但是,如果您担心拉动 post 时的响应,例如,如果用户在您拉动更多时等待,您可能需要非规范化。

我还假设配置文件不会经常更改——这是一个关键点——但它可以更改并且应用程序需要考虑到这一点。这实际上非常简单:循环遍历 post 来更新它们并不理想,但这没什么大不了的,因为这是一次性的事情,您不希望经常发生。你应该可以用一对 CKQueryOperation/CKModifyRecordsOperation 来完成。

同样,请务必使用 desiredKeys——尤其是如果您只是获取以更新每个 post 上的非规范化字段并且不打算显示其中任何一个,则您不需要' 想要通过网络传递每个 post 的全部内容。

请注意,如果您使用个人资料图片进行非规范化,您可能需要确保您使用的是相同的 CKAsset,这样您就可以使用内置缓存,并且不会不小心上下发送相同的图像并存储一堆次。查看有关 CKAsset 和本地缓存如何工作的警告;显然,如果您希望它保证存储在本地,您必须自己缓存它。

值得注意的是,所有这些 CloudKit 数据类型 特别是 不应该用作您应用中的模型对象,以及这如何将与该层交互将影响您所做的任何选择。

CloudKit 实际上很棒,但在我看来,它的非系统文档阻碍了它的发展。我很幸运今年 ('16) 参加了 WWDC,并且能够与一些 CloudKit 工程师交谈,这就是其中一些信息的来源。希望这可以帮助。