CloudKit 使用 CKReference 与 CKRecord 的性能

Question

假设我有 CKRecord 个 recordType Post。 Post 保留一些值，例如标题和描述。当应用程序中显示 Post 时，它会附有编写它的用户的姓名和头像（我们称他们为作者）。我的问题是 – 将 CKReference 存储到作者个人资料中会更好（个人资料是另一种保存作者详细信息的记录），还是直接将作者的详细信息添加到 Post 他们什么时候写的？

从数据库架构的角度来看，第一个选项非常合理，但从性能的角度来看，它似乎很糟糕。这个系统上有成千上万的用户，提取的数量和加载它们的时间似乎都不合理。

第一部分涉及加载所有 Posts。

func loadPosts() {
    // ...Setup the query
    publicData.performQuery(query, inZoneWithID: nil) { (results: [CKRecord]?, error: NSError?) in
        if let posts = results {
            self.loadProfiles(posts)
        }
    }
}

一个查询完成，现在我们调用 loadProfiles

func loadProfiles(posts: [CKRecord]) {
    // Get the reference IDs out of the Posts
    var referenceIDs = [CKRecordID]()
    for post in posts {
        // Get the reference from the post
        // Append the recordID to the referenceIDs array
    }

    // Perform the Profiles fetch
    let fetchOperation = CKFetchRecordsOperation(recordIDs: referenceIDs)
    fetchOperation.fetchRecordsCompletionBlock = { records, error in
        // ...Handle the fetched Profiles

        // Everything has been fetched, update the UI now
        dispatch_async(dispatch_get_main_queue(), {
            self.tableView.reloadData()
        })
    }
    CKContainer.defaultContainer().publicCloudDatabase.addOperation(fetchOperation)
}

在那个函数中，我们花了一些时间来获取 referenceID。然后我们花时间进行配置文件获取。请注意，所有这些都是在原始 Post 获取之后发生的！

...哎呀。即使使用某种缓存系统，原始提取也会很疯狂（尤其是有很多用户）。

那么，写的时候直接在Post中加上Writer的详细信息会不会更好？这样做的优点：更少的获取，更快的加载。缺点：如果作者更改了他们的个人资料详细信息，该应用程序将不得不遍历他们所有的 Post 并手动更新详细信息。

这整个困境让人感觉像是选择毒药的场景。有更好的方法吗？

Answer 1

您描述的权衡术语是 denormalization。这是你描述的困境。权衡取舍取决于底层技术以及应用程序领域和预期行为。

您已经描述了两个模型对象，一个 Post 和一个配置文件，其中 Writer 引用了 Post 上的配置文件。您没有确切描述它们是如何使用的，但我将假设为 post 的滚动列表，在 table 视图中，每个单元格上都有作者姓名和个人资料图片名单。很明显为什么您担心为每个人提取参考。

CloudKit 的首要任务是尽量减少到服务器的往返次数。但是，一次获取 posts 和第二次获取链接的个人资料名称并不是特别繁重。 非常重要： 在这里尽可能使用 desiredKeys 属性获取和查询。 CloudKit 默认获取整条记录，您可能会通过网络传递无关信息——这是获取用户姓名和获取用户完整配置文件之间的区别。

尽可能使用 desiredKeys 的要点在文档中没有充分说明其对优化的重要性和实施的简单性。

但是，如果您担心拉动 post 时的响应，例如，如果用户在您拉动更多时等待，您可能需要非规范化。

我还假设配置文件不会经常更改——这是一个关键点——但它可以更改并且应用程序需要考虑到这一点。这实际上非常简单：循环遍历 post 来更新它们并不理想，但这没什么大不了的，因为这是一次性的事情，您不希望经常发生。你应该可以用一对 CKQueryOperation/CKModifyRecordsOperation 来完成。

同样，请务必使用 desiredKeys——尤其是如果您只是获取以更新每个 post 上的非规范化字段并且不打算显示其中任何一个，则您不需要' 想要通过网络传递每个 post 的全部内容。

请注意，如果您使用个人资料图片进行非规范化，您可能需要确保您使用的是相同的 CKAsset，这样您就可以使用内置缓存，并且不会不小心上下发送相同的图像并存储一堆次。查看有关 CKAsset 和本地缓存如何工作的警告；显然，如果您希望它保证存储在本地，您必须自己缓存它。

值得注意的是，所有这些 CloudKit 数据类型 特别是 不应该用作您应用中的模型对象，以及这如何将与该层交互将影响您所做的任何选择。

CloudKit 实际上很棒，但在我看来，它的非系统文档阻碍了它的发展。我很幸运今年 ('16) 参加了 WWDC，并且能够与一些 CloudKit 工程师交谈，这就是其中一些信息的来源。希望这可以帮助。

CloudKit 使用 CKReference 与 CKRecord 的性能

CloudKit performance using a CKReference vs. CKRecord

schema

ios

swift

cloudkit