CloudKit 使用 CKReference 与 CKRecord 的性能
CloudKit performance using a CKReference vs. CKRecord
假设我有 CKRecord
个 recordType
Post。 Post 保留一些值,例如标题和描述。当应用程序中显示 Post 时,它会附有编写它的用户的姓名和头像(我们称他们为作者)。我的问题是 – 将 CKReference
存储到作者个人资料中会更好(个人资料是另一种保存作者详细信息的记录),还是直接将作者的详细信息添加到 Post 他们什么时候写的?
从数据库架构的角度来看,第一个选项非常合理,但从性能的角度来看,它似乎很糟糕。这个系统上有成千上万的用户,提取的数量和加载它们的时间似乎都不合理。
第一部分涉及加载所有 Posts。
func loadPosts() {
// ...Setup the query
publicData.performQuery(query, inZoneWithID: nil) { (results: [CKRecord]?, error: NSError?) in
if let posts = results {
self.loadProfiles(posts)
}
}
}
一个查询完成,现在我们调用 loadProfiles
func loadProfiles(posts: [CKRecord]) {
// Get the reference IDs out of the Posts
var referenceIDs = [CKRecordID]()
for post in posts {
// Get the reference from the post
// Append the recordID to the referenceIDs array
}
// Perform the Profiles fetch
let fetchOperation = CKFetchRecordsOperation(recordIDs: referenceIDs)
fetchOperation.fetchRecordsCompletionBlock = { records, error in
// ...Handle the fetched Profiles
// Everything has been fetched, update the UI now
dispatch_async(dispatch_get_main_queue(), {
self.tableView.reloadData()
})
}
CKContainer.defaultContainer().publicCloudDatabase.addOperation(fetchOperation)
}
在那个函数中,我们花了一些时间来获取 referenceID。然后我们花时间进行配置文件获取。请注意,所有这些都是在原始 Post 获取之后发生的!
...哎呀。即使使用某种缓存系统,原始提取也会很疯狂(尤其是有很多用户)。
那么,写的时候直接在Post中加上Writer的详细信息会不会更好?这样做的优点:更少的获取,更快的加载。缺点:如果作者更改了他们的个人资料详细信息,该应用程序将不得不遍历他们所有的 Post 并手动更新详细信息。
这整个困境让人感觉像是选择毒药的场景。有更好的方法吗?
您描述的权衡术语是 denormalization。这是你描述的困境。权衡取舍取决于底层技术以及应用程序领域和预期行为。
您已经描述了两个模型对象,一个 Post 和一个配置文件,其中 Writer 引用了 Post 上的配置文件。您没有确切描述它们是如何使用的,但我将假设为 post 的滚动列表,在 table 视图中,每个单元格上都有作者姓名和个人资料图片名单。很明显为什么您担心为每个人提取参考。
CloudKit 的首要任务是尽量减少到服务器的往返次数。但是,一次获取 posts 和第二次获取链接的个人资料名称并不是特别繁重。 非常重要: 在这里尽可能使用 desiredKeys
属性 获取和查询。 CloudKit 默认获取整条记录,您可能会通过网络传递无关信息——这是获取用户姓名和获取用户完整配置文件之间的区别。
尽可能使用 desiredKeys
的要点在文档中没有充分说明其对优化的重要性和实施的简单性。
但是,如果您担心拉动 post 时的响应,例如,如果用户在您拉动更多时等待,您可能需要非规范化。
我还假设配置文件不会经常更改——这是一个关键点——但它可以更改并且应用程序需要考虑到这一点。这实际上非常简单:循环遍历 post 来更新它们并不理想,但这没什么大不了的,因为这是一次性的事情,您不希望经常发生。你应该可以用一对 CKQueryOperation/CKModifyRecordsOperation 来完成。
同样,请务必使用 desiredKeys
——尤其是如果您只是获取以更新每个 post 上的非规范化字段并且不打算显示其中任何一个,则您不需要' 想要通过网络传递每个 post 的全部内容。
请注意,如果您使用个人资料图片进行非规范化,您可能需要确保您使用的是相同的 CKAsset,这样您就可以使用内置缓存,并且不会不小心上下发送相同的图像并存储一堆次。查看有关 CKAsset 和本地缓存如何工作的警告;显然,如果您希望它保证存储在本地,您必须自己缓存它。
值得注意的是,所有这些 CloudKit 数据类型 特别是 不应该用作您应用中的模型对象,以及这如何将与该层交互将影响您所做的任何选择。
CloudKit 实际上很棒,但在我看来,它的非系统文档阻碍了它的发展。我很幸运今年 ('16) 参加了 WWDC,并且能够与一些 CloudKit 工程师交谈,这就是其中一些信息的来源。希望这可以帮助。
假设我有 CKRecord
个 recordType
Post。 Post 保留一些值,例如标题和描述。当应用程序中显示 Post 时,它会附有编写它的用户的姓名和头像(我们称他们为作者)。我的问题是 – 将 CKReference
存储到作者个人资料中会更好(个人资料是另一种保存作者详细信息的记录),还是直接将作者的详细信息添加到 Post 他们什么时候写的?
从数据库架构的角度来看,第一个选项非常合理,但从性能的角度来看,它似乎很糟糕。这个系统上有成千上万的用户,提取的数量和加载它们的时间似乎都不合理。
第一部分涉及加载所有 Posts。
func loadPosts() {
// ...Setup the query
publicData.performQuery(query, inZoneWithID: nil) { (results: [CKRecord]?, error: NSError?) in
if let posts = results {
self.loadProfiles(posts)
}
}
}
一个查询完成,现在我们调用 loadProfiles
func loadProfiles(posts: [CKRecord]) {
// Get the reference IDs out of the Posts
var referenceIDs = [CKRecordID]()
for post in posts {
// Get the reference from the post
// Append the recordID to the referenceIDs array
}
// Perform the Profiles fetch
let fetchOperation = CKFetchRecordsOperation(recordIDs: referenceIDs)
fetchOperation.fetchRecordsCompletionBlock = { records, error in
// ...Handle the fetched Profiles
// Everything has been fetched, update the UI now
dispatch_async(dispatch_get_main_queue(), {
self.tableView.reloadData()
})
}
CKContainer.defaultContainer().publicCloudDatabase.addOperation(fetchOperation)
}
在那个函数中,我们花了一些时间来获取 referenceID。然后我们花时间进行配置文件获取。请注意,所有这些都是在原始 Post 获取之后发生的!
...哎呀。即使使用某种缓存系统,原始提取也会很疯狂(尤其是有很多用户)。
那么,写的时候直接在Post中加上Writer的详细信息会不会更好?这样做的优点:更少的获取,更快的加载。缺点:如果作者更改了他们的个人资料详细信息,该应用程序将不得不遍历他们所有的 Post 并手动更新详细信息。
这整个困境让人感觉像是选择毒药的场景。有更好的方法吗?
您描述的权衡术语是 denormalization。这是你描述的困境。权衡取舍取决于底层技术以及应用程序领域和预期行为。
您已经描述了两个模型对象,一个 Post 和一个配置文件,其中 Writer 引用了 Post 上的配置文件。您没有确切描述它们是如何使用的,但我将假设为 post 的滚动列表,在 table 视图中,每个单元格上都有作者姓名和个人资料图片名单。很明显为什么您担心为每个人提取参考。
CloudKit 的首要任务是尽量减少到服务器的往返次数。但是,一次获取 posts 和第二次获取链接的个人资料名称并不是特别繁重。 非常重要: 在这里尽可能使用 desiredKeys
属性 获取和查询。 CloudKit 默认获取整条记录,您可能会通过网络传递无关信息——这是获取用户姓名和获取用户完整配置文件之间的区别。
尽可能使用 desiredKeys
的要点在文档中没有充分说明其对优化的重要性和实施的简单性。
但是,如果您担心拉动 post 时的响应,例如,如果用户在您拉动更多时等待,您可能需要非规范化。
我还假设配置文件不会经常更改——这是一个关键点——但它可以更改并且应用程序需要考虑到这一点。这实际上非常简单:循环遍历 post 来更新它们并不理想,但这没什么大不了的,因为这是一次性的事情,您不希望经常发生。你应该可以用一对 CKQueryOperation/CKModifyRecordsOperation 来完成。
同样,请务必使用 desiredKeys
——尤其是如果您只是获取以更新每个 post 上的非规范化字段并且不打算显示其中任何一个,则您不需要' 想要通过网络传递每个 post 的全部内容。
请注意,如果您使用个人资料图片进行非规范化,您可能需要确保您使用的是相同的 CKAsset,这样您就可以使用内置缓存,并且不会不小心上下发送相同的图像并存储一堆次。查看有关 CKAsset 和本地缓存如何工作的警告;显然,如果您希望它保证存储在本地,您必须自己缓存它。
值得注意的是,所有这些 CloudKit 数据类型 特别是 不应该用作您应用中的模型对象,以及这如何将与该层交互将影响您所做的任何选择。
CloudKit 实际上很棒,但在我看来,它的非系统文档阻碍了它的发展。我很幸运今年 ('16) 参加了 WWDC,并且能够与一些 CloudKit 工程师交谈,这就是其中一些信息的来源。希望这可以帮助。