.net - 并发集合中的非并发集合是否安全?
问题描述
我希望开始在我正在处理的项目中实现一些并发功能。我最近发现了System.Collections.Concurrent
我打算利用的命名空间。
我用来跟踪动作整体状态的对象本质上是一个包含一些嵌套自定义对象的字典。我的想法是,只要将最高级别的集合配置为并发/线程安全,嵌套集合是否是无关紧要的,因为数据将被更高级别的集合锁定。
这是正确的假设吗?
例如,PowerShell 中的以下内容可以安全使用吗?
[System.Collections.Concurrent.ConcurrentDictionary[[String], [MyCustomClass]]]::new()
此外,我有一些自定义类扩展 HashSet 以避免重复。由于 System.Collections。Concurrent 没有 HashSet 类,推荐的同时获得类似功能的方法是什么?
解决方案
我的想法是,只要将最高级别的集合配置为并发/线程安全,嵌套集合是否是无关紧要的,因为数据将被更高级别的集合锁定。
这是正确的假设吗?
不,这不是一个安全的假设。
假设您创建了一个包含一堆常规哈希表的并发字典:
using namespace System.Collections.Concurrent
# Create thread-safe dictionary
$rootDict = [ConcurrentDictionary[string,hashtable]]::new()
$rootDict
现在是线程安全的 - 多个线程不能通过'A'
覆盖对哈希表的引用来同时修改条目- 我们添加到的任何内部哈希表都不
$rootDict
是线程安全的——它仍然只是一个常规的哈希表
ForEach-Object -Parallel
在 PowerShell 7 中,当用于对此类数据结构进行操作时,可以观察到这一点:
using namespace System.Collections.Concurrent
# Create thread-safe dictionary
$rootDict = [ConcurrentDictionary[string,hashtable]]::new()
1..100 |ForEach-Object -Parallel {
# We need a reference to our safe top-level dictionary
$dict = $using:rootDict
# ... and we need a key
$rootKey = $_ % 2 -eq 0 ? 'even' : 'odd'
# Thread-safe acquisition of inner hashtable
$innerDict = $dict.GetOrAdd($rootKey, {param($key) return @{}})
# Add a bit of jitter for realism
Start-Sleep -Milliseconds (Get-Random -Minimum 50 -Maximum 250)
# Update inner hashtable entry
$innerDict['Counter'] += 1
} -ThrottleLimit 10
# Are these really the results we're expecting...?
$rootDict['odd','even']
如果内部哈希表条目是线程安全的,可以同时更新,您会期望两个计数器都位于50
,但我在笔记本电脑上得到如下结果:
Name Value
---- -----
Counter 46
Counter 43
我们可以看到内部“计数器”条目的多次更新在此过程中丢失,可能是由于并发更新。
为了检验这个假设,让我们做同样的实验,但使用另一种并发字典类型而不是哈希表:
using namespace System.Collections.Concurrent
# Create thread-safe dictionary with a thread-safe item type
$rootDict = [ConcurrentDictionary[string,ConcurrentDictionary[string,int]]]::new()
1..100 |ForEach-Object -Parallel {
# We need a reference to our safe top-level dictionary
$dict = $using:rootDict
# ... and we need a key
$rootKey = $_ % 2 -eq 0 ? 'even' : 'odd'
# Thread-safe acquisition of inner hashtable
$innerDict = $dict.GetOrAdd($rootKey, {param($key) return @{}})
# Add a bit of jitter for realism
Start-Sleep -Milliseconds (Get-Random -Minimum 50 -Maximum 250)
# Thread-safe update of inner dictionary
[void]$innerDict.AddOrUpdate('Counter', {param($key) return 1}, {param($key,$value) return $value + 1})
} -ThrottleLimit 10
# These should be the exact results we're expecting!
$rootDict['odd','even']
现在我得到:
Key Value
--- -----
Counter 50
Counter 50
我有一些自定义类扩展 HashSet 以避免重复。由于 System.Collections。Concurrent 没有 HashSet 类,推荐的同时获得类似功能的方法是什么?
HashSet
我强烈建议不要显式继承自,而是包装a HashSet
,然后用 a 保护您想要向用户公开的所有方法ReaderWriterLockSlim
- 这样您就可以在不牺牲读取访问性能的情况下实现线程安全。
在这里,反对[int]
用作示例日期类型:
using namespace System.Collections.Generic
using namespace System.Threading
class ConcurrentSet
{
hidden [ReaderWriterLockSlim]
$_lock
hidden [HashSet[int]]
$_set
ConcurrentSet()
{
$this._set = [HashSet[int]]::new()
$this._lock = [System.Threading.ReaderWriterLockSlim]::new()
}
[bool]
Add([int]$item)
{
# Any method that modifies the set should be guarded
# by a WriteLock - guaranteeing exclusive update access
$this._lock.EnterWriteLock()
try{
return $this._set.Add($item)
}
finally{
$this._lock.ExitWriteLock()
}
}
[bool]
IsSubsetOf([IEnumerable[int]]$other)
{
# For the read-only methods a read-lock will suffice
$this._lock.EnterReadLock()
try{
return $this._set.IsSubsetOf($other)
}
finally{
$this._lock.ExitReadLock()
}
}
# Repeat appropriate lock pattern for all [HashSet] methods you want to expose
}
您可以通过包装 a并使用HashSet<object>
自定义比较器控制行为来使包装器更加灵活
推荐阅读
- pebble - 控制 Pebble 模板中的空白
- mysql - Command UPDATE using existing data
- django-models - 如何将 Django 类名引用到函数中?
- python - How to read file's content from GitHub file with a specific branch name?
- java - 关于在春季启动时引发异常时的 log4j2 内存泄漏
- java - 黑色在绘制的图像周围闪烁
- php - 在在线服务器上使用 wkhtmltopdf 生成 pdf 时字体更改
- r - 长短data.frame格式之间的转换
- laravel - 我的命令如何通过可选参数传递给另一个 Artisan 命令?
- go - Golang AWS S3manager multipartreader w/ Goroutines