C# 解决在Dictionary中使用枚举的效率问题

来自：网络

时间：2021-07-15

阅读：

使用字典的好处

System.Collections.Generic命名空间下的Dictionary，它的功能非常好用，且功能与现实中的字典是一样的。

它同样拥有目录和正文，目录用来进行第一次的粗略查找，正文进行第二次精确查找。通过将数据进行分组，形成目录，正文则是分组后的结果。它是一种空间换时间的方式，牺牲大的内存换取高效的查询效率。所以，功能使用率查询>新增时优先考虑字典。

        public static Tvalue DicTool<Tkey, Tvalue>(Tkey key, Dictionary<Tkey, Tvalue> dic)
        {
            return dic.TryGetValue(key, out Tvalue _value) ? _value : (Tvalue)default;
        }

           Stopwatch stopwatch = Stopwatch.StartNew();
            for (int i = 0; i < 1; i++)
            {
                DicTool(0, Dic);
            }
            stopwatch.Stop();
            Console.WriteLine(stopwatch.Elapsed);

执行时间00:00:00.0003135

            Stopwatch stopwatch = Stopwatch.StartNew();
            for (int i = 0; i < 10000; i++)
            {
                DicTool(0, Dic);
            }
            stopwatch.Stop();
            Console.WriteLine(stopwatch.Elapsed);

执行时间00:00:00.0005091

从上面可以看出，它进行大量查询时的用时非常短，查询效率极高。但使用时需要避免使用枚举作为关键词进行查询；它会造成查询效率降低。

使用枚举作为key时查询效率变低

 Stopwatch stopwatch = Stopwatch.StartNew();
            for (int i = 0; i < 10000; i++)
            {
                DicTool(MyEnum.one, Dic);
            }
            stopwatch.Stop();
            Console.WriteLine(stopwatch.Elapsed);

执行时间00:00:00.0011010

从这里的执行时间可以看出，查询效率大大降低。

优化方案：使用int代替enum，enum强制转型后间接查询；可使查询效率与非枚举的直接查询相近。（还有其他的优化方案，个人只使用过这个）

using System;
using System.Diagnostics;
using System.Collections.Generic;
namespace Test
{
    public class Program
    {
        public enum MyEnum : int
        {
            one,
            two,
            three
        }
        public static void Main(string[] args)
        {
            Dictionary<int, int> Dic = new Dictionary<int, int>()
            {
                { (int)MyEnum.one,1},
                { (int)MyEnum.two,2},
                { (int)MyEnum.three,3}
            };
            Stopwatch stopwatch = Stopwatch.StartNew();
            for (int i = 0; i < 10000; i++)
            {
                DicTool((int)MyEnum.one, Dic);
            }
            stopwatch.Stop();
            Console.WriteLine(stopwatch.Elapsed);
        }
        public static Tvalue DicTool<Tkey, Tvalue>(Tkey key, Dictionary<Tkey, Tvalue> dic)
        {
            return dic.TryGetValue(key, out Tvalue _value) ? _value : (Tvalue)default;
        }
    }
}

执行时间 00:00:00.0005005

为什么使用枚举会降低效率

使用ILSpy软件反编译源码，得到以下：

public bool TryGetValue(TKey key, out TValue value)
{
    int num = this.FindEntry(key);
    if (num >= 0)
    {
        value = this.entries[num].value;
        return true;
    }
    value = default(TValue);
    return false;
}
private int FindEntry(TKey key)
{
    if (key == null)
    {
        ThrowHelper.ThrowArgumentNullException(ExceptionArgument.key);
    }
    if (this.buckets != null)
    {
        int num = this.comparer.GetHashCode(key) & 2147483647;
        for (int i = this.buckets[num % this.buckets.Length]; i >= 0; i = this.entries[i].next)
        {
            if (this.entries[i].hashCode == num && this.comparer.Equals(this.entries[i].key, key))
            {
                return i;
            }
        }
    }
    return -1;
}

查看Dictionary源码后可以知道，效率减低来源于this.comparer.GetHashCode(key) 这段代码。

comparer是使用了泛型的成员，它内部使用int类型不会发生装箱，但是由于Enum没有IEquatable接口，内部运行时会引起装箱行为，该行为降低了查询的效率。

IEquatable源码：

namespace System
{
 [__DynamicallyInvokable]
 public interface IEquatable<T>
 {
  [__DynamicallyInvokable]
  bool Equals(T other);
 }
}

装箱：值类型转换为引用类型（隐式转换）

把数据从栈复制到托管堆中，栈中改为存储数据地址。

拆箱：引用类型转换为值类型（显式转换）

补充：C#中Dictionary<Key,Value>中[]操作的效率问题

今天有朋友问到如果一个Dictionary<Key,Value>中如果数据量很大时，那么[ ]操作会不会效率很低。

感谢微软开源C#,让我们有机会通过代码验证自己的猜想。

此处是微软C#的源代码地址

先上结论：Dictionary<Key,Value>的[ ]操作的时间 = 一次调用GetHashCode + n次调用Key.Equals的时间之和。

期中n受传入的key的GetHashCode 的重复率影响，比如传入的key的hash值为5，Dictionary中hash值为5的值有100个，这100值相当于用链表存储，如果要查找的值在第20个那么n的值就是19。如果GetHashCode 基本没什么重复率，那么n始终1，极端情况下n可能为一个很大的数（参考测试代码）。

C#中的关键代码如下：

 int hashCode = comparer.GetHashCode(key) & 0x7FFFFFFF;
                for (int i = buckets[hashCode % buckets.Length]; i >= 0; i = entries[i].next) {
                    if (entries[i].hashCode == hashCode && comparer.Equals(entries[i].key, key)) return i;

同时在这里我想说一下Dictionary<Key,Value>类中数据的组织结构：

        private struct Entry {
            public int hashCode;    // Lower 31 bits of hash code, -1 if unused
            public int next;        // Index of next entry, -1 if last
            public TKey key;           // Key of entry
            public TValue value;         // Value of entry
        } 
        private int[] buckets;
        private Entry[] entries;

期中buckets是保存所有的相同hash值的Entry的链表头，而相同hash值的Entry是通过Entry .next连接起来的。在新加入的Value时，如果已经存在相同hash值会将buckets中的值更新，如果不存在则会加入新的值，关键代码如下：

            entries[index].hashCode = hashCode;
            entries[index].next = buckets[targetBucket];
            entries[index].key = key;
            entries[index].value = value;
            buckets[targetBucket] = index;

注意最后一句，将新加入值的下标inddex的值赋值给了buckets，这样相当于就更新了链表头指针。这个链表就是前面产生n的原因。

下面我放一些测试的结果：

当GetHashCode的消耗为1ms时：

当GetHashCode的消耗为100ms时：

增加的消耗是99ms也就是GetHashCode增加的消耗，后面的尾数就是上面公式里的n。

附测试代码如下：

using System;
using System.Collections.Generic;
using System.Diagnostics;
using System.Threading; 
namespace ConsoleApplication1
{
    class Program
    {
        public class Test1
        {
            private ushort num = 0;
            public Test1(ushort a)
            {
                num = a;
            }
 
            public override int GetHashCode()
            {
                Thread.Sleep(1);
                return num / 100;
            }
 
            public override bool Equals(object obj)
            {
                Thread.Sleep(1);
                return num.Equals((obj as Test1).num);
            }
        }
 
        static void Main(string[] args)
        {
            Dictionary<Test1, string> testDic = new Dictionary<Test1, string>();
            for (ushort a = 0; a < 100; a++)
            {
                Test1 temp = new Test1(a);
                testDic.Add(temp, a.ToString());
            }
 
            Stopwatch stopWatch = new Stopwatch();
            string str = "";
 
            stopWatch.Start();
            str = testDic[new Test1(99)];
            stopWatch.Stop();
            Console.WriteLine("num = " + str +" pass Time = " + stopWatch.ElapsedMilliseconds);
 
            stopWatch.Restart();
            str = testDic[new Test1(1)];
            stopWatch.Stop();
            Console.WriteLine("num = " + str + " pass Time = " + stopWatch.ElapsedMilliseconds);
 
            stopWatch.Restart();
            str = testDic[new Test1(50)];
            stopWatch.Stop();
            Console.WriteLine("num = " + str + " pass Time = " + stopWatch.ElapsedMilliseconds);
 
            stopWatch.Restart();
            str = testDic[new Test1(98)];
            stopWatch.Stop();
            Console.WriteLine("num = " + str + " pass Time = " + stopWatch.ElapsedMilliseconds);
 
            stopWatch.Restart();
            str = testDic[new Test1(97)];
            stopWatch.Stop();
            Console.WriteLine("num = " + str + " pass Time = " + stopWatch.ElapsedMilliseconds);
        }
    }
}

以上为个人经验，希望能给大家一个参考，也希望大家多多支持。如有错误或未考虑完全的地方，望不吝赐教。

QT中定义光标可以使用 Qt::CursorShape 预定义的光标，也可以使用 QBitmap 和 QPixmap 自己绘制光标。QBitmap 只有黑白2色，QPixmap可以绘制彩色光标。使用QPixmap绘制光标时

2024-03-15 00:39:35

实现自定义QGraphicsItem缩放和旋转时，遇到了这样一个问题：将item旋转一个角度，然后拖拽放大，再次进行旋转时图像会发生漂移。原本以为是放大后中心点位置没有改变，导致旋转时以

2024-03-15 00:38:51

Qt 是一个跨平台C++图形界面开发库，利用Qt可以快速开发跨平台窗体应用程序，在Qt中我们可以通过拖拽的方式将不同组件放到指定的位置，实现图形化开发极大的方便了开发效率，本章将

2024-03-13 00:04:11

前言C# Web API 是一种基于 .NET 平台（包括但不限于.NET Framework 和 .NET Core）构建 HTTP 服务的框架，用于创建 RESTful Web 服务。REST（Representational State Transfer）是一

2024-03-11 18:42:24

左值（Lvalue）与右值（Rvalue）英文含义：左值（Lvalue）：Locator value，意味着它指向一个具体的内存位置。右值（Rvalue）：Read value，指的是可以读取的数据，但不一定指向一个固定的内存位置

2024-03-09 23:26:09

前言使用场景是需要使用一个接口，这个接口有限制每个 APIKey 的请求量在 5次/s一开始是最苯的做法，每次调用之后等个 200 毫秒，这样就不会超出这个限制但是这样效率也太低了，刚

2024-03-09 23:24:55

2024-03-09 22:21:13

程序在运行过程对内存进行分配申请与释放new运算符运行时存储分配，返回可以存放对应类型数据的内存地址，指向分配的内存空间分配基础类型内存存储空间#include <iostream>usi

2024-03-09 22:20:45

〇、简介YAML（Yet Another Markup Language）另一种标记语言。YAML 是一种较为人性化的数据序列化语言，可以配合目前大多数编程语言使用。YAML 的语法比较简洁直观，特点是使用空

2024-03-08 22:45:39

&emsp;&emsp;本文介绍在C++语言中，矩阵库Armadillo的mat、vec格式数据与计算机视觉库OpenCV的Mat格式数据相互转换的方法。&emsp;&emsp;在C++语言的矩阵库Armadillo与计算机

2024-03-08 22:40:09

2024-03-08 22:38:48

技术背景最近刚学习C++的一些编程技巧，对于一些相对比较陌生的问题，只能采取一些简单粗暴的方案来实现。就比如说，我们可以在Python中定义一个[[0,0,0],[1,2],[1,1,1],[3]]这样

2024-03-07 01:23:04

前言虽然已经正式转JAVA了，但最近发现一个特别好的开源项目masuit，不仅提供很多简便的功能，还有图像的一些特殊操作功能。
之前我们比较图片应该都是使用的openCV，不过这个masui

2024-03-05 23:08:54

人大金仓优点人大金仓是国产最主流数据库之一具有和PgSql一样强悍的性能，同时人大金仓支持了四种数据库模式：Oracle、PgSql、MySql和SqlServer ，假如你们系统有多种数据库开发

2024-03-05 23:04:02

前言Microsoft Excel的XLSX格式以及基于文本的CSV（逗号分隔值）格式，是数据交换中常见的文件格式。应用程序通过实现对这些格式的读写支持，可以显著提升性能。在本文中，小编将为大

2024-03-04 22:58:00

C++ MySQL数据库连接池新手学了C++多线程，看了些资料练手写了C++数据库连接池小项目，自己的源码地址关键技术点MySQL数据库编程、单例模式、queue队列容器、C++11多线程编程、

2024-03-04 22:42:24

My-PaddleOCR介绍如何在 C++ 项目中，通过源码使用 PaddlePaddle 实现 OCR 功能。
本项目的所有源码：gitee: paddleocr目前，官方提供使用 PaddleOcr 的方案有：在 Python 项目中

2024-02-29 14:03:13

&emsp;&emsp;本文介绍在Visual Studio软件中配置、编译C++环境下GDAL库、SQLite环境与PROJ库的详细方法。&emsp;&emsp;GDAL库是一个非常方便的地理数据处理库，但其在C++环境

2024-02-28 16:34:00

&emsp;&emsp;本文介绍基于C++语言GDAL库，批量读取大量栅格遥感影像文件，并生成各像元数值的时间序列数组的方法。&emsp;&emsp;首先，我们来明确一下本文所需实现的需求。现在有

2024-02-28 16:33:23

&emsp;&emsp;本文介绍基于C++语言GDAL库，批量创建大量栅格遥感影像文件，并将数据批量写入其中的方法。&emsp;&emsp;首先，我们来明确一下本文所需实现的需求。已知我们对大量遥

2024-02-28 16:32:52

一、前言为了挑战一下OpenCV的学习成果，最经一直在找各类项目进行实践。机缘巧合之下，得到了以下的需求：要求从以下图片中找出所有的近似矩形的点并计数，重叠点需要拆分单独计数

2024-02-28 16:28:28

篇幅较长，所以首先列举结果，也就是我们的目的核心目的为探索特定场景对不同类型数据进行统一抽象，并达到足够高性能，也就是一份代码实现，对不同类型数据依然高性能以下为结果，也就

2024-02-28 16:25:53

C#程序的全局异常处理，网上搜下资料都是一大堆，我这里最近也是独立做一个B/S结构的小项目，后面又增加了需求用WPF实现相同的功能，这里将我所使用的全局异常处理方式做一个简短

2024-02-27 20:05:17

前言在日常工作中，我们经常需要在Excel中使用公式对表中数据进行计算（求和、求差和求均值等）和分析，从而实现对数据的分类，通常情况下，当数据量较少或场景变化单一的情况下，使用公

2024-02-27 16:06:25

1. 指针与地址1.1 概念我们都知道计算机的数据必须存储在内存里，为了正确地访问这些数据，必须为每个数据都编上号码，就像门牌号、身份证号一样，每个编号是唯一的，根据编号可以准

2024-02-26 22:37:55

&emsp;&emsp;本文介绍基于C++语言GDAL库，为CreateCopy()函数创建的栅格图像添加更多波段的方法。&emsp;&emsp;在C++语言的GDAL库中，我们可以基于CreateCopy()函数与Create()函

2024-02-26 22:32:31

C语言中指数函数的实现方法，需要具体代码示例指数函数是数学中常见的一种函数，它的定义为 f(x) = e^x，其中 e 是自然对数的底数。在C语言中，我们需要自己实现指数函数，下面将介绍

2024-02-25 00:13:56

引言前面贝蒂带大家了解了选择结构，今天就来为大家介绍循环结构，也就是我们熟悉的while，do while，还有for的用法。只要给定的条件为真，C 语言中的 while 循环语句会重复执行一个

2024-02-25 00:04:47

引言前面贝蒂给大家介绍了选择结构与循环结构，今天，贝蒂准备给大家介绍C语言中一个非常重要的结构——数组1. 数组的定义数组到底是什么呢，顾名思义就是很多数的集合

2024-02-25 00:02:49

1. 函数的概念在数学中我们就知道了函数这个概念，而C语言同样引入了函数这个概念，那C语言的函数到底是什么样的呢？在C语言中，函数也叫子程序，它是一段可以重复使用的代码，用来独立

2024-02-25 00:00:42

2020-05-31

2021-06-03

2020-05-26

2021-04-24

2020-11-01

2020-05-26

2020-11-01

2021-02-22

2020-06-19

2020-11-01

C# 解决在Dictionary中使用枚举的效率问题

使用字典的好处

使用枚举作为key时查询效率变低

为什么使用枚举会降低效率

C#中的关键代码如下：

下面我放一些测试的结果：

附测试代码如下：

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道