深入分析C++对象模型之移动构造函数

时间：2024-04-19

阅读：

接下来我将持续更新“深度解读《深度探索C++对象模型》”系列，敬请期待，欢迎关注！也可以关注公众号：iShare爱分享，自动获得推文和全部的文章列表。

C++11新标准中最重要的特性之一就是引入了支持对象移动的能力，为了支持移动的操作，新标准引入了一种新的引用类型——右值引用，右值引用一个重要的性质就是只能绑定到一个将要销毁的对象。对对象执行移动操作后要确保源对象处于可析构的状态，源对象随时可能被销毁，所以程序在之后不要再去使用源对象的值，同时也要保证源对象析构之后不会对移入对象产生副作用。移动语义的加持使得移动一个如容器之类的大对象的成本可以像复制一个指针一样低廉了，于是出现了各种各样的传言：如编译器会使用移动操作来替代拷贝操作以获得效率上的提升，甚至说将符合C++98标准的以前的老代码用符合C++11新标准的编译器重新编译一次，一行代码未改即可获得运行速度上质的提升。对于种种传闻，事实上是否如此？接下来让我们拨开层层迷雾，来一探究竟，看完这篇文章，你的心中就会有答案。

为了支持对象的移动，新标准新增了移动构造函数和移动赋值运算符，移动构造函数和移动赋值运算符的情形类似，所以放在一起讨论。对于传闻中如果程序中没有定义移动构造函数，那么编译器就会帮助程序生成一个移动构造函数这一说法是否可靠？我们以实际的代码来分析一下，由于移动构造函数需要一个右值引用作为第一个参数，测试代码中可以使用标准库里的move函数来产生一个右值引用，move函数其实就是一个类型转换，它可以把一个左值转换成右值引用。看看下面的代码是否编译器会合成出来移动构造函数：

#include <utility>

class Object {
    int a;
};

int mAIn() {
    Object d;
    Object d1 = std::move(d);
    
    return 0;
}

把它编译成汇编代码看一下：

main:						# @main
    push    rbp
    mov     rbp, rsp
    mov     dword ptr [rbp - 4], 0
    mov     eax, dword ptr [rbp - 8]
    mov     dword ptr [rbp - 16], eax
    xor     eax, eax
    pop     rbp
    ret

实际上编译器并没有生成一个移动构造函数，甚至任何构造函数都没有生成。因为没有必要，在这种情况下，编译器可以做一些优化，执行按对象的成员逐个复制过去就可以了，不需要生成一个函数来做这个事情。上面汇编代码的第5、第6行就是将对象d（存放在栈空间[rbp - 8]中）的内容先拷贝到eax寄存器，然后再从寄存器eax拷贝到对象d1（存放在栈空间[rbp - 16]中）。

那么在什么情况下才会合成出来移动构造函数呢？

编译器合成移动构造函数的条件

编译器只有在以下的这些情况下才会合成出来移动构造函数：

类中没有定义拷贝构造函数、拷贝赋值运算符、析构函数；且：
类的定义中有一个类类型的成员，这个类成员定义了移动构造函数；或者：
继承的父类中定义了移动构造函数；或者：
类中定义了或者从父类中继承了一个以上的虚函数；或者：
类的继承链上有一个父类是virtual base class。

在上面C++代码的Object类中增加一个std::string类型的成员，std::string是标准库中提供的操作字符串的类，类中有定义了移动构造函数。Object类定义如下：

class Object {
    std::string s;
    int a;
};

把它编译成汇编代码，可以看到这下汇编代码变得很多，不光生成了Object类的移动构造函数，还有默认构造函数和析构函数。main函数的汇编代码如下：

main:							# @main
    push    rbp
    mov     rbp, rsp
    sub     rsp, 96
    mov     dword ptr [rbp - 4], 0
    lea     rdi, [rbp - 48]
    call    Object::Object() [base object constructor]
    lea     rdi, [rbp - 88]
    lea     rsi, [rbp - 48]
    call    Object::Object(Object&&) [base object constructor]
    mov     dword ptr [rbp - 4], 0
    lea     rdi, [rbp - 88]
    call    Object::~Object() [base object destructor]
    lea     rdi, [rbp - 48]
    call    Object::~Object() [base object destructor]
    mov     eax, dword ptr [rbp - 4]
    add     rsp, 96
    pop     rbp
    ret

上面汇编代码的第7行调用了Object类的默认构造函数，因为string类里也定义了默认构造函数，所以这里需要去调用它，具体分析可见另外一篇的分析文章。第10行实际上就是调用Object类的移动构造函数了，在Object类的移动构造函数里会去调用string类的移动构造函数。所以可以推测出来，只有需要调用类类型成员的移动构造函数的时候编译器才会合成一个移动构造函数出来，在合成的移动构造函数中去调用它，上面的第3种情况也类似，第4和第5种情形是因为编译器需要重设虚表指针，所以也会生成一个移动构造函数来完成，这些情形跟合成拷贝构造函数的机制是类似的，具体的分析可以见《编译器背后的行为之拷贝构造函数》这篇文章，这里就不再一一赘述了。

编译器抑制合成移动构造函数的情形

虽然说合成移动构造函数的时机和合成拷贝构造函数的类似，但是合成移动构造函数的条件要比合成拷贝构造函数要苛刻得多，在以下的情形中，移动构造函数的合成将受到抑制，编译器不会合成一个移动构造函数出来。

类中只要定义了拷贝构造函数、拷贝赋值运算符和析构函数的其中一个，编译器就不会合成移动构造函数

有这么一个指导原则，叫做Rule of Three，大意是：主要你定义了拷贝构造函数、拷贝赋值运算符、析构函数中的一个，你就必须要全部定义它们。原因就是既然你需要自己实现拷贝的操作，说明这里需要管理资源，比如内存的申请和释放，在拷贝构造函数里需要管理资源，意味着在拷贝赋值运算符函数里也需要，反之亦然，同时也需要在析构函数中释放资源。由此可以得出的推论就是如果你定义了这其中的一个函数，说明有资源需要特别处理，那么编译器合成出来的移动构造函数可能就不是你想要的效果，甚至破坏程序的逻辑，引起潜在的bug，所以编译器就不会合成出来移动构造函数。

按照上面的推论，如果定义了析构函数，那么编译器就不应该生成拷贝构造函数和拷贝赋值运算符了，但是C++98标准中却留下了一个“bug“：在定义了析构函数之后，编译器还是会在有需要的时候合成出拷贝构造函数和拷贝赋值运算符，C++11标准为了兼容C++98，同样地也允许合成出来，但是对于移动构造函数和移动赋值运算符，C++11标准中明确规定了：只要定义了析构函数，编译器便不再合成出移动构造函数和移动赋值运算符。

如果你的代码中没有定义上面的三种函数，你的类中的成员也是可以移动的，编译器在这时也为程序合成出了移动构造函数或者移动赋值运算符，如果这一切正符合你的本意，那么这种情况下建议你，最好在你的代码中把移动构造函数或移动赋值运算符用=default显示地声明出来。原因在于，假如有一个类，类中有一个容器，容器存放了大量的数据，类中没有定义拷贝构造函数和析构函数等，编译器也合成了移动构造函数，使得对象的移动非常高效。但是突然有天来个需求，需要在对象的构造和析构时记录下来，于是你增加了构造函数和析构函数以满足需求，但是加入代码重新编译之后发现程序执行的效率变差了，甚至有可能差了几个数量级，根源在于你定义了析构函数之后，编译器便不再合成移动构造函数了，而是用拷贝操作替换了移动的操作，所以显示地声明它们是一种好的习惯，尽管我们不需要实现这个函数的代码，所以使用=default让编译器来自动生成。

如果类的定义中有一个类类型的成员或者继承自一个父类，这个类成员或者父类里的移动构造函数或者移动赋值运算符被定义为删除的（=delete）或者是不可访问的（定义为private），那么此类的移动构造函数或者移动赋值运算符被定义为删除的。

如下面的例子：

#include <utility>
#include <string>

class Base {
public:
    Base() = default;
    Base(Base&& rhs) = delete;
    int b;
};

class Object {
public:
    Base b;
    std::string s;
    int a;
};

int main() {
    Object d;
    Object d1 = std::move(d);	// 这行编译不通过。
    
    return 0;
}

上面的例子中，编译器不再会生成移动构造函数和拷贝构造函数，所以第20行的代码将编译不通过，因为没有拷贝构造函数或移动构造函数供调用。

如果类的析构函数被定义为删除的或不可访问的，那么此类的移动构造函数被定义为删除的。

移动操作并未使效率更高的情况

在某些情况下，移动构造函数或移动赋值运算符被正确地合成出来或者由程序员定义出来了，但是程序却并未如预期的提升运行效率，如以下的场景：

没有移动操作

假如类中有了移动构造函数（合成的或者用户定义的），同时类中有一个类类型的成员，这个成员刚好存放着大量数据，而此成员的类定义中没有定义移动构造函数，因此它只可以拷贝而不能移动。当对对象实施move操作时，实际上将会对对象的每个成员依次递归地实施move调用，它将匹配适合这个成员的操作，即如果成员是可移动则执行移动操作，如果不可移动的则执行拷贝操作。所以实际上将会调用此成员的拷贝构造函数。

另一种情形，如std::array容器，它是C++11标准新提供的容器类型，功能相当于内建的数组，它不同于别的容器类型将数据存储在堆中，然后使用指针指向数据，移动容器只需赋值指针，然后将源指针置空即可。array容器的数据是存放在对象上，即使数组里存放的元素类型能提供移动操作，那也得需要一个个地将每个元素执行一遍移动操作，这个时间是一个线性时间复杂度。

移动的效率不高

std::string类往往采用了小型字符串优化（small string optimization, SSO）的实现手法，SSO是将小型字符串（比如长度小于15个字符）直接存储在string对象内的缓冲区中，超过这个长度的则存放在堆上。之所以采用SSO优化手法，就是因为在实际应用场景中大多数使用的字符串长度都比较短，这样可避免频繁地申请和释放内存带来的开销。在使用了SSO的情况下，移动一个string对象并不比较拷贝来得更快，实际上这种情况移动操作执行的是拷贝动作。

移动操作未被调用

即使类中提供的移动操作比拷贝操作的效率明显要高得多，但是也有可能未能调用到移动操作，依然使用的是拷贝操作，导致实际效果效率不高的问题。比如标准库中的vector容器，它提供了一个push_back的接口，调用此接口向容器中加入一个元素，这时有可能容器的容量满了，需要申请一块更大的内存，然后把原先内存位置的元素搬过去再销毁掉。vector容器的实现者需要保证这个过程的前后状态要保持不变，在移动元素时，如果元素的类型提供了移动功能，那么vector容器就会使用它，但是要求这个移动操作必须是noexcept的，假如移动操作不能保证是noexcept的，vector容器就不会使用它。

试想一下，假如在移动到一半的时候，这时抛出了异常，移动操作随即停止，这时一半的元素在新空间中，一半的元素在旧的空间中，vector无法恢复到原先的状态。拷贝操作则不会存在这个问题，假如在拷贝过程中出现问题，那么只需要将新空间的元素和新申请的内存释放掉，vector的状态还是保持不变。

所以如果你的类型中的移动构造函数未加上noexcept声明，即使类型中的移动操作比对应的拷贝操作的效率要高效得多，编译器仍会强制去调用拷贝操作而非移动操作。因此建议当你定义自己版本的移动构造函数或移动赋值运算符的时候，要确保不会抛出异常，并在声明中明确加上noexcept声明。

目录 0、常见的判断图片文件的方法 1. 根据文件扩展名判断代码示例优缺点 2. 通过文件头（Magic Number）判断代码示例优缺点 3. 使用 ImageSharp 判断文件是否为图

2024-10-18 23:26:39

目录 1.界面实现效果 2.简介 3.使用1.界面实现效果以下是具体的项目需要用到的效果展示，用于验证字母。2.简介自定义CaptchaMovableLabel，继承自QLabel类：
中间的4个字母，就是Ca

2024-10-18 23:26:30

目录一、函数输入二、函数输出三、使用示例一、函数输入输入有两个，参数一：需要截图的容器控件，参数二：保存截图的绝对路径路径<param name="control">控件名</param>
<param

2024-10-14 19:57:08

目录1. 使用 Lambda 表达式和标准库 std::function2. 使用 std::future 和 std::promise3. 使用协程 (C++20)4. 使用异步框架总结“地狱回调”（Callback Hell）是指

2024-09-10 22:05:57

目录简介什么是Buffer OverflowBuffer Overflow的常见原因如何检测和调试Buffer Overflow解决Buffer Overflow的最佳实践详细实例解析示例1：数组越界写入示例2：未检查输入长度

2024-09-10 22:05:55

目录引言段错误的产生原因段错误的检测方法段错误的预防措施段错误的解决方案总结引言段错误（Segmentation Fault）是 C++ 编程中常见且令人头疼的错误之一。段错误通常发生在

2024-09-10 22:05:53

QPushButton是Qt库中的一个重要组件，它是用户界面（UI）设计中常用的一个按钮控件。在Qt程序中，QPushButton用于创建可以在界面上点击响应操作的交互元素。它的主要作用包括：显示文

2024-09-10 22:05:51

目录引言示例需求开发环境代码实现运行结果程序分析注意引言之前写了一个手动切换多个布局的程序，下面来记录一下。
程序运行效果如下：示例需求通过点击程序界面上不同的布局

2024-09-10 22:05:49

目录前言1. 加载数据库驱动2. 创建数据库连接3. 执行SQL查询或命令4. 关闭数据库连接示例完整代码片段打开多个数据库使用建议总结前言在Qt中访问数据库涉及到几个关键步骤

2024-09-10 22:05:47

目录步骤 1: 安装Protobuf步骤 2: 配置Qt项目步骤 3: 编译和运行项目运行qmake以生成Makefile：注意事项在Qt项目中使用Protobuf（Protocol Buffers）可以有效地处理数据序列化和

2024-09-10 22:05:45

目录一：功能二：用法一：功能 iota 是给定一个初始元素，然后依次对序列中每个元素进行递增++操作，详见代码一； atoi 是将字符串转换成整数；atol, atoll 将字符串转换成

2024-09-10 22:05:43

目录前言1. 直接在字符串中包含空格2. 使用 %s 和空格3. 使用 \t 输出制表符（Tab）4. 使用循环输出多个空格5. 使用格式控制符输出空格总结前言在C语言中，输出空格可以通过使用

2024-09-10 22:05:41

一、为什么使用文件在学习完结构体后，为了检验学习成果，我们写了一个通讯录的小程序，当通讯录运行起来的时候，可以给通讯录中增加、删除数据，此时数据是存放在内存中的，当程序退出

2024-09-10 22:05:39

目录1. 使用 QThread::sleep示例代码：说明：优点：缺点：2. 使用 QTimer 和事件循环示例代码：说明：优点：缺点：3. 使用 QEventLoop 结合 QTimer示例代码：说明：优点：缺点：4. 使用 QPauseAnima

2024-09-10 22:05:35

目录C 语言中如何实现自定义数据类型的输入输出一、结构体数据类型的输入输出二、枚举数据类型的输入输出三、联合数据类型的输入输出四、使用指针实现复杂数据结构的输入输

2024-09-10 22:05:34

目录一、背景二、环境依赖安装三、编写kakfa生产者消费者3.1 生产者3.2 消费者3.3 编译运行3.3.1 编译生产者消费者3.3.2 运行验证3.4 SASL认证kakfa3.5 结束语一、背景在实

2024-09-10 22:05:32

目录传值传址传引用如何选择合适的参数传递方式在C++中，参数传递方式主要有三种：传值（pass by value）、传址（pass by address）、传引用（pass by reference）。每种方式都有其特定的使

2024-09-10 22:05:30

目录概述CHP_Sha256总结概述SHA-256，英文全称为Secure Hash Algorithm 256-bit，是一种广泛使用的密码散列函数，属于SHA-2家族。SHA-256算法由美国国家安全局（NSA）设计，并由美国国

2024-09-10 22:05:28

简介assert 是 C 语言中的一个宏，用于在程序运行时进行条件检查，主要用于调试目的。它在 <assert.h> 头文件中定义，用于验证程序中的假设条件是否成立，如果不成立，程序将打印错误

2024-09-10 22:05:26

目录1.引言2.简单示例3.推荐使用方法4.常见使用场景和注意事项4.1.检查参数的合法性4.2.assert不能使用改变环境的语句4.3.在未知的逻辑中添加assert(false)5.总结1.引言ass

2024-09-10 22:05:24

目录一、基本概念二、用法1.旧版用法（Qt4和早期Qt5）2.新版用法（推荐）3.自动连接（无需使用connect()函数）4.Lambda表达式（Qt5.4）三、断开连接disconnect()1.为什么使用disconnect()2.

2024-09-10 22:05:23

目录一、inline关键字1.1 什么是内联函数？1.2 为什么会有内联函数？1.2.1 回顾宏1.2.2 宏的改进–内联函数1.3 内联函数的特性二、指针空值nullptr2.1 C和C++中NULL的含义

2024-09-10 22:05:21

目录1.获取服务器IP2.安装并且启用ssh服务3.在vscode中远程连接 4.实现免密登录vscode的远程连接功能十分方便，可以让我们在一个开发工具中实现完整的工作流，下面介绍如何在vs

2024-09-10 22:05:18

目录LRU的概念哈希表（unordered_map）主要特性常用操作双向链表（list）特性常用操作LRU缓存（C++）初始化状态LRU的概念LRU（Least Recently Used，最近最少使用）是一种常用的缓存淘汰策略，

2024-09-10 22:05:16

目录一、前言二、代码实操2.1 将二进制数据转为Base64编码2.2 实现图片的base64编码和解码一、前言Base64编码是一种广泛使用的编码方案，将任意二进制数据转换为可打印的ASCI

2024-09-10 22:05:14

目录一、strcat函数的简介二、strcat函数的使用三、strcat函数的注意事项四、strcat函数的模拟实现一、strcat函数的简介strcat函数用于将源字符串追加到目标字符串的末尾，并

2024-09-10 22:05:12

目录1.C++ 的存储类型1.1.存储周期（Storage duration）1.2.存储类型说明符（Storage class specifiers）1.3.存储类型说明符与存储周期的关系2.thread_local简介3.thread_local 应

2024-09-10 22:05:10

c++栈内存和堆内存的基本使用#include <iostream>// 定义一个简单的结构体struct Person { std::string name; int age;};int main() { // 栈内存分配 int a = 10; //

2024-09-10 22:05:08

目录<mutex>std::call_once函数例程:使用call_once实现的单例模式std::mutex类 -- 独占互斥锁成员函数std::recursive_mutex类 -- 递归互斥锁使用注意:描述:std::timed_mute

2024-09-10 22:05:06

目录C++实现字符串元音字母反转的巧妙方法示例方法一：利用数据结构存储元音位置和字符并反转代码实现1. 如何在C++中存储数字和字符并支持翻转2. 判断字符是否在列表中3. 巧

2024-09-10 22:05:04

2020-05-31

2021-06-03

2020-05-26

2021-04-24

2020-11-01

2020-05-26

2021-02-22

2020-06-19

2020-11-01

深入分析C++对象模型之移动构造函数

编译器合成移动构造函数的条件

编译器抑制合成移动构造函数的情形

移动操作并未使效率更高的情况

使用C#判断文件是否为图片的多种方法

QT 实现随机验证码功能

C# Winform截图指定控件范围内的图像的流程步骤

C++解决回调地狱问题的方法小结

C语言报错：Buffer Overflow的原因和解决办法

C++报错：Segmentation Fault的解决方案

Qt中QPushButton组件的使用详解

Qt实现手动切换多种布局的完美方案

一篇文章详解Qt中如何访问数据库

Qt 编译配置 Protobuf 的详细步骤

C++ STL iota 和 atoi 用法示例详解

C语言中输出空格的五种方法

C语言文件操作入门指南

Qt中暂停程序的几种方法小结

C语言中实现自定义数据类型的输入输出的方法和技巧

详解C/C++如何发送与接收Kafka消息

C++传值、传址、传引用的区别和选择小结

C++如何实现sha256算法

C语言中的断言函数assert详解

C++之assert推荐用法及注意事项

Qt中connect()函数及用法详解

深入解读C++ 内联函数inline|nullptr

vscode远程连接服务器(免密登录+远程开发)

C++实现LRU缓存的操作方法

使用C语言生成图片的base64编码的代码实现

C语言strcat函数详解：字符串追加的利器

C++之thread_local变量的一些用法

c++栈内存和堆内存的基本使用小结

C++11标准库互斥锁 <mutex> 详解

C++实现字符串元音字母反转的两种方法

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道