详解GO语言中[]byte与string的两种转换方式和底层实现

来自：网络

时间：2024-06-07

阅读：

//[]byte转string
func b2s(b []byte) string {
    return *(*string)(unsafe.Pointer(&b))
}
 
//string转[]byte
func s2b(s string) (b []byte) {
    bh := (*reflect.SliceHeader)(unsafe.Pointer(&b))
    sh := (*reflect.StringHeader)(unsafe.Pointer(&s))
    bh.Data = sh.Data
    bh.Cap = sh.Len
    bh.Len = sh.Len
    return b
}

为什么不用我们常见的string和[]byte的转换方式呢？这样做是怎么提高性能的呢？...

带着这些疑问，今天将分享下并总结string和[]byte的转换方式，不同的转换方式之间的实现和区别！

两种转换方式

如果此时此刻你刚好遇到面试官问你string和[]byte如何进行转换，有几种方式？你能答上来吗

反正在写这篇文章之前小许估计是答不出来的，哈哈！

毕竟知道的越多，不知道的也越多嘛

那今天我们就来聊聊，继续往下读之前，我们先了解下这两种数据类型：

string和[]byte

上图中可以看出 stringStruct和slice还是有一些相似之处，str和array指针指向底层数组的地址，len代表的就是数组长度。

关于string类型，在go标准库中官方说明如下：

// string is the set of all strings of 8-bit bytes, conventionally but not
// necessarily representing UTF-8-encoded text. A string may be empty, but
// not nil. Values of string type are immutable.

type string string

string是8位字节的集合，string的定义在上图中左侧，通常但不一定代表UTF-8编码的文本。string可以为空，但是不能为nil，并且string的值是不能改变的。

为什么string类型没有cap字段

string的不可变性，也就不能直接向底层数组追加元素，所以不需要Cap。

而[]byte就是一个byte类型的切片，切片本质也是一个结构体。

这里我们先记住下这两种数据类型的特点，对后面的了解两者的转换有帮助！

标准方式

Golang中string与[]byte的互换，这是我们常用的，也是立马能想到的转换方式，这种方式称为标准方式。

// string 转 []byte
s1 := "xiaoxu"
b := []byte(s1)

// []byte 转 string
s2 := string(b)

那还有其他方式吗？当然有的,那就是强转换

强转换方式

强转换方式是通过unsafe和reflect包来实现的，代码如下：

//[]byte转string
func b2s(b []byte) string {
    return *(*string)(unsafe.Pointer(&b))
}
 
//string转[]byte
func s2b(s string) (b []byte) {
    bh := (*reflect.SliceHeader)(unsafe.Pointer(&b))
    sh := (*reflect.StringHeader)(unsafe.Pointer(&s))
    bh.Data = sh.Data
    bh.Cap = sh.Len
    bh.Len = sh.Len
    return b
}

可以看出利用reflect.SliceHeader(代表一个运行时的切片) 和 unsafe.Pointer进行指针替换。

为什么可以这么做呢？

前面我们在讲string和[]byte类型的时候就提了，因为两者的底层结构的字段相似！

array和str的len是一致的，而唯一不同的就是cap字段，所以他们的内存布局上是对齐的。

分析

我们看下这两种转换方式底层是如何实现的，这些实现代码在标准库中都是有的，下面底层实现的代码来自Go 1.18.6版本。

标准方式底层实现

string转[]byte底层实现

先看string转[]byte的实现，（实现源码在 src/runtime/string.go 中）

const tmpStringBufSize = 32

//长度32的数组
type tmpBuf [tmpStringBufSize]byte

//时间函数
func stringtoslicebyte(buf *tmpBuf, s string) []byte {
    var b []byte
    //判断字符串长度是否小于等于32
    if buf != nil && len(s) <= len(buf) {
        *buf = tmpBuf{}
        b = buf[:len(s)]
    } else {
        //预定义数组长度不够，重新分配内存
        b = rawbyteslice(len(s))
    }
    copy(b, s)
    return b
}

// rawbyteslice allocates a new byte slice. The byte slice is not zeroed.
//rawbyteslice函数 分配一个新的字节片。字节片未归零
func rawbyteslice(size int) (b []byte) {
    cap := roundupsize(uintptr(size))
    p := mallocgc(cap, nil, false)
    if cap != uintptr(size) {
        memclrNoHeapPointers(add(p, uintptr(size)), cap-uintptr(size))
    }

    *(*slice)(unsafe.Pointer(&b)) = slice{p, size, int(cap)}
    return
}

上面代码可以看出string转[]byte是，会根据字符串长度来决定是否需要重新分配一块内存。

• 预先定义了一个长度为32的数组

• 若字符串的长度不超过这个长度32的数组，copy函数实现string到[]byte的拷贝

• 若字符串的长度超过了这个长度32的数组，重新分配一块内存了，再进行copy

[]byte转string底层实现

再看[]byte转string的实现,（实现源码在 src/runtime/string.go 中）

const tmpStringBufSize = 32

//长度32的数组
type tmpBuf [tmpStringBufSize]byte

//实现函数
func slicebytetostring(buf *tmpBuf, ptr *byte, n int) (str string) {
    ...
    if n == 1 {
        p := unsafe.Pointer(&staticuint64s[*ptr])
        if goarch.BigEndian {
            p = add(p, 7)
        }
        stringStructOf(&str).str = p
        stringStructOf(&str).len = 1
        return
    }

    var p unsafe.Pointer
    //判断字符串长度是否小于等于32
    if buf != nil && n <= len(buf) {
        p = unsafe.Pointer(buf)
    } else {
        p = mallocgc(uintptr(n), nil, false)
    }
    stringStructOf(&str).str = p
    stringStructOf(&str).len = n
    //拷贝byte数组至字符串
    memmove(p, unsafe.Pointer(ptr), uintptr(n))
    return
}

跟string转[]byte一样，当数组长度超过32时，同样需要调用mallocgc分配一块新内存

强转换底层实现

从标准的转换方式中，我们知道如果字符串长度超过32的话，会重新分配一块新内存，进行内存拷贝。

//string转[]byte
func s2b(s string) (b []byte) {
    bh := (*reflect.SliceHeader)(unsafe.Pointer(&b))
    sh := (*reflect.StringHeader)(unsafe.Pointer(&s))
    bh.Data = sh.Data
    bh.Cap = sh.Len
    bh.Len = sh.Len
    return b
}

强转换过程中，通过神奇的unsafe.Pointer指针

• 任何类型的指针 *T 都可以转换为unsafe.Pointer类型的指针，可以存储任何变量的地址

• unsafe.Pointer 类型的指针也可以转换回普通指针，并且可以和类型*T不相同

refletc包的 reflect.SliceHeader 和 reflect.StringHeader分别代表什么意思？

reflect.SliceHeader：slice类型的运行时表示形式

reflect.StringHeader：string类型的运行时表示形式

//slice在运行时的描述符
type SliceHeader struct {      
     Data uintptr
     Len  int
    Cap  int
}

//string在运行时的描述符
type StringHeader struct {
    Data uintptr
    Len  int
}

*(reflect.SliceHeader)(unsafe.Pointer(&b)) 的目的就是通过unsafe.Pointer 把它们转换为 *reflect.SliceHeader 指针。

而运行时表现形式 SliceHeader 和 StringHeader，而这两个结构体都有一个 Data 字段，用于存放指向真实内容的指针。

[]byte 和 string之间的转换，就可以理解为是通过 unsafe.Pointer 把 *SliceHeader 转为 *StringHeader，也就是 *[]byte 和 *string之间的转换。

那么我们就可以理解相对于标准转换方式，强转换方式的优点在哪了！

直接替换指针的指向，避免了申请新内存（零拷贝），因为两者指向的底层字段Data地址相同

总结

今天和大家一起了解了[]byte和string类型，以及[]byte和string的两种转换方式。

不过Go语言提供给我们使用的还是标准转换方式，主要是因为在你不确定安全隐患的情况下，使用强转化方式可能不必要的问题。

不过像fasthttp那样，对程序对运行性能有高要求，那就可以考虑使用强转换方式！

目录前言一、响应html页面 1、我们首先定义一个存放模板文件的templates文件夹 2、让程序进行页面渲染和加载 3、通过请求来响应页面 4、启动测试 5、静态文件处理

2024-10-20 21:49:39

目录一. errors的基本应用二. 错误类型的比较三. error的扩展 3.1 自定义error 3.2 Unwrap与Nested error 3.3 errors.Is方法与错误分类 3.4 errors.As方法与错误信

2024-10-20 21:49:21

目录错误类型新建错误错误解析错误处理总结错误类型 errorString错误是程序中处理逻辑和系统稳定新的重要组成部分。在go语言中内置错误如下：// The error built-in int

2024-10-20 21:49:12

目录 Go语言的io输入输出流 go语言输入输出在io库中上述只是输入输出流的基本用法常用的类型有总结 Go语言的io输入输出流Go语言的输入输出流不如其他语言那么直观

2024-10-20 21:49:02

目录 1. 介绍 2. vendor 目录位置 3. 搜索顺序 4. vendor 的不足1. 介绍自 Go 1.6 起，vendor 机制正式启用，它允许把项目的依赖放到一个位于本项目的 vendor 目录中，这个 vendo

2024-10-18 23:12:01

目录 go中Reader Writer接口定义 os.File对象中的RW实现代码 bufio.Reader中的RW实现代码 bytes.Buffer中的RW实现代码我们在对文件进行io操作的时候，经常看到需要我们传递一

2024-10-18 23:11:52

目录 select 语句的基本用法示例代码示例 1：从多个通道接收数据示例 2：实现超时机制示例 3：非阻塞的通道操作 select 语句的注意事项高级用法在 Go 语言中，select

2024-10-18 23:11:43

目录 1.延迟执行、定时任务 2.超时控制 go time.After 定时器示例 3.time.Sleep和time.After的差异 time.After是一个非常实用的函数，它返回一个用于读取的单向通道（<-cha

2024-10-18 23:11:35

目录面试内容：面试内容：支持设定过期时间，精度到秒支持设定最大内存，当内存超出时做出合适的处理支持并发安全要求按照以下接口实现SetMemory(size string) bool Set(key s

2024-10-18 23:11:26

目录 Map 简介 Map 定义 Map Iteration Map 的线程安全 map 底层原理哈希函数哈希冲突 Growing map扩容双倍扩容 Growing过程避免溢出代码分析

2024-10-18 23:11:17

目录一、Timer定时器 1. 创建Timer 2. 停止Timer 3. 重置Timer 4. time.AfterFunc 5. time.After 二、Ticker定时器 1. 创建Ticker 2. 监听Ticker事件 3. 停止T

2024-10-14 19:47:39

保证与外部 api 交互时的应用程序稳定性至关重要。go 提供了完善的错误处理机制，让您优雅地捕捉来自外部 api 的错误。首先使用 error 接口指示操作成功与否，其次 if 语句检查

2024-09-30 00:06:02

目录 Golang字符串处理库strings 1. 导入strings包 2. 字符串的查找 1. 判断字符串是否包含子串 2. 判断某个字符串是否包含了多个字符串中的某一个 3. 字符串计数 4.

2024-09-29 23:28:06

目录1. 安装GO1.1 下载&安装1.2 配置相关环境变量1.3 检查安装2. 配置IDEA2.1 安装GO插件2.2 配置GOROOT2.3 配置GOPATH3. GO HelloWorld总结1. 安装GO1.1 下载&安装进入GO

2024-08-28 19:53:16

目录Get请求Post请求最近在研究钉钉机器人，发现钉钉的第三方接口有时需要用Get或者Post请求访问，虽然说可以通过Apifox直接模拟发送请求，但是我还是想研究一个如何使用Golang来

2024-08-28 19:53:13

目录并发（Concurrency）并行（Parallelism）关系与区别Go语言，由Google的Robert Griesemer、Rob Pike和Ken Thompson于2009年开发，是一种静态类型、垃圾回收、多线程并发的编程语言。

2024-08-28 19:53:11

目录一、选择GO的原因二、GO解决的并发问题方法1：使用sync.WaitGroup方法2：使用ErrGroup库一、选择GO的原因作为一个后端开发，日常工作中接触最多的两门语言就是PHP和GO了。无

2024-08-28 19:53:09

单链表（Single Linked List）是链表数据结构的一种实现方式，它包含一系列节点（Node），每个节点都包含一个数据域和一个指向下一个节点的指针。与数组相比，链表的一个主要优点是它们可

2024-08-28 19:53:07

目录MongoDB 安装(Docker)安装 MongoDB Go 驱动基础代码使用 Go Driver 连接到 MongoDB在 Go 里面使用 BSON 对象CRUD 操作插入文档更新文档查询文档删除文档下一步总结Mong

2024-08-28 19:53:05

目录关键术语介绍创建表格读取表格修改表格样式设置关键术语介绍为了方便开源库的快速上手，我们先来了解 excel 中的几个关键术语，如下图所示，①为sheet，也就是表格中的页签；②为

2024-08-28 19:53:03

目录一、Go Web框架的基本原理二、编写一个简单的Web框架1. 创建HTTP服务器2. 实现路由3. 添加中间件4. 使用模板引擎一、Go Web框架的基本原理在编写Web框架之前，我们需要了

2024-08-28 19:53:00

目录Go程序是如何编译的从hello RdrB1te开始Go 编译过程Go程序是如何运行起来的Go程序的入口？总结Go程序是如何编译的从hello RdrB1te开始package main import "fmt" f

2024-08-28 19:52:59

目录 1、使用标准库中的encoding/json包 2、使用第三方包3、decode 4、注意5、更灵活地使用JSON使用json.RawMessage使用interface{}在Go语言中，处理JSON数据通常涉及编码（将

2024-08-28 19:52:54

目录支持的语句逻辑与算术运算流程控制高级语句规则语法的解析定义规则语法编写解析器语法解析器生成语法树遍历语法树生成语句表达式规则语法的执行支持自定义对象注入支持

2024-08-28 19:52:52

目录一、中间件的概念二、go原生http中使用中间件的方法三、go微服务框架Kratos使用中间件的方法一、中间件的概念在go语言中，中间件是一种用于处理http请求的开发模式，允许开

2024-08-28 19:52:50

目录websocket的简单使用改成自定义的协议生产的部署很多APP都需要主动向用户推送消息，这就需要用到长连接的服务，即我们通常提到的websocket，同样也是使用socket服务，通信协议

2024-08-28 19:52:47

main函数本身也是一个Goroutine。在Go语言中，main函数是程序的入口点。当程序启动时，Go运行时会创建一个名为main的Goroutine，并在其中执行main函数的代码。这个main Goroutine

2024-08-28 19:52:41

目录1. 使用互斥锁(Mutex)2. 使用channel3. 读写锁(sync.RWMutex)4. 原子操作(sync/atomic包)5. sync.Once1. 使用互斥锁(Mutex)互斥锁（Mutex）是一种常用的同步原语，用于防止多

2024-08-28 19:52:39

安装 Viper：首先，你需要确保已经安装了 Viper。可以通过运行以下命令来安装 Viper：go get github.com/spf13/viper创建 YAML 配置文件：创建一个配置文件 config.yaml，包含数据

2024-08-28 19:52:37

目录如何使用Go语言实现接口继承？示例代码原因和解决方案总结如何使用Go语言实现接口继承？在Go语言中，接口（interface）是一种定义方法集合的类型，它并不包含方法的具体实现，只是规

2024-08-28 19:52:35

2020-11-25

2020-12-15

2020-12-19

2020-12-24

2020-11-10

2020-12-24

2020-09-29

2020-12-19

2020-12-29

2020-12-21

详解GO语言中[]byte与string的两种转换方式和底层实现

目录

两种转换方式

string和[]byte

标准方式

强转换方式

分析

标准方式底层实现

强转换底层实现

总结

热点内容

免费资源网

在线工具

扫一扫随时看

本站下载频道