Posted 2020-02-28Updated 2026-01-30 Jaco Liu golang / tutorial32 minutes read (About 4795 words)

Go:rune 深度解析：从 Unicode 码点到字符串遍历的艺术

`rune` 的设计哲学

层面	Go 的选择	开发者收益
存储	字符串 = UTF-8 字节序列	兼容性高，节省空间（ASCII 高效）
操作	`rune` = Unicode 码点	逻辑清晰，避免字节错误
遍历	`range` 自动解码 UTF-8	开箱即用，安全可靠
扩展	标准库 + `x/text` 生态	支持归一化、断行、排序等高级需求

Go 之父 Rob Pike 的名言：
“UTF-8 is the native text format of Go. Strings are UTF-8. Period.”
而 rune，正是我们与这个“原生格式”对话的桥梁。

rune 类型核心概念

在 Golang 中，rune 是一个内置的基本数据类型，用于表示 Unicode 字符。它是 int32 类型的别名，本质上存储的是一个 Unicode 码点（Code Point），范围从 0 到 0x10FFFF，能够涵盖世界上几乎所有语言的字符，包括中文、日文、韩文以及表情符号（emoji）等多字节字符。‌

核心含义与设计目的

Unicode 支持‌：Golang 的字符串默认采用 UTF-8 编码，而 UTF-8 中某些字符（如中文或 emoji）需要多个字节表示。rune 类型确保每个字符被完整处理，避免因字节拆分导致的乱码或错误。‌
与 byte 的区别‌：byte 类型是 uint8 的别名，仅能表示单字节的 ASCII 字符（范围 0-255），而 rune 可表示所有 Unicode 字符（范围更大）。例如，中文字符“你”在 UTF-8 编码下占 3 个字节，但用 rune 可以作为一个整体处理。‌

常见应用场景

字符串遍历‌：使用 for _, r := range s 遍历字符串时，Go 会自动将每个字符转换为 rune，确保多字节字符不被破坏。‌
文本处理‌：在字符串转换、字符统计或操作（如反转、过滤）时，rune 切片（[]rune）能准确反映实际字符数量，而非字节数。‌
国际化支持‌：处理多语言文本时，rune 保证字符的完整性和正确性，是开发国际化应用的关键。‌

🌐 一、`rune` 是什么？—— 类型本质与设计哲学

在 Golang 中：

1	type rune = int32 // 源码定义（Go 1.9+ 使用 type alias 语法）

✅ rune 不是新类型，而是 int32 的语义别名
编译器将其视为同一种类型，但赋予其特殊含义：Unicode 码点（Code Point）。
🎯 设计目的：
让开发者能以字符（Character）为单位操作文本，而非字节（Byte）—— 这是 Go 对 Unicode 友好性的核心承诺。
✅ 码点范围：
rune 的取值需满足 Unicode 标准：
- 0x0000 ≤ r ≤ 0x10FFFF
- 排除 0xD800 ~ 0xDFFF（UTF-16 代理对范围，在 UTF-8 中非法）
📌 小知识：utf8.ValidRune(r) 可校验一个 rune 是否合法。

🔤 二、为什么需要 `rune`？—— 从 ASCII 到 Emoji 的演进困境

📉 问题起源：字符串 ≠ 字符数组

Go 的字符串是不可变的 UTF-8 字节序列：

1
2
3

s := "Go 世界 😂"
fmt.Println(len(s))          // → 12（字节数）
fmt.Println(len([]rune(s)))  // → 6（字符数：'G','o',' ','世','界','😂'）

字符	UTF-8 编码（十六进制）	字节数
`G`	`47`	1
`世`	`E4 B8 96`	3
`😂`	`F0 9F 98 82`	4

👉 若用 s[i] 按字节访问 "世"：

1 2	s := "世" fmt.Printf("%x ", s[0]) // → e4 ❌ 不是字符，只是首字节！

→ 乱码、截断、安全风险（如路径遍历）。

🆚 `rune` vs `byte`：维度不同

类型	底层	语义	范围	适用场景
`byte`	`uint8`	字节	0 ~ 255	二进制处理、I/O
`rune`	`int32`	Unicode 字符	U+0000 ~ U+10FFFF	文本处理、NLP、国际化

记住：**byte 是“存储单位”，rune 是“逻辑单位”**。

🔄 三、核心机制：`range` 字符串遍历时，Go 在做什么？

这是 Go 最优雅的设计之一：

s := "Hello, 世界! 😊"
for i, r := range s {
    fmt.Printf("i=%d, r=%U (%c)\n", i, r, r)
}

输出：

i=0,  r=U+0048 (H)
i=1,  r=U+0065 (e)
i=2,  r=U+006C (l)
i=3,  r=U+006C (l)
i=4,  r=U+006F (o)
i=5,  r=U+002C (,)
i=6,  r=U+0020 ( )
i=7,  r=U+4E16 (世)  ← 注意：索引 i=7，但 "世" 占 3 字节
i=10, r=U+754C (界)  ← i 跳到 10（7+3）
i=13, r=U+0021 (!)
i=14, r=U+0020 ( )
i=15, r=U+1F60A (😊)

🔍 底层发生了什么？

Go 解析 UTF-8 字节流，按编码规则识别每个字符边界；
将字节偏移（i） 和 解码后的码点（r） 同时返回；
自动跳过多字节字符的后续字节。

✅ 这就是为什么 range 遍历不会破坏多字节字符——它本质是UTF-8 解码器。

⚠️ 对比错误方式：

// 危险！按字节遍历
for i := 0; i < len(s); i++ {
    fmt.Printf("%c", s[i]) // "世" 输出：ã（三个乱码字符）
}

🛠 四、高频应用场景与最佳实践

✅ 场景 1：准确统计字符数

str := "résumé Café 🇫🇷"
byteLen := len(str)           // 21 字节
runeLen := utf8.RuneCountInString(str) // 12 字符（推荐，零分配）
// 或 len([]rune(str))        // 12 字符（分配内存，慎用大字符串）
```    
🔥 性能提示：`utf8.RuneCountInString` 比 `len([]rune(s))` 快 3~5 倍（无内存分配）。

---

#### ✅ 场景 2：安全修改字符串中的字符
字符串不可变 → 需转 `[]rune` 修改：
```go
s := "Hello"
r := []rune(s)
r[0] = 'J'          // 修改首字符
s2 := string(r)     // "Jello"

⚠️ 注意：string(r) 会重新进行 UTF-8 编码，且跳过非法 rune（如代理对）：

1 2	r := []rune{0xD800} // 非法代理对 s := string(r) // s == "" （静默丢弃！）

✅ 场景 3：反转字符串（正确版）

func Reverse(s string) string {
    r := []rune(s)
    for i, j := 0, len(r)-1; i < j; i, j = i+1, j-1 {
        r[i], r[j] = r[j], r[i]
    }
    return string(r)
}

fmt.Println(Reverse("Go 世界 😂")) // → "😂 界世 oG"

❌ 错误版（字节反转）：

func BadReverse(s string) string {
    b := []byte(s)
    for i, j := 0, len(b)-1; i < j; i, j = i+1, j-1 {
        b[i], b[j] = b[j], b[i]
    }
    return string(b) // 乱码："界世 oG"
}

⚠️ 五、常见误区与陷阱

❌ 误区 1：`rune` = “字符”？不完全是！

Unicode 中：

码点（Code Point）：一个数值（如 U+1F600），即 rune
字形（Grapheme Cluster）：用户眼中“一个字符”，可能含多个码点

例：印度语 “नि”（ni） = U+0928（na） + U+093F（i-vowel sign）
→ 2 个 rune，但显示为 1 个字形。

✅ 解决方案：使用 golang.org/x/text/unicode/norm 或 grapheme 库按字形分割。

❌ 误区 2：`[]rune` 总是安全的？

内存开销：[]rune(s) 为每个字符分配 4 字节，ASCII 文本膨胀 4 倍；
非法 rune 处理：转换时静默丢弃非法码点（见上文）；
组合字符丢失：如 "é" 可表示为：
- U+00E9（预组合字符）
- U+0065 + U+0301（e + acute accent）
  → []rune 无法感知二者等价，需先 NFC/NFD 归一化。

❌ 误区 3：所有“字符”都能打印？

r := rune(0x1F92F) // 🤯 (mind blown)
fmt.Printf("%c\n", r) // 正常输出

r = 0xD800 // 非法代理对
fmt.Printf("%c\n", r) // 输出 （Unicode 替代字符）

✅ 始终用 utf8.ValidRune(r) 校验！

📊 六、性能权衡：何时用 `[]rune`？

操作	推荐方式	理由
遍历字符	`for _, r := range s`	零分配，高效
统计字符数	`utf8.RuneCountInString(s)`	零分配，比 `len([]rune)` 快
修改/切片/反转字符	`[]rune(s)`	必须，但注意内存开销
仅检查 ASCII	`for i := 0; i < len(s); i++`	极致性能（如 HTTP header）

🌈 七、进阶：Emoji 与扩展字符支持

Go 完整支持 Unicode 15.1（Go 1.23+），包括：

✅ 所有 emoji（如 🫠, 🫶, 👩‍❤️‍👨）
✅ 变体选择符（如 👨 vs 👨‍🦰）
✅ 零宽连接符（ZWJ）序列：U+1F468 U+200D U+2764 U+FE0F U+200D U+1F468 → 👨‍❤️‍👨

但如前所述，单个 `rune` 无法表示这些序列——它们是多个码点组合的字形簇。

✅ length of string：
“len("世界") 是 6，因为它是字节数；而世界有 2 个字符——这正是 rune 存在的意义。”

如有特定场景（如高性能文本解析、正则表达式中的 Unicode 支持）。

最后最重要的提醒：在大部分业务场景中，最好优先采用 UTF-8 编码，避免可能带来的因字节拆分导致的乱码或错误 ⚠️

`rune` 🆚 `byte` ：两个常用于文本处理的内置类型，它们本质不同、用途迥异。以下是核心区别的清晰对比：

🔹 1. 底层类型与含义

类型	底层定义	语义含义	占用内存
`byte`	`type byte = uint8`	1 个字节（8 位无符号整数）	1 字节
`rune`	`type rune = int32`	1 个 Unicode 码点（Code Point）	4 字节

✅ 简单说：

byte 是存储单位——关注“占几个字节”；
rune 是逻辑单位——关注“是哪个字符”。

🔹 2. 表示范围

类型	数值范围	能表示的字符
`byte`	`0` ~ `255`	仅 ASCII 字符（如 `A`, `z`, `0`, `@`）
`rune`	`0` ~ `0x10FFFF`（需符合 Unicode 规范）	全球所有语言字符 + Emoji（如 `你`, `世`, `😂`, `🚀`）

⚠️ 注意：中文、日文、Emoji 等在 UTF-8 中需 2~4 字节，无法用单个 byte 完整表示。

🔹 3. 典型使用场景

场景	推荐类型	原因说明
读写文件、网络传输、二进制协议	`[]byte`	操作原始字节流
字符串字面量底层存储	`string`（本质是 `[]byte`）	Go 字符串 = UTF-8 字节序列
遍历/统计/修改字符	`rune` 或 `[]rune`	避免多字节字符被拆碎导致乱码
仅处理 ASCII 文本（如 HTTP header）	`byte`	高效无开销

🔹 4. 代码对比：直观感受差异

s := "Golang 世界 😍"

// ❌ 按 byte 遍历 → 乱码！
for i := 0; i < len(s); i++ {
    fmt.Printf("%c ", s[i])
}
// 输出：G o l a n g   ä ¸ ´ ç ¸    ð ß   （共 16 个“假字符”）

// ✅ 按 rune 遍历 → 正确！
for _, r := range s {
    fmt.Printf("%c ", r)
}
// 输出：G o l a n g   世 界   😍 （共 10 个真实字符）

// ✅ 统计字符数
fmt.Println("字节数：", len(s))           // → 16
fmt.Println("字符数：", len([]rune(s)))  // → 10

🔹 5. 关键注意事项

string 转 []byte：零拷贝（底层共享内存），仅类型转换：
1
b := []byte(s) // O(1)
string 转 []rune：需解码 UTF-8 + 分配内存，时间/空间开销大：
1
r := []rune(s) // O(n)，每字符 4 字节
→ 大文本慎用！统计字符数优先用 utf8.RuneCountInString(s)。
非法 rune（如 0xD800）在转为 string 时会被静默丢弃，需用 utf8.ValidRune(r) 校验。

💎 总结一句话：

用 byte 处理“字节”，用 rune 处理“字符” —— 这是避免 Go 中文本乱码的根本原则。

string 🆚 rune 还是 byte

在 Go 中，声明一个 string，其类型就是 string —— 它既不是 rune，也不是 rune 的别名，而是一个独立的、内置的、不可变的字节序列类型。

但它的底层存储内容是 UTF-8 编码的字节（[]byte），而非 rune（码点）数组。

✅ 准确理解如下：

项目	说明
类型	`string` 是 Go 的基本内置类型（basic type），与 `int`、`bool`、`rune`、`byte` 并列
底层表示	一个 `string` 在内存中由两部分组成： 1️⃣ 指向底层字节数组的指针 2️⃣ 长度（len）其内容是 UTF-8 编码的字节序列（即 `[]byte`）
与 `rune` 关系	❌ `string` ≠ `[]rune` ✅ `string` 可通过 `[]rune(s)` 转换为码点切片（需解码 UTF-8）
与 `byte` 关系	`string` 和 `[]byte` 可零成本相互转换（不复制数据，仅类型转换）： `[]byte(s)` → `string(b)`

🔍 示例验证类型：

package main

import "fmt"
import "reflect"

func main() {
    s := "Hello, 世界 😊"

    fmt.Printf("s 的类型是: %T\n", s)                // → string
    fmt.Printf("reflect.TypeOf(s): %v\n", reflect.TypeOf(s)) // → string

    // 底层是字节（UTF-8）
    fmt.Printf("s 的字节表示: %v\n", []byte(s))
    // → [72 101 108 108 111 44 32 228 184 150 231 149 140 32 240 159 152 138]

    // 转成 rune 才是码点
    runes := []rune(s)
    fmt.Printf("s 的 rune 表示: %v\n", runes)
    // → [72 101 108 108 111 44 32 19990 30028 32 128522]
    fmt.Printf("rune 类型: %T\n", runes[0])         // → int32（即 rune）
}

输出：

s 的类型是: string
reflect.TypeOf(s): string
s 的字节表示: [72 101 108 108 111 44 32 228 184 150 231 149 140 32 240 159 152 138]
s 的 rune 表示: [72 101 108 108 111 44 32 19990 30028 32 128522]
rune 类型: int32

📌 关键结论：

问题	答案
`string` 的类型是 `rune` 吗？	❌ 不是
`string` 的类型是 `[]rune` 吗？	❌ 不是
`string` 的底层是 `[]byte` 吗？	✅ 是的（UTF-8 编码字节）
能直接对 `string` 做字符级操作吗？	⚠️ 只能按字节索引（`s[i]` 返回 `byte`）；按字符操作需转 `[]rune` 或用 `range`

类比理解：

想象一本书：

string 是整本书（不可撕页）
底层 []byte 是按 UTF-8 编码印出的所有墨点（字节）
[]rune 是这本书的字符清单（每个汉字、字母、Emoji 算 1 项）
rune 是清单中的某一个字符的编号（Unicode 码点）

Go 让你既能高效操作“墨点”（byte），也能安全操作“字符”（rune），而 string 是二者的桥梁。

⚠️ 注意：`string` 底层存储是 UTF-8 编码的字节序列，但 `rune` 底层存储是码点（Unicode 码点）。

非常好的问题！这触及了 Golang 文本处理的核心设计思想。我们来逐层拆解，清晰理解 string 和 rune 的底层存储本质及二者关系：

✅ 一句话总结

string 存的是“编码后的字节”（UTF-8 bytes）；rune 存的是“编码前的编号”（Unicode Code Point）。
它们是同一字符在不同阶段的两种表示形式：
码点（rune） → UTF-8 编码 → 字节序列（string 的内容）

🔍 一、`rune`：Unicode 的“身份证号”（抽象概念 + 具体存储）

1. 语义上：rune = Unicode 码点（Code Point）

每个字符在 Unicode 标准中有一个唯一编号，称为 Code Point，记作 U+XXXX。
- U+0041 → 'A'
- U+4E16 → '世'
- U+1F600 → '😀'

2. 存储上：rune = int32（4 字节整数）

Go 用 int32 类型直接存储这个编号的数值：

var r rune = '世'
fmt.Printf("%d\n", r)   // → 19990 （十进制）
fmt.Printf("%x\n", r)   // → 4e16    （十六进制 = 0x4E16）
fmt.Printf("%T\n", r)   // → int32

✅ 所以：**rune 的底层就是一个 4 字节的整数，值 = Unicode 码点编号。
它不包含任何编码信息**，是“纯净”的字符标识。

📌 注意：rune 存的是码点值，不是 UTF-8/UTF-16 字节！编码是输出时才发生的。

🔍 二、`string`：UTF-8 的“快递包裹”（字节序列）

1. 语义上：string = UTF-8 编码后的字节流

Go 规定：字符串字面量（如 "世"）自动按 UTF-8 编码。
string 类型不记录编码方式，但它约定俗成且强制使用 UTF-8（Go 之父 Rob Pike 多次强调）。

2. 存储上：string = 只读的 []byte（底层是字节数组）

1
2
3

s := "世"
fmt.Printf("%T\n", s)        // → string
fmt.Printf("%v\n", []byte(s)) // → [228 184 150] （3 个字节）

而这 3 个字节 [228, 184, 150] 正是 U+4E16（即 19990）的 UTF-8 编码结果：

十六进制字节	二进制（8 位）	UTF-8 三字节模板
`0xE4`	`11100100`	`1110xxxx`（首字节）
`0xB8`	`10111000`	`10xxxxxx`（续字节）
`0x96`	`10010110`	`10xxxxxx`（续字节）

拼接有效位：0100 111000 010110 → 0100111000010110₂ = 0x4E16 = 19990

✅ 验证：

b := []byte{0xE4, 0xB8, 0x96}
s2 := string(b)
r2 := []rune(s2)[0]
fmt.Println(r2 == '世') // → true

📌 所以：**string 不存“字符”，只存“字符经 UTF-8 编码后的字节”**。

🔁 三、二者转换：编码（Encode）与解码（Decode）

操作	过程	是否分配内存	示例
`rune` → `string`	UTF-8 编码：将码点 `U+XXXX` 按 UTF-8 规则转为 1~4 字节	✅ 是（新建字节数组）	`string('世')` → `"世"`（3 字节）
`string` → `rune`	UTF-8 解码：将字节流按 UTF-8 规则解析为码点序列	✅ 是（新建 `int32` 数组）	`[]rune("世")` → `[19990]`

🔄 转换示意图：

1
2
3

rune (码点)          string (UTF-8 字节)
   19990      ──UTF-8编码──►  [0xE4, 0xB8, 0x96]
U+4E16 '世'  ◄─UTF-8解码───     "世"

🔔 这就是为什么 len("世") == 3（字节数），而 len([]rune("世")) == 1（字符数）。

🧩 四、类比理解（快递系统）

概念	现实类比	计算机对应
Unicode 码点	商品的唯一 SKU 编号（如 `SKU-4E16`）	`rune`（值 = 0x4E16）
UTF-8 编码	按规则把 SKU 打包成快递包裹（贴面单、装箱）	编码算法 → 字节序列
`string`	快递包裹本身（不可拆，内容是打包后的物品）	只读的 UTF-8 字节序列
`[]rune`	订单清单（列出所有 SKU 编号）	码点数组（`int32` 切片）

你想知道包裹里是什么商品？→ 拆包（解码） → 得到 SKU 清单（[]rune）
你想寄一个商品？→ 打包（编码） → 生成包裹（string）

⚠️ 重要补充：`rune` 并非总是“一个用户可见字符”

rune = 一个 Unicode 码点，但一个视觉字符（Grapheme）可能由多个码点组成：

s := "é"  // 可用两种方式表示：
// 1. U+00E9（预组合字符） → 1 个 rune
// 2. U+0065 + U+0301（e + 重音符） → 2 个 rune
fmt.Println(len([]rune("é"))) // 可能是 1 或 2！

→ 这属于 Unicode 归一化（Normalization） 问题，需用 golang.org/x/text/unicode/norm 处理。

✅ 终极总结表

特性	`rune`	`string`
本质	`int32` 类型别名	内置不可变类型
存储内容	Unicode 码点编号（整数值）	UTF-8 编码后的字节序列
内存占用	固定 4 字节/个	按 UTF-8 动态：1~4 字节/字符
操作单位	字符（码点级）	字节（但 `range` 可解码为 rune）
能否索引	`r[0]` → `int32`	`s[0]` → `byte`（首字节，非字符！）
典型用途	字符处理、NLP、国际化	文本存储、I/O、API 交互

记住这个黄金法则：
rune 是字符的“名字”（码点），string 是字符的“声音”（UTF-8 字节流）。
Go 让你在需要“叫名字”时用 rune，需要“发声音”时用 string，各司其职，安全高效。

理解以上机制，就可以避开很多 string、byte、rune 的错误用法和实现问题，从而提升代码的效率和可读性。

Go:rune 深度解析：从 Unicode 码点到字符串遍历的艺术

https://www.wdft.com/ecf03ec5.html

Author

Jaco Liu

Posted on

2020-02-28

Updated on

2026-01-30

Licensed under

#Go rune

Go:rune 深度解析：从 Unicode 码点到字符串遍历的艺术

rune 的设计哲学

rune 类型核心概念

核心含义与设计目的

常见应用场景

🌐 一、rune 是什么？—— 类型本质与设计哲学

🔤 二、为什么需要 rune？—— 从 ASCII 到 Emoji 的演进困境

📉 问题起源：字符串 ≠ 字符数组

🆚 rune vs byte：维度不同

🔄 三、核心机制：range 字符串遍历时，Go 在做什么？

🔍 底层发生了什么？

🛠 四、高频应用场景与最佳实践

✅ 场景 1：准确统计字符数

✅ 场景 3：反转字符串（正确版）

⚠️ 五、常见误区与陷阱

❌ 误区 1：rune = “字符”？不完全是！

❌ 误区 2：[]rune 总是安全的？

❌ 误区 3：所有“字符”都能打印？

📊 六、性能权衡：何时用 []rune？

🌈 七、进阶：Emoji 与扩展字符支持

但如前所述，单个 rune 无法表示这些序列——它们是多个码点组合的字形簇。

最后最重要的提醒：在大部分业务场景中，最好优先采用 UTF-8 编码，避免可能带来的因字节拆分导致的乱码或错误 ⚠️

rune 🆚 byte ：两个常用于文本处理的内置类型，它们本质不同、用途迥异。以下是核心区别的清晰对比：

🔹 1. 底层类型与含义

🔹 2. 表示范围

🔹 3. 典型使用场景

🔹 4. 代码对比：直观感受差异

🔹 5. 关键注意事项

💎 总结一句话：

string 🆚 rune 还是 byte

✅ 准确理解如下：

🔍 示例验证类型：

📌 关键结论：

类比理解：

⚠️ 注意：string 底层存储是 UTF-8 编码的字节序列，但 rune 底层存储是码点（Unicode 码点）。

✅ 一句话总结

🔍 一、rune：Unicode 的“身份证号”（抽象概念 + 具体存储）

1. 语义上：rune = Unicode 码点（Code Point）

2. 存储上：rune = int32（4 字节整数）

🔍 二、string：UTF-8 的“快递包裹”（字节序列）

1. 语义上：string = UTF-8 编码后的字节流

2. 存储上：string = 只读的 []byte（底层是字节数组）

🔁 三、二者转换：编码（Encode）与解码（Decode）

🔄 转换示意图：

🧩 四、类比理解（快递系统）

⚠️ 重要补充：rune 并非总是“一个用户可见字符”

✅ 终极总结表

理解以上机制，就可以避开很多 string、byte、rune 的错误用法和实现问题，从而提升代码的效率和可读性。

Author

Posted on

Updated on

Licensed under

Catalogue

Recents

Categories

Tags

CLUSTRMAPS

Advertisement

`rune` 的设计哲学

🌐 一、`rune` 是什么？—— 类型本质与设计哲学

🔤 二、为什么需要 `rune`？—— 从 ASCII 到 Emoji 的演进困境

🆚 `rune` vs `byte`：维度不同

🔄 三、核心机制：`range` 字符串遍历时，Go 在做什么？

❌ 误区 1：`rune` = “字符”？不完全是！

❌ 误区 2：`[]rune` 总是安全的？

📊 六、性能权衡：何时用 `[]rune`？

但如前所述，单个 `rune` 无法表示这些序列——它们是多个码点组合的字形簇。

`rune` 🆚 `byte` ：两个常用于文本处理的内置类型，它们本质不同、用途迥异。以下是核心区别的清晰对比：

⚠️ 注意：`string` 底层存储是 UTF-8 编码的字节序列，但 `rune` 底层存储是码点（Unicode 码点）。

🔍 一、`rune`：Unicode 的“身份证号”（抽象概念 + 具体存储）

🔍 二、`string`：UTF-8 的“快递包裹”（字节序列）

⚠️ 重要补充：`rune` 并非总是“一个用户可见字符”