字典树：前缀匹配的终极数据结构

1106 字

6 分钟

字典树：前缀匹配的终极数据结构

2026-04-26

算法

字典树

/

Trie

/

TypeScript

/

数据结构

概述#

Trie，也叫字典树或前缀树，是一种专门处理字符串前缀的数据结构。它把单词拆成字符路径，共享相同前缀的单词会共用同一段节点。

如果需要频繁做“是否存在某个单词”“是否存在某个前缀”“根据输入前缀自动补全”，Trie 比逐个字符串扫描更自然。

它的核心思想是：用树的路径表示字符串。

前置知识

树结构：每条边表示一个字符

哈希表 / 数组：节点子链接可用 Map 或数组存储

前缀匹配：查询过程沿字符逐层向下

问题定义#

假设有三个单词：

1
cat
2
car
3
dog

Trie 会把它们组织成：

1
root
2
├─ c
3
│  └─ a
4
│     ├─ t (word)
5
│     └─ r (word)
6
└─ d
7
   └─ o
8
      └─ g (word)

这样查询前缀 ca 时，只需要走 c -> a，就能知道有哪些单词共享这个前缀。

Trie 适合的问题：

需求	普通数组	Trie
判断单词是否存在	O(n * L)	O(L)
判断前缀是否存在	O(n * L)	O(L)
自动补全	需要扫描所有单词	定位前缀后遍历子树

其中 L 是单词长度，n 是单词数量。

核心原理：分步图解#

插入单词#

插入 cat：

1
root -> c -> a -> t

如果路径不存在，就创建节点；如果路径已存在，就复用节点。最后在 t 节点标记“这里是一个完整单词”。

查询单词#

查询 car：

从 root 出发；
依次查找 c、a、r；
如果路径断开，单词不存在；
如果路径存在，还要检查最后节点是否标记为完整单词。

查询前缀#

查询前缀只需要路径存在，不要求最后节点是完整单词。

这就是 search("ca") 和 startsWith("ca") 的区别。

算法精细步骤#

Trie 节点通常包含：

1
children: 当前字符到子节点的映射
2
isWord:   是否在这里结束一个完整单词

插入流程：

从根节点开始；
遍历单词的每个字符；
如果当前字符没有对应子节点，就创建；
移动到子节点；
遍历结束后标记 isWord = true。

查询流程类似，只是不创建节点；遇到缺失路径直接返回失败。

TypeScript 实现#

1
class TrieNode {
2
  readonly children = new Map<string, TrieNode>();
3
  isWord = false;
4
}
5

6
class Trie {
7
  private readonly root = new TrieNode();
8

9
  insert(word: string): void {
10
    let node = this.root;
11

12
    for (const char of word) {
13
      let next = node.children.get(char);
14

15
      if (!next) {
16
        next = new TrieNode();
17
        node.children.set(char, next);
18
      }
19

20
      node = next;
21
    }
22

23
    node.isWord = true;
24
  }
25

26
  search(word: string): boolean {
27
    const node = this.findNode(word);
28
    return node?.isWord ?? false;
29
  }
30

31
  startsWith(prefix: string): boolean {
32
    return this.findNode(prefix) !== null;
33
  }
34

35
  suggest(prefix: string, limit = 10): string[] {
36
    const start = this.findNode(prefix);
37
    if (start === null) return [];
38

39
    const result: string[] = [];
40

41
    const dfs = (node: TrieNode, path: string): void => {
42
      if (result.length >= limit) return;
43
      if (node.isWord) result.push(path);
44

45
      for (const [char, child] of node.children) {
46
        dfs(child, path + char);
47
      }
48
    };
49

50
    dfs(start, prefix);
51
    return result;
52
  }
53

54
  private findNode(text: string): TrieNode | null {
55
    let node = this.root;
56

57
    for (const char of text) {
58
      const next = node.children.get(char);
59
      if (!next) return null;
60
      node = next;
61
    }
62

63
    return node;
64
  }
65
}

工程优化：压缩 Trie#

标准 Trie 的节点数可能很多，尤其当字符串很长且分支较少时，会产生大量只有一个子节点的节点。

例如：

1
root -> a -> p -> p -> l -> e

如果中间节点没有分叉，可以压缩成：

1
root -> "apple"

这类结构叫压缩 Trie 或 Radix Tree。它减少节点数量，但实现更复杂，需要处理字符串片段的拆分和匹配。

工程中是否压缩，取决于数据规模、内存压力和查询性能要求。

应用与局限#

典型应用#

搜索框自动补全；
敏感词匹配；
拼写检查；
路由匹配；
IP 前缀匹配；
单词游戏和词典查询。

局限性#

相比哈希表，Trie 占用更多节点对象；
字符集越大，子节点映射越复杂；
删除单词需要清理无用节点；
只适合前缀相关问题，不适合任意子串匹配。

总结#

graph LR
    A[插入字符串] --> B[逐字符建边]
    B --> C[标记单词结束]
    C --> D[查询单词或前缀]

Trie 用树路径表示字符串。
共享前缀是 Trie 的核心优势。
search 要求完整单词存在，startsWith 只要求路径存在。
自动补全可以先定位前缀节点，再遍历子树。
数据量大时要关注节点数量和压缩策略。

字典树：前缀匹配的终极数据结构

https://www.hehonglei.cn/technology/trie/

作者

Honglei He

发布于

2026-04-26

许可协议

CC BY-NC-SA 4.0

递归：从上而下拆分问题的艺术

递归遍历：前序、中序、后序的 TypeScript 完全指南

概述#

问题定义#

核心原理：分步图解#

插入单词#

查询单词#

查询前缀#

算法精细步骤#

TypeScript 实现#

工程优化：压缩 Trie#

应用与局限#

典型应用#

局限性#

总结#

👋 欢迎光临