# 精尽 Netty 源码解析 —— Buffer 之 Jemalloc（二）PoolChunk # 1. 概述 > 老艿艿：如下阐释的内容，参考 Hypercube [《自顶向下深入分析Netty（十）–JEMalloc分配算法》](https://www.jianshu.com/p/15304cd63175) 。为了提高内存**分配效率**并减少**内存碎片**，Jemalloc 算法将每个 Arena 切分成多个**小块** Chunk 。但是实际上，每个 Chunk 依然是**相当大**的内存块。因为在 Jemalloc 建议为 4MB ，Netty 默认使用为 16MB 。为了进一步提供提高内存**分配效率**并减少**内存碎片**，Jemalloc 算法将每个 Chunk 切分成多个**小块** Page 。一个典型的切分是将 Chunk 切分为 2048 块 Page ，Netty 也是如此，因此 Page 的大小为：`16MB / 2048 = 8KB` 。一个好的内存分配算法，应使得已分配内存块尽可能保持连续，这将大大减少内部碎片，由此 Jemalloc 使用[伙伴分配算法](https://svip.iocoder.cn/Netty/ByteBuf-3-2-Jemalloc-chunk/#)尽可能提高连续性。**伙伴分配算法**的示意图如下： > 可能很多胖友不了解【伙伴分配算法】，感兴趣的话，可以看看 [《伙伴分配器的一个极简实现》](https://coolshell.cn/articles/10427.html) 了解了解。 > > 当然，Netty PoolChunk 也是基于【伙伴分配算法】实现。 [![满二叉树](43-Netty 源码解析-Buffer 之 Jemalloc（二）PoolChunk.assets/01.png)](http://static.iocoder.cn/images/Netty/2018_09_04/01.png)满二叉树图中**最底层**表示一个被切分为 2048 个 Page 的 Chunk 块。自底向上，每一层节点作为上一层的子节点构造出一棵[满二叉树](https://baike.baidu.com/item/满二叉树)，然后按层分配满足要求的内存块。以待分配序列 8KB、16KB、8KB 为例分析分配过程( 假设每个 Page 大小 8KB )： 1. 8KB —— 需要一个 Page ，第 11 层满足要求，故分配 *2048* 节点即 **Page0** 。 2. 16KB —— 需要两个Page ，故需要在第 10 层进行分配，而 *1024* 的子节点 *2048* 已分配，从左到右找到满足要求的 *1025* 节点，故分配节点 *1025* 即**Page2** 和 **Page3** 。 3. 8KB —— 需要一个 Page ，第 11 层满足要求，但是 *2048* 已分配，从左到右找到 *2049* 节点即 **Page1** 进行分配。总结来说： - 分配结束后，已分配连续的 **Page0 - Page3** 。这样的连续内存块，大大减少内部碎片并提高**内存使用率**。 - 通过使用**满二叉树**这样的树结构，提升检索到可用 Page 的速度，从而提高内存**分配效率**。 # 2. PoolChunk `io.netty.buffer.PoolChunk` ，实现 PoolChunkMetric 接口，Netty 对 Jemalloc Chunk 的实现类。 ## 2.1 构造方法 ``` /** * 所属 Arena 对象 */ final PoolArena arena; /** * 内存空间。 * * @see PooledByteBuf#memory */ final T memory; /** * 是否非池化 * * @see #PoolChunk(PoolArena, Object, int, int) 非池化。当申请的内存大小为 Huge 类型时，创建一整块 Chunk ，并且不拆分成若干 Page * @see #PoolChunk(PoolArena, Object, int, int, int, int, int) 池化 */ final boolean unpooled; /** * TODO 芋艿 */ final int offset; /** * 分配信息满二叉树 * * index 为节点编号 */ private final byte[] memoryMap; /** * 高度信息满二叉树 * * index 为节点编号 */ private final byte[] depthMap; /** * PoolSubpage 数组 */ private final PoolSubpage[] subpages; /** * 判断分配请求内存是否为 Tiny/Small ，即分配 Subpage 内存块。 * * Used to determine if the requested capacity is equal to or greater than pageSize. */ private final int subpageOverflowMask; /** * Page 大小，默认 8KB = 8192B */ private final int pageSize; /** * 从 1 开始左移到 {@link #pageSize} 的位数。默认 13 ，1 << 13 = 8192 。 * * 具体用途，见 {@link #allocateRun(int)} 方法，计算指定容量所在满二叉树的层级。 */ private final int pageShifts; /** * 满二叉树的高度。默认为 11 。 */ private final int maxOrder; /** * Chunk 内存块占用大小。默认为 16M = 16 * 1024 。 */ private final int chunkSize; /** * log2 {@link #chunkSize} 的结果。默认为 log2( 16M ) = 24 。 */ private final int log2ChunkSize; /** * 可分配 {@link #subpages} 的数量，即数组大小。默认为 1 << maxOrder = 1 << 11 = 2048 。 */ private final int maxSubpageAllocs; /** * 标记节点不可用。默认为 maxOrder + 1 = 12 。 * * Used to mark memory as unusable */ private final byte unusable; /** * 剩余可用字节数 */ private int freeBytes; /** * 所属 PoolChunkList 对象 */ PoolChunkList parent; /** * 上一个 Chunk 对象 */ PoolChunk prev; /** * 下一个 Chunk 对象 */ PoolChunk next; // 构造方法一： 1: PoolChunk(PoolArena arena, T memory, int pageSize, int maxOrder, int pageShifts, int chunkSize, int offset) { 2: // 池化 3: unpooled = false; 4: this.arena = arena; 5: this.memory = memory; 6: this.pageSize = pageSize; 7: this.pageShifts = pageShifts; 8: this.maxOrder = maxOrder; 9: this.chunkSize = chunkSize; 10: this.offset = offset; 11: unusable = (byte) (maxOrder + 1); 12: log2ChunkSize = log2(chunkSize); 13: subpageOverflowMask = ~(pageSize - 1); 14: freeBytes = chunkSize; 15: 16: assert maxOrder < 30 : "maxOrder should be < 30, but is: " + maxOrder; 17: maxSubpageAllocs = 1 << maxOrder; 18: 19: // 初始化 memoryMap 和 depthMap 20: // Generate the memory map. 21: memoryMap = new byte[maxSubpageAllocs << 1]; 22: depthMap = new byte[memoryMap.length]; 23: int memoryMapIndex = 1; 24: for (int d = 0; d <= maxOrder; ++ d) { // move down the tree one level at a time 25: int depth = 1 << d; 26: for (int p = 0; p < depth; ++ p) { 27: // in each level traverse left to right and set value to the depth of subtree 28: memoryMap[memoryMapIndex] = (byte) d; 29: depthMap[memoryMapIndex] = (byte) d; 30: memoryMapIndex ++; 31: } 32: } 33: 34: // 初始化 subpages 35: subpages = newSubpageArray(maxSubpageAllocs); 36: } // 构造方法二： 38: /** Creates a special chunk that is not pooled. */ 39: PoolChunk(PoolArena arena, T memory, int size, int offset) { 40: // 非池化 41: unpooled = true; 42: this.arena = arena; 43: this.memory = memory; 44: this.offset = offset; 45: memoryMap = null; 46: depthMap = null; 47: subpages = null; 48: subpageOverflowMask = 0; 49: pageSize = 0; 50: pageShifts = 0; 51: maxOrder = 0; 52: unusable = (byte) (maxOrder + 1); 53: chunkSize = size; 54: log2ChunkSize = log2(chunkSize); 55: maxSubpageAllocs = 0; 56: } ``` - ``` arena ``` 属性，所属 Arena 对象。详细解析，见《精尽 Netty 源码解析 —— Buffer 之 Jemalloc（五）PoolArena》。 - `memory` 属性，内存空间。即**用于** `PooledByteBuf.memory` 属性，有 Direct ByteBuffer 和 `byte[]` 字节数组。 - ``` unpooled ``` 属性，是否非池化。 - `unpooled = false` ，池化，对应构造方法**一**。默认情况下，对于分配 16M **以内**的内存空间时，Netty 会分配一个 Normal 类型的 Chunk 块。并且，该 Chunk 块在使用完后，进行池化缓存，重复使用。 - `unpooled = true` ，非池化，对应构造方法**二**。默认情况下，对于分配 16M **以上**的内存空间时，Netty 会分配一个 Huge 类型的**特殊**的 Chunk 块。并且，由于 Huge 类型的 Chunk 占用内存空间较大，比较特殊，所以该 Chunk 块在使用完后，立即释放，不进行重复使用。 - 笔者对 Netty 对 Jemalloc 不同类型的内存块的整理，如下图所示：[![内存块分类](43-Netty 源码解析-Buffer 之 Jemalloc（二）PoolChunk.assets/02.png)](http://static.iocoder.cn/images/Netty/2018_09_04/02.png)内存块分类 - Jemalloc 基于【伙伴分配算法】分配 Chunk 中的 Page 节点。Netty 实现的伙伴分配算法中，构造了**两颗**满二叉树。因为满二叉树非常适合数组存储，Netty 使用两个字节数组 `memoryMap` 和 `depthMap` 来分别表示**分配信息**满二叉树、**高度信息**满二叉树。如下图所示：[![满二叉树](43-Netty 源码解析-Buffer 之 Jemalloc（二）PoolChunk.assets/03.png)](http://static.iocoder.cn/images/Netty/2018_09_04/03.png)满二叉树 - `maxOrder` 属性，满二叉树的高度。默认为 11 。注意，层高是从 0 开始。 - `maxSubpageAllocs` 属性，可分配的 Page 的数量。默认为 2048 ，在【第 17 行】的代码进行初始化。在第 11 层，可以看到 Page0 - Page2047 这 2048 个节点，也也符合 `1 << maxOrder = 11 << 11 = 2048` 的计算。 - 在【第 19 至 32 行】的代码，`memoryMap` 和 `depthMap` 进行满二叉树的初始化。 - 数组大小为 `maxSubpageAllocs << 1 = 2048 << 1 = 4096` 。 - 数组下标为**左图**对应的节点编号。在【第 23 行】的代码，从 `memoryMapIndex = 1` 代码可以看出，满二叉树的节点编号是**从 1 开始**。省略 0 是因为这样更容易计算父子关系：子节点加倍，父节点减半，例如：512 的子节点为 1024( `512 * 2` )和 1025( `512 * 2 + 1` )。 - 初始时，`memoryMap` 和 `depthMap` 相等，值为**节点高度**。例如： ``` memoryMap[1024] = depthMap[1024] = 10; ``` - 对应**右图**。 - 分配节点时， ``` depthMap ``` 的值保持不变 ( 因为，节点的高度没发生变化 )， ``` memoryMap ``` 的值发生变化 ( 因为，节点的分配信息发生变化 )。当一个节点被分配后，该节点的值设为 ``` unusable ``` ( 标记节点不可用。默认为 ``` maxOrder + 1 = 12 ``` ) 。并且，会更新祖先节点的值为其子节点较小的值 ( 因为，祖先节点共用该节点的 Page 内存；同时，一个父节点有两个子节点，一个节点不可用后，另一个子节点可能可用，所以更新为其子节点较小的值。 )。举个例子，下图表示随着节点 4 分配而更新祖先节点的过程，其中每个节点的第一个数字表示节点编号，第二个数字表示节点高度： ![例子](43-Netty 源码解析-Buffer 之 Jemalloc（二）PoolChunk.assets/04.png) 例子 - 节点 4 被**完全**分配，将高度值设置为 12 表示不可用。 - 节点 4 的父节点 2，将高度值更新为两个子节点的较小值。其他祖先节点亦然，直到高度值更新至根节点。 - ``` memoryMap ``` 数组的值，总结为 3 种情况： - 1、`memoryMap[id] = depthMap[id]` ，该节点没有被分配。 - 2、`最大高度 >= memoryMap[id] > depthMap[id]` ，至少有一个子节点被分配，不能再分配该高度满足的内存，但可以根据实际分配较小一些的内存。比如，上图中父节点 2 分配了子节点 4，值从 1 更新为 2，表示该节点不能再分配 8MB 的只能最大分配 4MB 内存，即只剩下节点 5 可用。 - 3、`memoryMap[id] = 最大高度 + 1` ，该节点及其子节点已被**完全**分配，没有剩余空间。 - Chunk 相关字段 - `chunkSize` 属性，Chunk 内存块占用大小。默认为 `16M = 16 * 1024KB` 。 - `log2ChunkSize` 属性，`log2(chunkSize)` 的结果。默认为 `log2( 16M ) = 24` 。代码如下： ``` private static final int INTEGER_SIZE_MINUS_ONE = Integer.SIZE - 1; // 32 - 1 = 31 private static int log2(int val) { // compute the (0-based, with lsb = 0) position of highest set bit i.e, log2 return INTEGER_SIZE_MINUS_ONE - Integer.numberOfLeadingZeros(val); } ``` - x - `freeBytes` 属性，剩余可用字节数。 - Page 相关字段 - `pageSize` 属性，每个 Page 的大小。默认为 `8KB = 8192B` 。 - `pageShifts` 属性，从 1 开始左移到 `pageSize` 的位数。默认 13 ，`1 << 13 = 8192` 。具体用于计算指定容量所在满二叉树的层级，详细解析，见 [「2.2.1 allocateRun」](https://svip.iocoder.cn/Netty/ByteBuf-3-2-Jemalloc-chunk/#) 。 - SubPage 相关字段 - 详细解析，见 [《精尽 Netty 源码解析 —— Buffer 之 Jemalloc（三）PoolSubpage》](http://svip.iocoder.cn/Netty/ByteBuf-3-3-Jemalloc-subpage) 。 - `subpages` 属性，PoolSubpage 数组。每个节点对应一个 PoolSubpage 对象。因为实际上，每个 Page 还是**比较大**的内存块，可以进一步切分成小块 SubPage 。在【第 35 行】的代码，调用 `#newSubpageArray(int size)` 方法，进行初始化。代码如下： ``` private PoolSubpage[] newSubpageArray(int size) { return new PoolSubpage[size]; } ``` - 默认情况下，数组大小为 `maxSubpageAllocs = 2048` 。 - `subpageOverflowMask` 属性，判断分配请求内存是否为 **Tiny/Small** ，即分配 Subpage 内存块。默认，-8192 。在【13 行】的代码进行初始化。对于 -8192 的二进制，除了首 bits 为 1 ，其它都为 0 。这样，对于小于 8K 字节的申请，求 `subpageOverflowMask & length` 都等于 0 ；对于大于 8K 字节的申请，求 `subpageOverflowMask & length` 都**不**等于 0 。相当于说，做了 `if ( length < pageSize )` 的计算优化。 - ChunkList 相关字段 - 详细解析，见 [《精尽 Netty 源码解析 —— Buffer 之 Jemalloc（四）PoolChunkList》](http://svip.iocoder.cn/Netty/ByteBuf-3-4-Jemalloc-chunkList) 。 - `parent` 属性，所属 PoolChunkList 对象。 - `prev` 属性，上一个 Chunk 对象。 - `next` 属性，下一个 Chunk 对象。内容比较“厚实”( 😈 字比较多 )，建议胖友再读一遍，再看下面的代码具体实现。 ## 2.2 allocate `#allocate(int normCapacity)` 方法，分配内存空间。代码如下： ``` 1: long allocate(int normCapacity) { 2: // 大于等于 Page 大小，分配 Page 内存块 3: if ((normCapacity & subpageOverflowMask) != 0) { // >= pageSize 4: return allocateRun(normCapacity); 5: // 小于 Page 大小，分配 Subpage 内存块 6: } else { 7: return allocateSubpage(normCapacity); 8: } 9: } ``` - 第 2 至 4 行：当申请的 `normCapacity` 大于等于 Page 大小时，调用 `#allocateRun(int normCapacity)` 方法，分配 Page 内存块。详细解析，见 [「2.2.1 allocateRun」](https://svip.iocoder.cn/Netty/ByteBuf-3-2-Jemalloc-chunk/#) 中。 - 第 5 至 8 行：调用 `#allocateSubpage(int normCapacity)` 方法，分配 Subpage 内存块。详细解析，见 [「2.2.1 allocateSubpage」](https://svip.iocoder.cn/Netty/ByteBuf-3-2-Jemalloc-chunk/#) 中。 ### 2.2.1 allocateRun `#allocateRun(int normCapacity)` 方法，分配 Page 内存块。代码如下： ``` /** * Allocate a run of pages (>=1) * * @param normCapacity normalized capacity * @return index in memoryMap */ 1: private long allocateRun(int normCapacity) { 2: // 获得层级 3: int d = maxOrder - (log2(normCapacity) - pageShifts); 4: // 获得节点 5: int id = allocateNode(d); 6: // 未获得到节点，直接返回 7: if (id < 0) { 8: return id; 9: } 10: // 减少剩余可用字节数 11: freeBytes -= runLength(id); 12: return id; 13: } ``` - 第 3 行：获得层级。 - 第 5 行：调用 ``` #allocateNode(int normCapacity) ``` 方法，分配节点。详细解析，见「2.2.3 allocateNode」中。 - 第 7 至 9 行：未获得到节点，直接返回。 - 第 11 行：调用 `#runLength(int id)` 方法，计算使用节点的字节数，并减少剩余可用字节数。代码如下： ``` private int runLength(int id) { // represents the size in #bytes supported by node 'id' in the tree return 1 << log2ChunkSize - depth(id); } private byte depth(int id) { return depthMap[id]; } ``` ### 2.2.2 allocateSubpage > 老艿艿：本小节，胖友先看完 [《精尽 Netty 源码解析 —— Buffer 之 Jemalloc（三）PoolSubpage》](http://svip.iocoder.cn/Netty/ByteBuf-3-3-Jemalloc-subpage) 。 `#allocateSubpage(int normCapacity)` 方法，分配 Subpage 内存块。代码如下： ``` /** * Create/ initialize a new PoolSubpage of normCapacity * Any PoolSubpage created/ initialized here is added to subpage pool in the PoolArena that owns this PoolChunk * * @param normCapacity normalized capacity * @return index in memoryMap */ 1: private long allocateSubpage(int normCapacity) { 2: // 获得对应内存规格的 Subpage 双向链表的 head 节点 3: // Obtain the head of the PoolSubPage pool that is owned by the PoolArena and synchronize on it. 4: // This is need as we may add it back and so alter the linked-list structure. 5: PoolSubpage head = arena.findSubpagePoolHead(normCapacity); 6: // 加锁，分配过程会修改双向链表的结构，会存在多线程的情况。 7: synchronized (head) { 8: // 获得最底层的一个节点。Subpage 只能使用二叉树的最底层的节点。 9: int d = maxOrder; // subpages are only be allocated from pages i.e., leaves 10: int id = allocateNode(d); 11: // 获取失败，直接返回 12: if (id < 0) { 13: return id; 14: } 15: 16: final PoolSubpage[] subpages = this.subpages; 17: final int pageSize = this.pageSize; 18: 19: // 减少剩余可用字节数 20: freeBytes -= pageSize; 21: 22: // 获得节点对应的 subpages 数组的编号 23: int subpageIdx = subpageIdx(id); 24: // 获得节点对应的 subpages 数组的 PoolSubpage 对象 25: PoolSubpage subpage = subpages[subpageIdx]; 26: // 初始化 PoolSubpage 对象 27: if (subpage == null) { // 不存在，则进行创建 PoolSubpage 对象 28: subpage = new PoolSubpage(head, this, id, runOffset(id), pageSize, normCapacity); 29: subpages[subpageIdx] = subpage; 30: } else { // 存在，则重新初始化 PoolSubpage 对象 31: subpage.init(head, normCapacity); 32: } 33: // 分配 PoolSubpage 内存块 34: return subpage.allocate(); 35: } 36: } ``` - 第 5 行：调用 `PoolArena#findSubpagePoolHead(int normCapacity)` 方法，获得对应内存规格的 Subpage 双向链表的 `head` 节点。详细解析，见 [《精尽 Netty 源码解析 —— Buffer 之 Jemalloc（五）PoolArena》](http://svip.iocoder.cn/Netty/ByteBuf-3-5-Jemalloc-Arena) 。 - 第 7 行：`synchronized` 加锁，分配过程会修改双向链表的结构，会存在**多线程**的情况。 - 第 8 至 10 行：调用 ``` #allocateNode(int d) ``` 方法，获得最底层的一个节点。 Subpage 只能使用二叉树的最底层的节点。 - 第 11 至 14 行：获取失败，直接返回。 - 第 20 行：减少剩余可用字节数。 - 第 23 至 34 行：分配 PoolSubpage 内存块。 - 第 23 行：调用 `#subpageIdx(int id)` 方法，获得节点对应的 `subpages` 数组的编号。代码如下： ``` private int subpageIdx(int memoryMapIdx) { return memoryMapIdx ^ maxSubpageAllocs; // remove highest set bit, to get offset } ``` - 去掉最高位( bit )。例如节点 2048 计算后的结果为 0 。 - 第 25 行：获得节点对应的 `subpages` 数组的 PoolSubpage 对象。 - 第 26 至 32 行：初始化 PoolSubpage 对象。 - 第 34 行：调用 `PoolSubpage#allocate()` 方法，分配 PoolSubpage 内存块。 ### 2.2.3 allocateNode `#allocateNode(int normCapacity)` 方法，分配节点。代码如下： ``` /** * Algorithm to allocate an index in memoryMap when we query for a free node * at depth d * * @param d depth * @return index in memoryMap */ 1: private int allocateNode(int d) { 2: int id = 1; 3: int initial = - (1 << d); // has last d bits = 0 and rest all = 1 4: // 获得根节点的指值。 5: // 如果根节点的值，大于 d ，说明，第 d 层没有符合的节点，也就是说 [0, d-1] 层也没有符合的节点。即，当前 Chunk 没有符合的节点。 6: byte val = value(id); 7: if (val > d) { // unusable 8: return -1; 9: } 10: // 获得第 d 层，匹配的节点。 11: // id & initial 来保证，高度小于 d 会继续循环 12: while (val < d || (id & initial) == 0) { // id & initial == 1 << d for all ids at depth d, for < d it is 0 13: // 进入下一层 14: // 获得左节点的编号 15: id <<= 1; 16: // 获得左节点的值 17: val = value(id); 18: // 如果值大于 d ，说明，以左节点作为根节点形成虚拟的虚拟满二叉树，没有符合的节点。 19: if (val > d) { 20: // 获得右节点的编号 21: id ^= 1; 22: // 获得右节点的值 23: val = value(id); 24: } 25: } 26: 27: // 校验获得的节点值合理 28: byte value = value(id); 29: assert value == d && (id & initial) == 1 << d : String.format("val = %d, id & initial = %d, d = %d", 30: value, id & initial, d); 31: 32: // 更新获得的节点不可用 33: setValue(id, unusable); // mark as unusable 34: // 更新获得的节点的祖先都不可用 35: updateParentsAlloc(id); 36: 37: // 返回节点编号 38: return id; 39: } ``` - 第 3 行：通过 `- (1 << d)` 计算，获得 `initial` 。用于【第 12 行】的代码，`id & initial` ，来保证，高度小于 `d` 会继续**循环**。 - 第 6 行：获得根节点( `id = 1` )的指值。代码如下： ``` private byte value(int id) { return memoryMap[id]; } ``` - 第 7 至 9 行：如果根节点的值，大于 `d` ，说明，第 `d` 层没有符合的节点，也就是说 `[1, d-1]` 层也没有符合的节点。即，当前 Chunk 没有符合的节点。 - 第 10 至 25 行：获得第 ``` d ``` 层，匹配的节点。因为 ``` val < d ``` 难以保证是第 ``` d ``` 层， ``` [0, d-1] ``` 层也可以满足 ``` val < d ``` ，所以才有 ``` id & initial ``` 来保证，高度小于 ``` d ``` 会继续循环。 - ← 第 15 行：`<< 1` 操作，进入下一层。获得**左节点**的编号。 - ← 第 17 行：获得左节点的值。 - → 第 19 行：如果值大于 `d` ，说明，以左节点作为根节点形成虚拟的虚拟满二叉树，没有符合的节点。此时，需要跳到**右节点**。 - → 第 21 行：`^ 1` 操作，获得**右节点**的编号。 - → 第 23 行：获得右节点的值。 - 【第 17 行】或者【第 23 行】的代码，会通过【第 12 行】的代码，结束循环。也就说，获得第 `d` 层，匹配的节点。 - 第 33 行：调用 `#setValue(int id, byte val)` 方法，设置获得的节点的值为 `unusable` ，表示不可用。代码如下： ``` private void setValue(int id, byte val) { memoryMap[id] = val; } ``` - 第 35 行：调用 `#updateParentsAlloc(int id)` 方法，更新获得的节点的祖先都不可用。详细解析，见 [「2.4.1 updateParentsAlloc」](https://svip.iocoder.cn/Netty/ByteBuf-3-2-Jemalloc-chunk/#) 。 - 第 38 行：返回节点编号。 ## 2.3 free > 老艿艿：本小节，胖友先看完 [《精尽 Netty 源码解析 —— Buffer 之 Jemalloc（三）PoolSubpage》](http://svip.iocoder.cn/Netty/ByteBuf-3-3-Jemalloc-subpage) 。 `#free(long handle)` 方法，释放指定位置的内存块。根据情况，内存块可能是 SubPage ，也可能是 Page ，也可能是释放 SubPage 并且释放对应的 Page 。代码如下： ``` /** * Free a subpage or a run of pages * When a subpage is freed from PoolSubpage, it might be added back to subpage pool of the owning PoolArena * If the subpage pool in PoolArena has at least one other PoolSubpage of given elemSize, we can * completely free the owning Page so it is available for subsequent allocations * * @param handle handle to free */ 1: void free(long handle) { 2: // 获得 memoryMap 数组的编号( 下标 ) 3: int memoryMapIdx = memoryMapIdx(handle); 4: // 获得 bitmap 数组的编号( 下标 )。注意，此时获得的还不是真正的 bitmapIdx 值，需要经过 `bitmapIdx & 0x3FFFFFFF` 运算。 5: int bitmapIdx = bitmapIdx(handle); 6: 7: // 释放 Subpage begin ~ 8: 9: if (bitmapIdx != 0) { // free a subpage bitmapIdx 非空，说明释放的是 Subpage 10: // 获得 PoolSubpage 对象 11: PoolSubpage subpage = subpages[subpageIdx(memoryMapIdx)]; 12: assert subpage != null && subpage.doNotDestroy; 13: 14: // 获得对应内存规格的 Subpage 双向链表的 head 节点 15: // Obtain the head of the PoolSubPage pool that is owned by the PoolArena and synchronize on it. 16: // This is need as we may add it back and so alter the linked-list structure. 17: PoolSubpage head = arena.findSubpagePoolHead(subpage.elemSize); 18: // 加锁，分配过程会修改双向链表的结构，会存在多线程的情况。 19: synchronized (head) { 20: // 释放 Subpage 。 21: if (subpage.free(head, bitmapIdx & 0x3FFFFFFF)) { 22: return; 23: } 24: // ↑↑↑ 返回 false ，说明 Page 中无切分正在使用的 Subpage 内存块，所以可以继续向下执行，释放 Page 25: } 26: } 27: 28: // 释放 Page begin ~ 29: 30: // 增加剩余可用字节数 31: freeBytes += runLength(memoryMapIdx); 32: // 设置 Page 对应的节点可用 33: setValue(memoryMapIdx, depth(memoryMapIdx)); 34: // 更新 Page 对应的节点的祖先可用 35: updateParentsFree(memoryMapIdx); 36: } ``` - 第 3 行：调用 `#memoryMapIdx(handle)` 方法，获得 `memoryMap` 数组的编号( 下标 )。代码如下： ``` private static int memoryMapIdx(long handle) { return (int) handle; } ``` - 第 5 行：调用 `#bitmapIdx(handle)` 方法，获得 `bitmap` 数组的编号( 下标 )。代码如下： ``` private static int bitmapIdx(long handle) { return (int) (handle >>> Integer.SIZE); } ``` - 注意，此时获得的还不是真正的 bitmapIdx 值，需要经过 `bitmapIdx & 0x3FFFFFFF` 运算，即【第 21 行】的代码。 - 第 9 至 26 行：释放 Subpage 内存块。 - 第 9 行：通过 `bitmapIdx !=0` 判断，说明释放的是 Subpage 内存块。 - 第 11 行：获得 PoolSubpage 对象。 - 第 17 行：调用 `PoolArena#findSubpagePoolHead(int normCapacity)` 方法，获得对应内存规格的 Subpage 双向链表的 `head` 节点。详细解析，见 [《精尽 Netty 源码解析 —— Buffer 之 Jemalloc（五）PoolArena》](http://svip.iocoder.cn/Netty/ByteBuf-3-5-Jemalloc-Arena) 。 - 第 19 行：`synchronized` 加锁，分配过程会修改双向链表的结构，会存在多线程的情况。 - 第 21 行：调用 ``` SubPage#free(PoolSubpage head, int bitmapIdx) ``` 方法，释放 Subpage 内存块。 - 如果返回 `false` ，说明 Page 中**无切分正在使用**的 Subpage 内存块，所以可以继续向下执行，释放 Page 内存块。 - 第 30 至 35 行：释放 Page 内存块。 - 第 31 行：增加剩余可用字节数。 - 第 33 行：调用 `#setValue(int id, byte val)` 方法，设置 Page 对应的节点**可用**。 - 第 35 行：调用 `#updateParentsAlloc(int id)` 方法，更新获得的节点的祖先**可用**。 ## 2.4 updateParents ### 2.4.1 updateParentsAlloc `#updateParentsAlloc(int id)` 方法，更新获得的节点的祖先都不可用。代码如下： ``` /** * Update method used by allocate * This is triggered only when a successor is allocated and all its predecessors * need to update their state * The minimal depth at which subtree rooted at id has some free space * * @param id id */ 1: private void updateParentsAlloc(int id) { 2: while (id > 1) { 3: // 获得父节点的编号 4: int parentId = id >>> 1; 5: // 获得子节点的值 6: byte val1 = value(id); 7: // 获得另外一个子节点的 8: byte val2 = value(id ^ 1); 9: // 获得子节点较小值，并设置到父节点 10: byte val = val1 < val2 ? val1 : val2; 11: setValue(parentId, val); 12: // 跳到父节点 13: id = parentId; 14: } 15: } ``` - 😈 注意，调用此方法时，节点 `id` 已经更新为**不可用**。 - 第 2 行：循环，直到**根**节点。 - 第 4 行：`>>> 1` 操作，获得父节点的编号。 - 第 5 至 11 行：获得子节点较小值，并调用 `#setValue(int id, int value)` 方法，设置到父节点。 - 第 13 行：跳到父节点。 ### 2.4.2 updateParentsFree `#updateParentsAlloc(int id)` 方法，更新获得的节点的祖先可用。代码如下： ``` /** * Update method used by free * This needs to handle the special case when both children are completely free * in which case parent be directly allocated on request of size = child-size * 2 * * @param id id */ 1: private void updateParentsFree(int id) { 2: // 获得当前节点的子节点的层级 3: int logChild = depth(id) + 1; 4: while (id > 1) { 5: // 获得父节点的编号 6: int parentId = id >>> 1; 7: // 获得子节点的值 8: byte val1 = value(id); 9: // 获得另外一个子节点的值 10: byte val2 = value(id ^ 1); 11: // 获得当前节点的层级 12: logChild -= 1; // in first iteration equals log, subsequently reduce 1 from logChild as we traverse up 13: 14: // 两个子节点都可用，则直接设置父节点的层级 15: if (val1 == logChild && val2 == logChild) { 16: setValue(parentId, (byte) (logChild - 1)); 17: // 两个子节点任一不可用，则取子节点较小值，并设置到父节点 18: } else { 19: byte val = val1 < val2 ? val1 : val2; 20: setValue(parentId, val); 21: } 22: 23: // 跳到父节点 24: id = parentId; 25: } 26: } ``` - 😈 注意，调用此方法时，节点 `id` 已经更新为可用。 - 第 3 行：获得当前节点的子节点的层级。 - 第 4 行：循环，直到**根**节点。 - 第 6 行：`>>> 1` 操作，获得**父**节点的编号。 - 第 7 至 10 行：获得两个**子**节点的值。 - 第 12 行：获得当前节点的层级。 - 第 14 至 16 行：两个子节点都可用，则调用 `#setValue(id, value)` 方法，直接设置父节点的层级( 注意，是 `logChild - 1` )。 - 第 17 至 21 行：两个子节点任一不可用，则`#setValue(id, value)` 方法，取子节点较小值，并设置到父节点。 - 第 24 行：跳到父节点。 ## 2.5 initBuf `#initBuf(PooledByteBuf buf, long handle, int reqCapacity)` 方法，初始化分配的内存块到 PooledByteBuf 中。代码如下： ``` 1: void initBuf(PooledByteBuf buf, long handle, int reqCapacity) { 2: // 获得 memoryMap 数组的编号( 下标 ) 3: int memoryMapIdx = memoryMapIdx(handle); 4: // 获得 bitmap 数组的编号( 下标 )。注意，此时获得的还不是真正的 bitmapIdx 值，需要经过 `bitmapIdx & 0x3FFFFFFF` 运算。 5: int bitmapIdx = bitmapIdx(handle); 6: // 内存块为 Page 7: if (bitmapIdx == 0) { 8: byte val = value(memoryMapIdx); 9: assert val == unusable : String.valueOf(val); 10: // 初始化 Page 内存块到 PooledByteBuf 中 11: buf.init(this, handle, runOffset(memoryMapIdx) + offset, reqCapacity, runLength(memoryMapIdx), arena.parent.threadCache()); 12: // 内存块为 SubPage 13: } else { 14: // 初始化 SubPage 内存块到 PooledByteBuf 中 15: initBufWithSubpage(buf, handle, bitmapIdx, reqCapacity); 16: } 17: } ``` - 第 3 行：调用 `#memoryMapIdx(handle)` 方法，获得 `memoryMap` 数组的编号( 下标 )。 - 第 5 行：调用 `#bitmapIdx(handle)` 方法，获得 `bitmap` 数组的编号( 下标 )。 - 第 6 至 11 行：通过 `bitmapIdx == 0` 判断出，内存块是 Page 。所以，调用 `PooledByteBuf#init(PoolChunk chunk, long handle, int offset, int length, int maxLength, PoolThreadCache cache)` 方法，初始化 Page 内存块到 PooledByteBuf 中。其中，`runOffset(memoryMapIdx) + offset` 代码块，计算 Page 内存块在 `memory` 中的开始位置。`runOffset(int id)` 方法，代码如下： ``` private int runOffset(int id) { // represents the 0-based offset in #bytes from start of the byte-array chunk int shift = id ^ 1 << depth(id); return shift * runLength(id); } private int runLength(int id) { // represents the size in #bytes supported by node 'id' in the tree return 1 << log2ChunkSize - depth(id); } ``` - 第12 至 16 行：通过 `bitmapIdx != 0` 判断出，内存块是 SubPage 。所以，调用 `#initBufWithSubpage(PooledByteBuf buf, long handle, int reqCapacity)` 方法，初始化 SubPage 内存块到 PooledByteBuf 中。详细解析，见 [「2.5.1 initBufWithSubpage」](https://svip.iocoder.cn/Netty/ByteBuf-3-2-Jemalloc-chunk/#) 。 ### 2.5.1 initBufWithSubpage `#initBufWithSubpage(PooledByteBuf buf, long handle, int reqCapacity)` 方法，初始化 SubPage 内存块到 PooledByteBuf 中。代码如下： ``` void initBufWithSubpage(PooledByteBuf buf, long handle, int reqCapacity) { initBufWithSubpage(buf, handle, bitmapIdx(handle), reqCapacity); } 1: private void initBufWithSubpage(PooledByteBuf buf, long handle, int bitmapIdx, int reqCapacity) { 2: assert bitmapIdx != 0; 3: 4: // 获得 memoryMap 数组的编号( 下标 ) 5: int memoryMapIdx = memoryMapIdx(handle); 6: // 获得 SubPage 对象 7: PoolSubpage subpage = subpages[subpageIdx(memoryMapIdx)]; 8: assert subpage.doNotDestroy; 9: assert reqCapacity <= subpage.elemSize; 10: 11: // 初始化 SubPage 内存块到 PooledByteBuf 中 12: buf.init( 13: this, handle, 14: runOffset(memoryMapIdx) + (bitmapIdx & 0x3FFFFFFF) * subpage.elemSize + offset, 15: reqCapacity, subpage.elemSize, arena.parent.threadCache()); 16: } ``` - 第 3 至 7 行：获得 SubPage 对象。 - 第 11 至于 15 行：调用 `PooledByteBuf#init(PoolChunk chunk, long handle, int offset, int length, int maxLength, PoolThreadCache cache)` 方法，初始化 SubPage 内存块到 PooledByteBuf 中。其中，`runOffset(memoryMapIdx) + (bitmapIdx & 0x3FFFFFFF) * subpage.elemSize + offset` 代码块，计算 SubPage 内存块在 `memory` 中的开始位置。 ## 2.6 destroy `#destroy()` 方法，从 Arena 中销毁当前 Chunk 。代码如下： ``` void destroy() { arena.destroyChunk(this); } ``` - 详细解析，见 [《精尽 Netty 源码解析 —— Buffer 之 Jemalloc（五）PoolArena》](http://svip.iocoder.cn/Netty/ByteBuf-3-5-Jemalloc-Arena) 。 ## 2.7 PoolChunkMetric `io.netty.buffer.PoolChunkMetric` ，PoolChunk Metric 接口。代码如下： ``` public interface PoolChunkMetric { /** * Return the percentage of the current usage of the chunk. */ int usage(); /** * Return the size of the chunk in bytes, this is the maximum of bytes that can be served out of the chunk. */ int chunkSize(); /** * Return the number of free bytes in the chunk. */ int freeBytes(); } ``` ------ PoolChunk 对 PoolChunkMetric 接口的实现，代码如下： ``` @Override public int usage() { final int freeBytes; synchronized (arena) { freeBytes = this.freeBytes; } return usage(freeBytes); } private int usage(int freeBytes) { // 全部使用，100% if (freeBytes == 0) { return 100; } // 部分使用，最高 99% int freePercentage = (int) (freeBytes * 100L / chunkSize); if (freePercentage == 0) { return 99; } return 100 - freePercentage; } @Override public int chunkSize() { return chunkSize; } @Override public int freeBytes() { synchronized (arena) { return freeBytes; } } ``` - `synchronized` 的原因是，保证 `freeBytes` 对其它线程的可见性。对应 Github 提交为 [a7fe6c01539d3ad92d7cd94a25daff9e10851088](https://github.com/netty/netty/commit/a7fe6c01539d3ad92d7cd94a25daff9e10851088) 。 > **Motivation**: > > As we may access the metrics exposed of PooledByteBufAllocator from another thread then the allocations happen we need to ensure we synchronize on the PoolArena to ensure correct visibility. > > **Modifications**: > > Synchronize on the PoolArena to ensure correct visibility. > > **Result**: > > Fix multi-thread issues on the metrics # 666. 彩蛋老艿艿有点二，在 `#allocateNode(int normCapacity)` 方法卡了很久。因为没看到 `memoryMap` 和 `depthMap` 数组，下标是从 1 开始的！！！我恨那。参考如下文章： - 占小狼 [《深入浅出Netty内存管理 PoolChunk》](https://www.jianshu.com/p/c4bd37a3555b) - Hypercube [《自顶向下深入分析Netty（十）–PoolChunk》](https://www.jianshu.com/p/70181af2972a)