内核技术中文网»首页 论坛 圈点 查看内容

0 评论

0 收藏

分享

Linux内核之物理内存管理区

前言

前面我们了解了物理页面,知道物理页面的管理结构struct page的内容。

这里来看看物理内存的分区。

我们知道32位对于4GB,然后这个4GB分成了1GB的内核和3GB的用户。

1G的内核地址空间可访问全部的物理内存地址,3G的用户地址空间访问最大3G的物理内存地址。

因此在内核部分线性映射,肯定是无法实现的。怎么解决呢?

1、内核内存管理区

1GB的内核内存是分为两个部分,一部分是线性映射区域,一部分是高端内存(这里就是上一篇的疑惑点,这就解开了)。

一般0-768MB是线性的,剩下的可以映射到用户的内存区域,以及映射一些device。

线性的区域:ZONE_NORMAL

高端内存区域:ZONE_HGHMEM

这是因为32位只能最大映射到4GB,但是现在都是64位,这完全是够够的,那么64位的时候就不需要这个区域。

同时还有个区域。

DMA操作:ZONE_DMA

这个区域是因为ISA设备就不能在整个32位的地址空间中执行DMA操作,因为ISA设备只能访问物理内存的前16MB,所以在x86体系结构中会有一项ZONE_DMA的管理区域。

但是ARM中没有。

因此对于ARM32你需要了解两个区:

线性的区域:ZONE_NORMAL

高端内存区域:ZONE_HGHMEM

对于ARM64那么很明显就只需要一个区

线性的区域:ZONE_NORMAL

用户内存一年一一对应,因此无需多说,MMU也是如此。内核地址要通过MMU吗?这个问题留着,期待你的答案。我真不知道。

2、内存管理区描述符

对于这个内存管理区,内核也有个数据结构来管理 struct zone。 (这也是C语言面向对象的一种思想)

定义在include/linux/mmzone.h文件中。struct zone数据结构的主要成员如下。

[include/linux/mmzone.h]
struct zone {
  /* 读敏感域 */
  unsigned long watermark[NR_WMARK];
  long lowmem_reserve[MAX_NR_ZONES];
  struct pglist_data  *zone_pgdat;
  struct per_cpu_pageset __percpu *pageset;
  unsigned long     zone_start_pfn;
  unsigned long     managed_pages;
  unsigned long     spanned_pages;
  unsigned long     present_pages;
  const char     *name;

  /* 写敏感域 */
  ZONE_PADDING(_pad1_)struct free_area   free_area[MAX_ORDER];
  unsigned long     flags;
  spinlock_t     lock;
  ZONE_PADDING(_pad2_)spinlock_t     lru_lock;
  struct lruvec     lruvec;

  /* 内存管理区的统计信息 */
  ZONE_PADDING(_pad3_)atomic_long_t     vm_stat[NR_VM_ZONE_STAT_ITEMS];
  } ____cacheline_internodealigned_in_smp;

首先,struct zone是经常会被访问到的,因此这个数据结构要求以L1 Cache对齐,见____cacheline_internodealigned_in_smp属性。

struct zone总体来说可以分成以下3个部分。读敏感区域。写敏感区域。统计计数。

这里的ZONE_PADDING()是让zone->lock和zone->lru_lock这两个很热门的锁分布在不同的缓存行(cache line)中。

这里采用ZONE_PADDING()让其后面的变量与L1缓存行对齐,以提高该字段的并发访问性能,避免发生缓存伪共享(Cache False Sharing)。

另外,一个内存节点最多也就几个内存管理区,因此内存管理区数据结构不需要像struct page一样对数据结构的大小特别敏感,这里可以为了性能而浪费空间。

在内存管理开发过程中,内核开发者逐步发现有一些自旋锁竞争得非常厉害,很难获取。像 zone->lock 和zone->lru_lock 这两个锁有时需要同时获取,会导致比较严重的高速缓存伪共享问题,保证它们使用不同的缓存行是内核常用的一种优化技巧。

watermark:每个内存管理区在系统启动时会计算出 3 个水位值,分别是WMARK_MIN、WMARK_LOW 和 WMARK_HIGH 水位,这在页面分配器和kswapd页面回收中会用到。

lowmem_reserve:内存管理区中预留的内存。

zone_pgdat:指向内存节点。

pageset:用于维护Per-CPU上的一系列页面,以减少自旋锁的争用。

zone_start_pfn:内存管理区中开始页面的页帧号。

managed_pages:内存管理区中被伙伴系统管理的页面数量。

spanned_pages:内存管理区包含的页面数量。

present_pages:内存管理区里实际管理的页面数量。对一些体系结构来说,其值和spanned_pages相等。

free_area:管理空闲区域的数组,包含管理链表等。

lock:并行访问时用于对内存管理区保护的自旋锁。注意该锁是保护

struct zone数据结构本身,而不是内存管理区所描述的内存地址空间。

lru_lock:用于对内存管理区中LRU链表并发访问时进行保护的自旋锁。

lruvec:LRU链表集合。

vm_stat:内存管理区计数。

对于这个部分,参数要等你使用的时候再加深映像。关于ZONE_PADDING()和缓存行那些,我也暂时讲不清楚,等我改天学习一下,写个内存管理番外篇。

3、辅助操作函数

Linux 内核提供了几个常用的内存管理区的辅助操作函数,它们定义在include/linux/mmzone.h文件中。

#define for_each_zone(zone)          \
for (zone = (first_online_pgdat())->node_zones; \
zone;          \

zone = next_zone(zone))



static inline int is_highmem(struct zone *zone);

#define zone_idx(zone)    ((zone) - (zone)->zone_pgdat->node_zones)

其中,for_each_zone()用来遍历系统中所有的内存管理区; (这点代码有点奇怪)

is_highmem()函数用来检测内存管理区是否属于ZONE_HIGHMEM;

zone_idx()宏用来返回当前zone所在的内存节点的编号。

说明这个zone挺多的,内存中就是以这个位更粗的粒度去管理。

4、小结

上一章知道了物理页面,这一章紧接着学习了内存管理区,其实内存管理区是更大的概念。后面对于这个zone,也整个番外篇,好好聊聊内存管理中的zone到底是什么?

这里简单说一下,页相对于是要具体点,zone就是根据内存是不同功能或者权限什么的,把内存分成了不同的zone,然后进行统一管理。是体现在对内存的管控,页是对内存的分配。当然zone也是分配,是根据功能等进行分配的。

5、待解问题

内核地址映射需要MMU吗?

原文作者:摸肚子的小胖子

原文地址:http://t.csdn.cn/bWf2J(版权归原文作者所有,侵权联系删除

回复

举报 使用道具

全部回复
暂无回帖,快来参与回复吧
主题 1545
回复 0
粉丝 2
扫码获取每晚技术直播链接
快速回复 返回顶部 返回列表