MINDSHARE：使用 BINARY NJA 分析 BSD 内核的未初始化内存泄露（上）

返回首页　

设为首页　

加入收藏　

今天是:

网站首页电脑主板电脑cpu 电脑内存电脑硬盘电脑显卡电脑电源显示器电脑配件电脑维修

MINDSHARE：使用 BINARY NJA…
ARM处理器的内存对齐处理
值得入手高性价比笔记本-传舟…
如何预约联想笔记本维修售后…
广州联想专卖店维修售后｜联…
电脑自动重启怎么解决？
炎炎夏日给电脑降温!CPU酷暑…
手掌大小！小米桌面迷你电脑…
鹅鹅鸭或鹅鸭杀或鹅人杀闪退…
小米桌面迷你电脑配置曝光
Win10系统不会查看自己的电脑…
Win10电脑怎么查看配置 Win1…
消息称英伟达 RTX 4080 显卡…
下一代显卡到底如何供电？英…
显卡天梯图
显卡行情_泡泡网
矿难、缺货、涨价显卡市场的…
带队参加空间电源产业计量测…
智能电网建设这类仪器仪表成…
充电桩计量性能究竟怎样能否…
电能计量芯片
沈阳超高压局完成各变电站站…
新闻_上网本报价_导购_行情_…
盘点六大原厂闪存品牌的高品…
3大件：推土机大降为求一战 …
深圳联想专业笔记本维修售后…
七彩虹（Colorful） SL500系…
华硕官方授权笔记本维修中心…
58同城、360等家电维修平台存…
【产业互联网周报】博通610亿…
北京近两日新增53例本土感染…
深城交最新公告：联想北京减…
瓜子二手车软件下载-瓜子二手…
乔布斯编号电脑预计成交价26…
赛力斯：关于公司提供担保的…
一汽富维：关于控股子公司为…
好二手房怎么找？12月第1周大…
给显示器加墨水屏？这些厂商…
笔记本电脑屏幕
显示器图片设计
3DMax显示屏贴图
电脑显示器液晶显示器平板剪…
电脑内存基础必备知识
电脑总是蓝屏英文怎么回事
微软承认 11 月更新导致 Win…
手机内存跟电脑内存有什么区…
ASCII编码将英文存储到计算机
电脑CPU风扇声音大怎么解决
cpu风扇声音大_老司机教你电…
CPU风扇声音大怎么办

专题栏目

您现在的位置：电脑评测网 >> 电脑内存 >> 正文

高级搜索

MINDSHARE：使用 BINARY NJA 分析 BSD 内核的未初始化内存泄露（上）

作者：佚名文章来源：本站原创点击数：更新时间：2022/12/6 22:50:44 | 【字体：小大】

　　离异女人之机关红颜未初始化内存的泄漏是跨信任边界复制数据时面临的常见问题之一。这可能发生在 hypervisor 和 guest OS、内核和用户空间之间，也可能发生在跨网络之间。在这些情况中，最常见的错误模式是在内存中分配结构或联合，并且在跨信任边界复制它之前没有初始化某些字段或填充字节。问题是，是否可以对此类漏洞进行有针对性地分析？

　　本文的想法是执行支配流不敏感分析（insensitive analysis），以静态跟踪所有内存存储操作。当跨信任边界复制来自该内存区域的数据时，任何从未写入的内存区域都被标识为未初始化。

　　脆弱的代码在堆栈上声明了一个 ucontext_t 结构，写入一些但不是所有的字段，最后使用 copyout ( ) 将 UC_COPY_SIZE 字节的数据从结构复制到用户区。这里的问题是，并非所有字段都已初始化，因此，占用结构内存区域未初始化部分的任何数据都会被泄漏。为了解决这个问题，打过补丁的代码使用 bzero ( ) 函数将整个结构归零。

　　1. 在堆栈上声明或在堆上分配内存区域（结构、联合等），这可能是未初始化内存的来源。

　　3. 有一个跨信任边界传输数据的 API，这可能是未初始化内存的 sink。

　　4.API 通常至少需要 3 个参数：源缓冲区、目标缓冲区和大小。在这种情况下，内存的源是堆栈偏移量，传输的大小是一个常量值。传输的大小不变意味着该值要么是内存区域的整个大小（使用 sizeof 运算符），要么是成为偏移量的一部分。

　　sink 函数是特定于应用程序的，比如对于 Linux 内核，是 copy_to_user ( ) ；对于 BSD 内核，则是 copyout ( ) ；对于网络传输则是 send ( ) 或 sendto ( ) 。如果目标是封闭源代码，那么这些函数的定义要么被记录下来，要么被逆向破解。

　　一旦知道了 sink 函数及其定义，就可以使用常量大小参数和指向堆栈偏移量或堆内存的源缓冲区查询对 sink 函数的调用。查询指向堆栈内存的指针很简单，而检测堆指针则需要访问源变量的定义位置。BSD 中 copyout ( ) 函数的定义如下：

　　在查找堆栈内存泄漏时，搜索对 copyout ( ) 函数的交叉引用，其中 kaddr 指向堆栈偏移量，len 参数是常量。

　　Binary Ninja 具有静态数据流功能，可以在函数内传播已知值，包括堆栈帧偏移量和类型信息。使用此功能，可以缩小对满足搜索条件的 copyout ( ) 的调用范围。为了更好地理解这一点，让我们检查一下从 sys_getcontext ( ) 传递给 copyout ( ) 的参数。

　　分析的核心思想是使用 Binary Ninja 的静态数据流功能跟踪所有内存存储操作，并在必要时使用 Single static Assignment（SSA）形式手动传播指针。为了跟踪本地函数范围内的堆栈内存存储，我们依赖于低级别 IL（LLIL），因为中级 IL（MLIL）抽象了堆栈访问，可能会消除一些内存存储。为了跟踪将地址传递给另一个函数的跨函数 ( inter-procedure ) 存储操作，我们依靠 MLIL SSA 形式传播指针。用于处理 IL 指令的访问者类是基于 Josh Watson 的 emator 实现的。

　　在 LLIL 中，任何写入内存的指令都表示为 lil_store 操作。它有一个源和目标参数。其思想是线性访问函数中的每个 LLIL 指令，并检查它是否是一个以堆栈帧偏移量为目标的 lil_store 操作。当一个写入堆栈的内存存储被识别出来时，我们将记录写入的源偏移量及其大小。一个简单的 8 字节内存移动操作和 Binary Ninja 提供的相应 LLIL 信息如下：

　　StackFrameOffset 值是堆栈基数的偏移量，size 属性给出了存储操作的大小。使用这些信息，就可以知道正在写入的内存地址是哪个。本示例中正在初始化从堆栈基偏移量是 116 到 109 ( 8 字节 ) 的地址。

　　虽然内存存储指令是初始化内存的一种方法，但经常使用 memset ( ) 和 bzero ( ) 这样的函数来初始化带有 null 的内存区域。类似地，诸如 memcpy ( ) 、memmove ( ) 、bcopy ( ) 、strncpy ( ) 和 strlcpy ( ) 等函数也用于写入内存区域。所有这些函数都有一个共同点：都有一个目标内存指针和一个要写入的大小。如果目标值和大小值已知，则可以知道要写入的内存区域。考虑 bzero ( ) 的情况，它用于清除修补后的 sys_getcontext ( ) 中的堆栈内存：

　　通过查询目标指针和大小参数，可以知道它们各自的值，从而知道目标内存区域。

　　现在让我们考虑一下分析器如何处理 CALL 操作。静态挂钩是函数的处理程序，与其他函数相比，我们打算以不同的方式处理这些函数。对于任何具有已知目标 ( MLIL_CONST_PTR ) 的 CALL 指令，将获取该符号以检查静态挂钩。

　　一个带有函数名及其位置参数 ( 目标缓冲区和大小 ) 的 JSON 配置被提供给分析器用于静态挂钩：

　　copyin ( ) 函数特定于 BSD 内核。它用于使用来自用户空间的数据初始化内核缓冲区。任何要挂钩的特定于目标的函数都可以添加到 JSON 配置中，并根据需要在 visit_function_hooks ( ) 中处理。

　　很多时候，编译器会将内存写入函数优化为 REP 指令或一系列存储操作。虽然由于优化而引入的存储操作可以像处理任何其他存储操作一样，但 REP 指令需要特殊处理。由于 REP 的原因，静态函数挂钩在检测内存写入时并没有用。那么，我们如何处理此类优化并避免错过这些内存写入？首先，让我们看看 Binary Ninja 如何在 LLIL 或 mll 中转换 REP 指令。

　　REP 指令重复字符串操作，直到 RCX 为 0。复制操作的方向取决于方向标志（DF），因此，一个分支增加源指针 ( RSI ) 和目标指针 ( RDI ) ，另一个分支则减少。一般来说，假设 DF 为 0，并且指针是递增的，这是相当安全的。

　　当线性遍历 IL 时，转换后的 REP 指令看起来与其他指令没有什么不同。其思想是检查 GOTO 指令，并且对于 IL 中的每个 GOTO 指令，在相同的地址获取反汇编。如果反汇编是 REP 指令，则获取目标指针和大小参数，并将内存区域标记为已初始化。

　　此时，我们可以跟踪内存存储操作、调用操作 ( 如 bzero ( ) 、memset ( ) ) ，还可以处理 REP 优化。下一个任务是跟踪函数调用之间的内存写入操作，就像调用者将内存地址传递给被调用者一样。有趣的是，一旦堆栈指针被传递到另一个函数中，就不能再使用寄存器值类型信息（StackFrameOffset）对其进行跟踪了，就像我们在本地函数范围内使用 LLIL 所做的那样。

　　为了解决这个问题，我们使用 MLIL SSA 变量在被调用函数中传播指针，就像传播污染信息一样。每当遇到 MLIL_STORE_SSA 指令时，只要根据 SSA 变量的值手动解析内存写入操作的目标，我们就会记录写入操作的偏移量和大小值。下面显示的 set_function_args ( ) 函数遍历 MLIL 变量并赋值 ( 指针 ) 给调用者：

　　设置初始 SSA 变量后，我们就会访问所有的指令来传播指针并记录内存写入操作。执行此操作时，对指针执行的最常见操作是加法。因此，有必要模拟 MLIL_ADD 指令来处理指针算术操作。此外，模拟 MLIL_SUB、MLIL_LSR 和 MLIL_AND 等指令也很重要，以便在优化的情况下处理某些指针对齐操作。下面是如何解析这些 MLIL SSA 表达式来记录内存存储操作的示例：

　　将 SSA 变量 rax_43#65 视为手动传播的指针值，可以解析存储操作的目标以及写入的大小。但是，当 SSA 变量 rax_43#65 的值不可用时，此内存与调用者传播的指针无关，因此不会被记录。

　　在执行跨函数 ( inter-procedure ) 分析时，除了 REP 优化之外，还可以进行进一步的优化，如上面的处理 x86 REP 优化部分所讲。在堆栈上分配的变量通常会对齐，以满足后续操作的需要。假设将堆栈指针传递给 memset ( ) ，编译器将调用内联为 REP 指令。在这种情况下，很可能将内存分配到一个对齐的地址，以便在 REP 操作期间使用最快的指令。

　　然而，当指针被调用者作为参数接收或作为分配器函数的返回值接收时，编译器则必须生成指针和大小对齐操作码，这些操作码可能在到达 REP 指令之前依赖于分支决策。下面是一个在用于分析的 NetBSD 内核中常见的优化示例：

　　从静态分析的角度来看，当涉及到这种分支决策时，指针和大小可以在 REP 指令点获得多个可能的值。这与我们在处理 x86 REP 优化一节中观察到的情况不同，在该节中，指针和大小只有一个可能的值。我们的目标是在没有指针对齐计算的情况下找到指针的实际值和大小。为了实现这一点，确定了两个可用于解析原始值的 SSA 表达式：

　　2. 搜索包含 ( SIZE>

　　3 ) 的表达式。这是将调整后的大小传递给 REP 指令的地方；

　　我想从 REP 指令的角度追溯上述表达式，一个完全依赖 SSA，另一个基于 dominator：

　　下面显示的函数 resolve_optimization ( ) 使用 dominator 获取执行搜索操作的基本块。由于指针是由调用者手动传递的，因此值是从 SSA 变量中获取的。

　　对于可能的常量值，我们从可用值列表中获取最大值。一旦指针和最大值都可用，我们就记录内存区域初始化时的日志。

电脑内存录入：admin 责任编辑：admin
	上一个电脑内存： ARM处理器的内存对齐处理下一个电脑内存：没有了

　栏目文章

MINDSHARE：使用 BINARY NJA 分析 BSD 内核的… (12-06)	ARM处理器的内存对齐处理 (12-06)
电脑内存基础必备知识 (12-06)	电脑总是蓝屏英文怎么回事 (12-06)
微软承认 11 月更新导致 Windows Server 出现… (12-06)	手机内存跟电脑内存有什么区别啊？ (12-06)
ASCII编码将英文存储到计算机 (12-06)	内存条价格走势（内存条价格走势2021） (12-06)
内存诊断工具变成英文的了 (12-06)	代码优化：有效使用内存英文版(chm版)-硬件开… (12-06)
电脑出现了蓝屏和英文 (12-06)	Optane内存 (12-06)
深入理解Linux虚拟内存管理英文版PDF_MelGorm… (12-05)	手机虚拟内存 (12-05)
虚构内存器英文怎么写 (12-05)	电脑上什么是虚拟内存 (12-05)
linux sd的英文4 lvmm-深入理解linux虚拟内存… (12-05)	DDR5 8000!GSKILL发布超强超频内存 (12-05)
内存或还要降半年 2023下半年可能涨价 (12-05)	快看看你的内存条有没有这种情况 (12-05)

	设为首页加入收藏联系站长友情链接版权申明网站公告管理登录
	电脑评测网声明：登载内容出于传递信息之目的，绝不意味着赞同其观点或证实其描述，若侵权请来信告知，我们将及时处理！