一:背景
1.讲故事
有朋友咨询个问题,他每次在调试 WinDbg 的时候,进程初始化断点之前都会有一些 dll 加载到进程中,比如下面这样:
问是否可以用 WinDbg 解读下内部运作原理,哈哈,其实要了解运作原理,一定要熟知 PE 头,那这篇就安排上。
二:理解 PE 头结构
1. 测试代码
为了方便讲述,先上一段测试代码,这里故意加载 combase.dll
是为了提取 PE 中的某些数据结构,代码如下:
其实你仔细想一想也能知道,既然能做到初始化加载,必然在 PE 头上藏了什么东西,这些东西让 Windows 加载器可以顺利加载诸如 ntdll.dll
, KERNEL32.dll
等等,接下来一起观察下。
2. 可视化观察 PE 头
要想可视化观察 PE 头,工具有很多,这里使用 PPEE
工具,截图如下:
从图中可以看到,其实初始化加载什么,由可选头中的 DIRECTORY_ENTRY_IMPORT
数据目录项决定,哪这里包含了哪些初始化 dll 呢? 可以选中右边的 DIRECTORY_ENTRY_IMPORT
项即可,如下图所示:
肯定有朋友说,WinDbg 上显示的是 5 个,你这里才 3 个,还有 2 个为什么没有? 很简单,多余的 ntdll.dll
和 KERNELBASE.dll
必然是依赖项哈。
3. 用 WinDbg 深入探究
玩 WinDbg 都喜欢刨根问底,拿可视化 PPEE 肯定忽悠不过去,那好吧,我们用 C 中的结构体去解剖它。
- DOS Header 节
这一块信息在源码中是用 ntdll!_IMAGE_DOS_HEADER
结构来承载的,可以用 dt 输出,起始点就是我们的 ConsoleApplication3.dll
在进程的首位置,即: 0x400000
。
- NT Header 节
接下来就是 NT Header 节,它在源码中是由 _IMAGE_NT_HEADERS
结构来承载的,起始位置的偏移已经保存在上面的 e_lfanew
字段中,即 0n232
。
- _IMAGE_DATA_DIRECTORY
在 PPEE 的第一张截图中,我们查看的是 Data Directorys
数组中的第二项 DIRECTORY_ENTRY_IMPORT
内容,它里面定义了我们需要初始化导入的 dll,我们可以用 dt r3
展开一下,然后一直点点点就好了,简化后如下:
从输出的 VirtualAddress=0x1b1cc
中可以看到,我们 PPEE 截图二中的 DIRECTORY_ENTRY_IMPORT
真实内容是在偏移 0x1b1cc
处,它是一个 combase!_IMAGE_IMPORT_DESCRIPTOR
结构体,输出如下:
到这里就很关键了,涉及到如下几点信息:
- 加载的 dll 名字是什么?
可以从 Name
字段提取,参考如下代码:
- 加载的 方法名 是什么?
这需要提取 OriginalFirstThunk
字段,这里是一个 _IMAGE_IMPORT_BY_NAME
类型的指针数组,代码如下:
结合上面的输出,我们知道 IsDebuggerPresent()
是属于 KERNEL32.dll
下的,有了这两点信息,Windows 加载器就可以用 LoadLibrary
和 GetProcAddress
方法将其加载到进程中了,转化为 C 代码大概是这样的。
- func 函数地址会保存吗?
当然会保存了,会放在 _IMAGE_IMPORT_DESCRIPTOR
结构下的 FirstThunk
字段中,这是一个函数地址的指针数组,可以用 dds 观察。
还有一点要注意,如果你在代码中使用 IsDebuggerPresent()
方法的话,它会从 0041b000
位置上取函数地址,参考如下汇编代码:
三:总结
对初学者来说,搞懂这些还是有一定困难的,我在网上找了一份很好的参考图,大家可以对照着这张图理解,在此感谢作者。
- INT 是 Windows 需要加载的函数名列表。
- IAT 是存放 GetProcAddress 返回函数地址的列表。
标签:
留言评论