制作这个程序的过程中,我查阅了很多相关资料, 对系统编程有了进一步的了解, 下面我就编制这个程序的原理过程和一些心得写出来, 给大家参考. rq+_[!
<LHhs<M'
一. 取QQ号码原理: l5[5Y6c>
2Ez<Iw
QQ程序在运行过程中, 所有数据都是存放在进程空间中,QQ号码也不例外, 要取QQ号码, 从QQ进程空间着手是最保险的. =)a24PDG
怎样确定QQ号码在QQ进程空间的位置? "goomoo"的方法是搜索"clientuin="关键字,这个关键字之后紧跟着就是QQ号码. 但我发现, "clientuin="后面也不一定总是登陆的QQ号码,有时是别的字符,有时是本地登陆的其他QQ号码, 有时又是好友的QQ号码. 所以这个通过这个关键字来定位是不准确的. cS ~OxAS
经过分析, 我发现,QQ运行过程中会读取"MsgEx.db"文件, 在这个文件的全路径中就包含了QQ号码, 路径格式为: QQ路径 +"\" + QQ登陆号码 + "\MsgEx.db", 找到"\MsgEx.db"关键字, 然后提取关键字前面的第一个"\"和第二个"\"之间的文本,不就是QQ号码了吗? 对,正是这样. 3:)z+#Uk6
在QQ进程中, "\MsgEx.db" 的地方很多, 有些前面跟的不是QQ号码.为了保证取到号码的正确性, 我们需要加入一些判断技巧. 大家知道,QQ号码都是数字格式的, 所以只要我们判断取出来的号码是不是数字, 如果不是数字,就继续查找,直到找到是数字的文本为止. ARKM[]
NXW*{b
二. 怎样搜索QQ进程空间的数据? u,^CFws_
l2D*b93
1.应用程序进程 bJ~H
进程是当前操作系统下一个被加载到内存的、正在运行的应用程序的实例。每一个进程都是由内核对象和地址空间所组成的,内核对象可以让系统在其内存放有关进程的统计信息并使系统能够以此来管理进程,而地址空间则包括了所有程序模块的代码和数据以及线程堆栈、堆分配空间等动态分配的空间。进程仅仅是一个存在,是不能独自完成任何操作的,必须拥有至少一个在其环境下运行的线程,并由其负责执行在进程地址空间内的代码。在进程启动的同时即同时启动了一个线程,该线程被称作主线程或是执行线程,由此线程可以继续创建子线程。如果主线程退出,那么进程也就没有存在的可能了,系统将自动撤消该进程并完成对其地址空间的释放。 +jm,nM9
加载到进程地址空间的每一个可执行文件或动态链接库文件的映象都会被分配一个与之相关联的全局唯一的实例句柄(Hinstance)。 \TQZZ_Z
@- U\!Tf
2. 进程空间 _D '(R
在WIN32中,每个应用程序都可“看见”4GB的线性地址空间, 其中最开始的4MB和最后的2GB由操作系统保留,低的2GB为进程的私有空间(如果在Boot.ini文件中使用“/3GB”的开关可以使进程的私有空间增大到3GB,系统空间1GB)。对于每个进程来讲其虚拟的地址空间是连续的,实际上它们是以页面为单位离散的存在于物理内存中,一些可能被交换到硬盘上的页面文件中,而且还有大部分的空间是未提交(Uncommitted)的。一个进程的低2GB私有空间的分布如下表: [&)]-2w2
OUX7
*_
范围 大小 作用 v=U<exM6%
----------------------------------------------------------------------------------------------------------------------------- ]G/m,Zv*:
0x0~~0xFFFF 64 KB 不可访问区域,只是用来防止非法的指针访问,访问该范围的地址会导致访问违例。 =RoG?gd{R
0x10000~~0x7FFEFFFF 2 GB 减去至少192 KB 进程的私有地址空间 eV9U+]C`
0x7FFDE000~~0x7FFDEFFF 4 KB 进程中第一个线程的线程环境块,即TEB(Thread environment block) pv_o4qEN
0x7FFDF000~~0x7FFDFFFF 4 KB 进程的进程环境块,即PEB(Process environment block) 3:J>-MO
0x7FFE0000~~0x7FFE0FFF 4 KB 一个共享的只读用户数据块,该块映射到到系统空间的一个数据块, AGlBvRX7e
其中存放的是一些系统信息如系统时间、时钟的滴答数、系统版本号等。 G@]3EP
这样访问这些信息的时候系统就不用切换到核心模式。 Hfcpqa
0x7FFE1000~~0x7FFEFFFF 60 KB 不可访问 Jj4HJ9
0x7FFF0000~~0x7FFFFFFF 64 KB 不可访问,用于防止线程的缓冲跨越两种模式空间的边界 I2Xd"RHN
VY?9|};f
c+Q'4E0|
一个进程的高2GB空间具体分配如下: ++cS^ Lo
0xFFFFFFFF-0xC0000000的1GB 用于VxD、存储器管理和文件系统; HW@wia
0xBFFFFFFF-0x80000000的1GB 用于共享的WIN32 DLL、存储器映射文件和共享存储区; eg0_ <
iq#{*:1
"+HJ/8Dd1
虚拟内存通常是由固定大小的块来实现的,在WIN32中这些块称为“页”,每页大小为4,096字节。在Intel CPU结构中,通过在一个控制寄存器中设置一位来启用分页。启用分页时CPU并不能直接访问内存,对每个地址要经过一个映射进程,通过一系列称作“页表”的查找表把虚拟内存地址映射成实际内存地址。通过使用硬件地址映射和页表WIN32可使虚拟内存即有好的性能而且还提供保护。利用处理器的页映射能力,操作系统为每个进程提供独立的从逻辑地址到物理地址的映射,使每个进程的地址空间对另一个进程完全不可见。 70'OS:J=\
~ao:9ynY
我们要搜索另一个进程空间的数据, 要扫描范围的起点和终点不是从0~~2GB,而只是其中的一部分。要得到这个起点和终点可以使用API函数GetSystemInfo,函数的原型如下: YQBLbtn6(
VOID GetSystemInfo( V6]6KP#D
LPSYSTEM_INFO lpSystemInfo [Vd$FDki
); k<gH*=uXY'
而在结构SYSTEM_INFO中有两个值:lpMinimumApplicationAddress和 lpMaximumApplicationAddress, J'44j;5&
就是一个应用程序可用的最小和最大的地址空间。这样我们就得到了要扫描的地址的起点和终点。那么是不是这起点和终点间所有的地址都要扫描呢?并不是这样的,因为一般情况下一个进程是用不着这么大(接近2GB)的地址空间的。因此一个进程的大部分地址空间都是未用(Free)或是保留(Reserved)的,真正用到的只是那些已提交(Committed)的内存而已。 56v G R(
OVg&?fiP
内存页面可以有三种状态:未用(Free)、保留(Reserved)和提交(Committed)。一个未用的页面是指该页面未被保留或是提交,对一个进程来讲一个未用的页面是不可访问的,访问这样的页面将导致访问违例。进程可以要求系统保留一些页面以备后用,系统返回一段保留的地址给进程,但是这些地址同样是不可访问的,进程若想使用这段地址空间,使用必须先提交。只有一个提交的页面才是一个真正可以访问的页面。不过你提交了一个页面,系统并不会马上分配物理页面,只有在该页面第一次被访问到时,系统才会分配页面并初始化。另外,这三个状态的两两之间都是可以相互转化的。 -f+#j=FX
这样我们的工作已大大减少了,只需要扫描那些提交的页面就好了。接下来要做的就是得到一个进程的已提交的页面范围。这就要用到另外两个API函数VirtualQuery和VirtualQueryEx。两个函数的功能相似,不同就是VirtualQuery只是查询本进程而VirtualQueryEx可以查询指定进程的内存空间信息,后者正是我们所需要的,函数原型如下: JcAsrtrG]
DWORD VirtualQueryEx( \J'}CX*aQ
HANDLE hProcess, // 进程的句柄 ,f
}$FZ
LPCVOID lpAddress, // 内存地址指针 ?nU<cx h
PMEMORY_BASIC_INFORMATION lpBuffer, // 指向MEMORY_BASIC_INFORMATION结构的指针,用于返回内存空间的信息 n]%-2`}(
SIZE_T dwLength // lpBuffer的长度 |[\;.gT K
); N /4E
~^2
2+1ybOwb
再来看一下结构MEMORY_BASIC_INFORMATION的声明: <,i4Ua
typedef struct _MEMORY_BASIC_INFORMATION { vFPY|Vzh
PVOID BaseAddress; //查询内存块的基地址 ?Ga8.0Z~KT
PVOID AllocationBase; //用VirtualAlloc分配该内存时实际分配的基地址,可以小于BaseAddress, 9*qwXU_aV
//也就是说BaseAddress一定包含在AllocationBase分配的范围内 c=m'I>A
DWORD AllocationProtect; //分配该页面时,页面的一些属性,如PAGE_READWRITE、PAGE_EXECUTE等 D#;7S'C
SIZE_T RegionSize; //从BaseAddress开始,具有相同属性的页面的大小 *2AD#yIKC
DWORD State; //页面的状态,有三种可能值:MEM_COMMIT、MEM_FREE和MEM_RESERVE, Uh}PB3WZ
//这个参数对我们来说是最重要的了,从中我们便可知指定内存页面的状态了 2]!@)fio`
DWORD Protect; //页面的属性,其可能的取值与AllocationProtect相同 xS*UY.>
DWORD Type; //该内存块的类型,有三种可能值:MEM_IMAGE、MEM_MAPPED和MEM_PRIVATE u]p21)m$x
} MEMORY_BASIC_INFORMATION, *PMEMORY_BASIC_INFORMATION; d:kB Zrq
?UnQ?F(+G<
进一步研究发现, 要搜索数据, 只要搜索 类型=MEM_PRIVATE 页面属性=PAGE_READWRITE 的内存块就好了, 这样可以大大提高搜索速度. Jf YgZ\#
Kz HYh
这样我们就可得到进程中需要扫描的地址范围了。到这里剩下的问题就是要读取指定的进程的指定的地地址空间的内容了。这里要用到的是用于调试程序和错误处理(Debugging and Error Handling)的API函数中的ReadProcessMemory,它的原型如下: lC<;Q*Y
BOOL ReadProcessMemory( 'zyw-1
HANDLE hProcess, // 被读取进程的句柄 i|:!I)(lh
LPCVOID lpBaseAddress, // 读的起始地址 -|>~I#vY
LPVOID lpBuffer, // 存放读取数据缓冲区 DAn2Pqf
SIZE_T nSize, // 一次读取的字节数 \"lz,bT
SIZE_T * lpNumberOfBytesRead // 实际读取的字节数 I G1];vX
); %rwvY`\
uwe#&