一篇毫不负责的afl-fuzz源码学习指北

read_testcases

nl_cnt是统计inputs目录下的目录数，然后从这些目录中读取测试用例加入

cull_queue

这个函数好像也没看懂是啥。。

先把队列中的实体favored全置为0

然后。。。

好像是精简输入数目

calculate_score

计算得分（对于输入的fuzz次数）

run_target

执行目标应用，监控timeouts。返回状态信息，调用的程序会更新trace_bits[]

calibrate_case

从函数名直接翻译是校准用例。函数注释说的是：
校准一个新的测试用例，在处理输入字典时尽早警告有关测试用例的问题；并且在发现新路径时检测变量行为等。

这个函数里面调用了update_bitmap_score

虽然看完我还是不知道是干啥的

update_bitmap_score

当发现一个新路径时，调用这个方法判断这个路径是否比已有路径more “favorable”。这个”favorables”的意图是最小化路径的集合来触发至今已发现到的bitmap的bits

save_if_interesting

检查fuzzing期间execve()的结果是否interesting，如果是则保存或把输入放到队列中，返回1，反之返回0

技术细节

详见technical_details.txt

算法根据执行延迟和文件大小赋予队列中的每个实体一个得分；然后选择每个tuple得分最低的候选：

通常用这种方法生成的”favored”种子集合比原来的集合小5-10倍。剩下的”Non-favored”不是直接弃用，而是以一定概率跳过：

实证证明，这个策略实现了队列循环速度和种子多样性的平衡

trim不保证输入剪到最优，而且在精度和execve()数之间找到一个均衡点，保证tracemap的checksum不受影响。

剪枝算法具体为：

这里zero过程不用0x00，afl-min使用ASCII字符’0’。这样做的原因是修改一般不会干扰文本解析。

确定性的策略包括：

使用这些确定性变异原因是non-crashing和crashing输入间可能只有微小的差距

非确定性的步骤包括stacked位翻转，插入，删除，算数（加/减）和不同测试用例的拼接

仅仅查看faulting address可能导致完全不相关的两个issue聚类到一起了，因为fault发生在同一个公共的哭函数中（比如strcmp，strcpy等）

在AFL中，认为crash是unique的当下面任意一个条件成立：

afl-fuzz提供crash exploration mode对已知错误的测试输入进行fuzz

与普通的queue entries不同，crashing inputs不会trim，他们会保持原状方便与parent比较（non-crashing entry）。

crash exploration mode下，可以让程序接收一个crashing test case，afl-fuzz从crashing的种子出发开始跑。然后程序就会看在保持程序crash的状态下能运行多远。让程序停止产生crash的变异会被排除。