用户名
Email
论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
帖子
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com
»
论坛
›
软件与程序人生
›
移动端开发
›
IOS
›
iOS 覆盖率检测原理与增量代码测试覆盖率工具实现15 ...
iOS 覆盖率检测原理与增量代码测试覆盖率工具实现15
曹旭辉
金牌会员
|
2025-3-25 03:28:18
|
显示全部楼层
|
阅读模式
楼主
主题
920
|
帖子
920
|
积分
2760
背景
对苹果开发者而言,由于平台考核周期较长,客户端代码导致的线上题目影响时间往往比较久。假如在开发、测试阶段可以或许提前袒露题目,就有助于避免线上事故的发生。代码覆盖率检测正是资助开发、测试同砚提前发现题目,保证代码质量的好帮手。
对于开发者而言,代码覆盖率可以反馈两方面信息:
自测的充分程度。
代码设计的冗余程度。
只管代码覆盖率对代码质量有着上述利益,但在 iOS 开发中却利用的不多。我们调研了市场上常用的 iOS 覆盖率检测工具,这些工具主要存在以下四个题目:
第三方工具有时天生的检测报告文件会堕落甚至会失败,
开发者对覆盖率天生原理不相识
,碰到这类题目轻易弃用工具。
第三方工具
每次展示全量的覆盖率报告,会分散开发者的很多精力在未修改部门
。而在绝大多数情况下,开发者的关注重点在本次新增和修改的部门。
Xcode 自带的覆盖率检测只适用于单元测试场景
,由于需求变动频繁,
业务团队开发单元测试的本钱很高
。
已有工具
很难和现有开发流程联合起来
,需要额外进行测试,运行覆盖率脚本才能获取报告文件。
为相识决上述题目,我们深入调研了覆盖率报告的天生逻辑,并联合团队的开发流程,开发了
一套嵌入在代码提交换程中、基于单次代码提交(git commit)天生报告、对开发者透明的增量代码测试覆盖率工具
。开发者只需要正常开发,通过模拟器测试开发代码,commit 本次代码(commit 和测试顺序可交换),推送(git push)到远端,就可以在本地看到这次提交代码的具体覆盖率报告了。
本文分为两部门,先从先容通用覆盖率检测的原理出发,让读者对覆盖率的网络、解析有直观的熟悉。之后先容我们增量代码测试覆盖率工具的实现。
覆盖率检测原理
天生覆盖率报告,起首需要在 Xcode 中配置编译选项,编译后会为每个可执行文件天生对应的
.gcno
文件;之后在代码中调用覆盖率分发函数,会天生对应的
.gcda
文件。
此中,.gcno 包罗了代码计数器和源码的映射关系, .gcda 记载了每段代码具体的执行次数。覆盖率解析工具需要联合这两个文件给出最后的检测报表。接下来先看看 .gcno 的天生逻辑。
.gcno
利用 Clang 分别天生源文件的 AST 和 IR 文件,对比发现,AST 中不存在计数指令,而 IR 中存在用来记载执行次数的代码。搜索 LLVM 源码可以找到覆盖率映射关系天生源码。覆盖率映射关系天生源码是 LLVM 的一个 Pass,(下文简称
GCOVPass
)用来向 IR 中插入计数代码并天生 .gcno 文件(关联计数指令和源文件)。
下面分别先容IR插桩逻辑和 .gcno 文件结构。
IR 插桩逻辑
代码行是否执行到,需要在运行中统计,这就需要对代码本身做一些修改,LLVM 通过修改 IR 插入了计数代码,因此我们不需要改动任何源文件,仅需在编译阶段增加编译器选项,就能实现覆盖率检测了。
从编译器角度看,根本块(Basic Block,下文简称 BB)是代码执行的根本单元,LLVM 基于 BB 进行覆盖率计数指令的插入,BB 的特点是:
只有一个入口。
只有一个出口。
只要根本块中第一条指令被执行,那么根本块内全部指令都会
顺序执行一次
。
覆盖率计数指令的插入会进行两次循环,外层循环遍历编译单元中的函数,内层循环遍历函数的根本块。函数遍历仅用来向 .gcno 中写入函数位置信息,这里不再赘述。
一个函数中根本块的插桩方法如下:
统计全部 BB 的后继数 n,创建和后继数大小相同的数组 ctr[n]。
以后继数编号为序号将执行次数依次记载在 ctr
位置,对于多后继情况根据条件判定插入。
举个例子,下面是一段猜数字的游戏代码,当玩家猜中了我们预设的数字10的时候会输出Bingo,否则输出You guessed wrong!。这段代码的控制流程图如图1所示(猜数字游戏 )。
- (void)guessNumberGame:(NSInteger)guessNumber
{
NSLog(@"Welcome to the game");
if (guessNumber == 10) {
NSLog(@"Bingo!");
} else {
NSLog(@"You guess is wrong!");
}
}
复制代码
这段代码假如开启了覆盖率检测,会天生一个长度为 6 的 64 位数组,对照插桩位置,方括号中标志了桩点序号,图 1 中代码前数字为所在行数。
图 1 桩点位置
.gcno计数符号和文件位置关联
.gcno 是用来生存计数插桩位置和源文件之间关系的文件。
GCOVPass
在通过两层循环插入计数指令的同时,会将文件及 BB 的信息写入 .gcno 文件。写入步调如下:
创建 .gcno 文件,写入 Magic number(oncg+version)。
随着函数遍历写入文件地址、函数名和函数在源文件中的起止行数(标志文件名,函数在源文件对应行数)。
随着 BB 遍历,写入 BB 编号、BB 起止范围、BB 的后继节点编号(标志根本块跳转关系)。
写入函数中BB对应行号信息(标注根本块与源码行数关系)。
从上面的写入步调可以看出,
.gcno
文件结构由四部门构成:
文件结构
函数结构
BB 结构
BB 行结构
通过这四部门结构可以完全还原插桩代码和源码的关联,我们以 BB 结构 / BB 行结构为例,给出结构图 2 (a) BB 结构,(b) BB 行信息结构,在本章末尾
覆盖率解析
部门,我们利用这个结构图还原代码执行次数(每行等高格代表 64bit):
图2 BB 结构和 BB 行信息结构
.gcda
入口函数
关于 .gcda 的天生逻辑,可参考覆盖率数据分发源码。这个文件中包罗了 __gcov_flush() 函数,这个函数正是分发逻辑的入口。接下来看看 __gcov_flush() 如何天生 .gcda 文件。
通过阅读代码和调试,我们发现在二进制代码加载时,调用了 llvm_gcov_init(writeout_fn wfn, flush_fn ffn) 函数,传入了 _llvm_gcov_writeout(写 gcov 文件),_llvm_gcov_flush(gcov 节点分发)两个函数,并且根据调用顺序,分别建立了以文件为节点的链表结构。(flush_fn_node * ,writeout_fn_node *)
__gcov_flush() 代码如下所示,当我们手动调用 __gcov_flush()进行覆盖率分发时,会遍历flush_fn_node *这个链表(即遍历全部文件节点),并调用分发函数_llvm_gcov_flush(curr->fn 正是__llvm_gcov_flush函数类型)。
void __gcov_flush() {
struct flush_fn_node *curr = flush_fn_head;
while (curr) {
curr->fn();
curr = curr->next;
}
}
复制代码
具体的分发逻辑
观察__llvm_gcov_flush的 IR 代码,可以看到:
图3 __llvm_gcov_flush 代码示例
__llvm_gcov_flush先调用了__llvm_gcov_writeout,来向 .gcda 写入覆盖率信息。
最后将计数数组清零__llvm_gcov_ctr.xx。
而 __llvm_gcov_writeout 逻辑为:
天生对应源文件的 .gcda 文件,写入 Magic number。
循环执行
llvm_gcda_emit_function: 向 .gcda 文件写入函数信息。
llvm_gcda_emit_arcs: 向 .gcda 文件写入BB执行信息,
假如已经存在 .gcda 文件,会和之前的执行次数进行归并
。
调用llvm_gcda_summary_info,写入校验信息。
调用llvm_gcda_end_file,写结束符。
感兴趣的同砚可以本身天生 IR 文件检察更多细节,这里不再赘述。
.gcda 的
文件/函数结构和 .gcno 根本一致
,这里不再赘述,统计插桩信息结构如图 4 所示。定制化的输出也可以通过修改上述函数完成。我们的增量代码测试覆盖率工具解决代码 BB 结构变动后归并到已有 .gcda 文件不兼容的题目,也是修改上述函数实现的。
图4 计数桩输出结构
覆盖率解析
在相识了如上所述 .gcno ,.gcda 天生逻辑与文件结构之后,我们以例 1 中的代码为例,来论述解析算法的实现。
例 1 中根本块 B0,B1 对应的 .gcno 文件结构如下图所示,从图中可以看出,BB 的主结构完全记载了根本块之间的跳转关系。
图5 B0,B1 对应跳转信息
B0,B1 的行信息在 .gcno 中表现如下图所示,B0 块因为是入口块,只有一行,对应行号可以从 B1 结构中获取,而 B1 有两行代码,会依次把行号写入 .gcno 文件。
图6 B0,B1 对应行信息
在输入数字 100 的情况下,天生的 .gcda 文件如下:
图7 输入 100 得到的 .gcda 文件
通过控制流程图中节点出边的执行次数可以盘算出 BB 的执行次数,
核默算法为盘算这个 BB 的全部出边的执行次数,不存在出边的情况下盘算全部入边的执行次数
(具体实现可以参考 gcov 工具源码),对于 B0 来说,即看 index=0 的执行次数。而 B1 的执行次数即 index=1,2 的执行次数的和,对照上图中 .gcda 文件可以推断出,B0 的执行次数为 ctr[0]=1,B1 的执行次数是 ctr[1]+ctr[2]=1, B2 的执行次数是 ctr[3]=0,B4 的执行次数为 ctr[4]=1,B5 的执行次数为 ctr[5]=1。
颠末上述解析,终极天生的 HTML 如下图所示(利用 lcov):
图8 覆盖率检测报告
以上是 Clang 天生覆盖率信息和解析的过程,下面先容美团到店餐饮 iOS 团队基于以上原理做的增量代码测试覆盖率工具。
增量代码覆盖率检测原理
方案权衡
由于 gcov 工具(和前面的 .gcov 文件区分,gcov 是覆盖率报告天生工具)天生的覆盖率检测报告可读性不佳,如图 9 所示。我们做的增量代码测试覆盖率工具是基于 lcov 的扩展,报告展示如上节末尾图 8 所示。
图9 gcov 输出,行前数字代表执行次数,##### 代表没执行
比 gcov 直接天生报告多了一步,
lcov 的处理惩罚流程是将 .gcno 和 .gcda 文件解析成一个以 .info 结尾的中间文件
(这个文件已经包罗全部覆盖率信息了),之后通过覆盖率报告天生工具天生可读性比较好的 HTML 报告。
联合前两章内容和覆盖率报告天生步调,覆盖率天生流程如下图所示。思量到增量代码覆盖率检测中代码增量部门需要通过 Git 获取,比较自然的想法是用 git diff 的信息去过滤覆盖率的内容。根据过滤点的差别,存在以下两套方案:
通过
GCOVPass
过滤,只对修改的代码进行插桩,每次修改后需重新插桩。
通过 .info 过滤,一次性为全部代码插桩,获取全部覆盖率信息,过滤覆盖率信息。
图10 覆盖率天生流程
分析这两个方案,第一个方案需要自定义 LLVM 的 Pass,进而会引入以下两个题目:
只能利用开源 Clang 进行编译,不利于接入正常的开发流程。
每次重新插桩会丢失之前的覆盖率信息,多次运行只能得到最后一次的结果。
而第二个方案相对更加轻量,只需要过滤中间格式文件,不但可以解决我们在文章开头提到的题目,也可以避免上述题目:
可以很方便地加入到平常代码的开发流程中,甚至对开发者透明。
未修改文件的覆盖率可以叠加(有修改的那些控制流程图结构大概变化,无法叠加)。
因此我们实际开发选定的过滤点是在 .info 。在选定了方案 2 之后,我们对中间文件 .info 进行了一系列调研,确定了文件根本格式(函数/代码行覆盖率对应的文件的表现),这里不再赘述,具体可以参考 .info 天生文档。
增量代码测试覆盖率工具的实现
前一节是实现增量代码覆盖率检测的根本方案选择,为了更好地接入现有开发流程,我们做了以下几方面的优化。
降低利用本钱
在接入方面,接入增量代码测试覆盖率工具只需一次接入配置,同步到代码堆栈后,团队中成员无需配置即可利用,降低了接入本钱。
在利用方面,思量到插桩在编译时进行,对全部代码进行插桩会很大程度降低编译速率,我们通过解析 Podfile(iOS 开发中较为常用的包管理工具 CocoaPods 的依赖描述文件),只对 Podfile 中利用本地代码的堆栈进行插桩(可配置指定堆栈),降低了团队的开发本钱。
对开发者透明
接入增量代码测试覆盖率工具后,开发者无需特殊操纵,也不需要对工程做任何其他修改,正常的 git commit 代码,git push 到远端就会主动天生并上传这次 commit 的覆盖率信息了。
为了做到这一点,我们在接入 Pod 的过程中,主动部署了 Git 的 pre-push 脚本。熟悉 Git 的同砚知道,Git 的 hooks 是开发者的本地脚本,不会被纳入版本控制,如何通过一次配置就让这个堆栈的全部利用成员都能开启,是做好这件事的一个难点。
我们思量到 Pod 本身会被纳入版本控制,因此利用了 CocoaPods 的一个属性 script_phase,增加了 Pod 编译后脚本,来资助我们把 pre-push 插入到本地堆栈。利用 script_phase 插入还带来了另外一个利益,我们可以直接获取到工程的缓存文件,也避免了 .gcno / .gcda 文件获取的不确定性。整个流程如下:
图11 pre-push 分发流程
覆盖率累计
在实现了覆盖率的过滤后,我们在实际开发中碰到了另外一个题目:
修改分支/循环结构后天生的 .gcda 文件无法和之前的归并。
在这种情况下,__gcov_flush会直接返回,不再写入 .gcda 文件了导致覆盖率检测失败,
这也是市面上已有工具的通用题目
。
而这个题目在开发过程中很常见,比如我们给例 1 中的游戏增加一些提示,当输入比预设数字大时,我们就提示出来,反之亦然。
- (void)guessNumberGame:(NSInteger)guessNumber
{
NSInteger targetNumber = 10;
NSLog(@"Welcome to the game");
if (guessNumber == targetNumber) {
NSLog(@"Bingo!");
} else if (guessNumber > targetNumber) {
NSLog(@"Input number is larger than the given target!");
} else {
NSLog(@"Input number is smaller than the given target!");
}
}
复制代码
这个题目困扰了我们好久,也推动了对覆盖率检测原理的调研。联合前面覆盖率检测的原理可以知道,
不能归并的缘故起因是天生的控制流程图比原来多了两条边( .gcno 和旧的 .gcda 也不能匹配了)
,反映在 .gcda 上就是数组多了两个数据。思量到代码变动后,原有的覆盖率信息已经没有意义了,当发生边数不一致的时候,我们会删除掉旧的 .gcda 文件,只保留最新 .gcda 文件(有变动情况下 .gcno 会重新天生)。如下图所示:
图12 覆盖率冲突解决算法
团体流程图
联合上述流程,我们的增量代码测试覆盖率工具的团体流程如图 13 所示。
开发者只需进行接入配置,再次运行时,工程中那些作为本地堆栈进行开发的代码库会被主动插桩,并在 .git 目录插入 hooks 信息;当开发者利用模拟器进行需求自测时,插桩统计结果会被主动分发出去;在代码被推到远端前,会根据插桩统计结果,天生仅包罗本次代码修改的具体增量代码测试覆盖率报告,以及向远端推送覆盖率信息;同时假如测试覆盖率小于 80% 会强制拒绝提交(可配置关闭,百分比可自定义),保证只有颠末充分自测的代码才能提交到远端。
图13 增量代码测试覆盖率天生流程图
总结
以上是我们在代码开发质量方面做的一些积累和探索。通过对覆盖率天生、解析逻辑的探究,我们揭开了覆盖率检测的神秘面纱。开发阶段的增量代码覆盖率检测,可以资助开发者聚焦变动代码的逻辑缺陷,从而更好地避免线上题目。
from :
iOS 覆盖率检测原理与增量代码测试覆盖率工具实现 - 美团技能团队
日常开发Guava提效工具库核心实用指南梳理_guava string转list-CSDN博客
从ES的JVM配置起步思考JVM常见参数优化_es jvm配置-CSDN博客
异步处理惩罚优化:多线程线程池与消息队列的选择与应用_模版模式利用-CSDN博客
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
曹旭辉
金牌会员
这个人很懒什么都没写!
楼主热帖
网络安全应急响应 - 03 - 日志分析与内 ...
Mysql 的Innodb引擎和Myisam数据结构和 ...
Redis - 介绍与使用场景
Nmap抓包分析与绕过Windows防火墙 ...
一招教你如何高效批量导入与更新数据 ...
【docker系列】docker API管理接口增加 ...
聊聊Spring事务控制策略以及@Transacti ...
用代码收集每天热点内容信息,并发送到 ...
ArcToolBox-ArcGIS分析工具中英文对照 ...
微服务架构演进
标签云
运维
CIO
存储
服务器
快速回复
返回顶部
返回列表