美丽的神话 发表于 2024-10-24 08:32:58

【Qunar风控安全产品的探索之路】

0x01-前言
本文重要介绍反爬风控相干底子安全产品演变过程中的思考。
文章以总-分的情势讲述,重要分为三部分:(1)产品演变;(2)情况检测;(3)检测分析。
渴望其中一些思考能够给大家带来启发。
懂的不多,做的太少。接待批评、指正。
0x02-底子安全产品
产品演变
一、问题

​ 在19年之前Qunar的反爬虫、反作弊等场景是业务线各自为战。作为机票反爬最早期的到场者之一,在负责机票App反爬期间就有一个问题不停在困扰我,我的工作不停在不断、重复地编写辨认战略,工作量的多少完全取决于爬虫量的多少,防御完全陷入被动局面。是否有办法从根本上解决这类重复性劳动问题。
https://i-blog.csdnimg.cn/direct/d5d808e30d6a4a1990f1321356a0cd4b.png
二、例子

举个例子。下图中蓝色(CRITICAL)代表已辨认为疑似用户。黄色(ATTACK)代表已辨认为非常用户。
https://i-blog.csdnimg.cn/direct/6050d0b3b46740499a5969873a2765a6.png
每一次蓝黄交替,就代表一次攻防对抗,就意味着必要进行一次战略的调解。战略例子:
(1)发现某个参数拼写错误;
​(2)发现某个设备信息缺失;
​(3)发现某个账号对应的IP数量过多。
​类似的一次战略调解就必要投入0.5-1pd的人力进行代码编写、发布和验证。
三、思考

​ 重复性劳动注定会使团队陷入被动忙碌且无积累的状态,如何破解这一局面?
​ 比较幸运的是,我在刚毕业的第一年在负责智能打码平台时有研究过几大安全厂商的三代验证码,在此过程中使我具备了一定的逆向技能,让我在解决这一问题上有些新的想法和思绪。
四、解决

​ 从上述思考的两点出发,“本质”其实就是将问题特征梳理出来,“作弊门槛”的提升方式就是找到问题背后的原理。
以反爬场景为例
​ 我大概将爬虫特征分为四类。
1、问题特征分类一
(1)具有一定规模的数据才有代价;
(2)抓取设备出于资本考虑,必要控制设备数量。
结合以上特征点,我们必要解决的问题是:如何标志真实的设备。
2、问题特征分类二
(1)防护代码会被分析;
(2)安全数据会被篡改。
结合以上特征点,我们必要解决的问题是:如何保证数据的真实性。
3、问题特征分类三
(1)机器主动化抓取;
(2)拦截数据与模拟哀求。
结合以上特征点,我们必要解决的问题是:如何更高效准确地辨认非常设备情况。
4、问题特征分类四
(1)容器外模拟哀求。
结合以上特征点,我们必要解决的问题是:如何辨认脱离容器哀求。
https://i-blog.csdnimg.cn/direct/4ccf89ef6e944ff7b37fc88a766c2525.png
五 情况检测

因为这中间涉及到的点非常多,篇幅有限,我觉得可以拿比较故意思的安全产品中的情况检测来详细聊聊。
1、作弊设备分析
​ 通过作弊设备分析应用外部运行情况风险。
​ 我把作弊设备大致分为三种:真机、模拟器以及云手机。
真机-应用多开
通过修改应用名称或运行于多开容器中,使得可以在同一台设备内同时运行多个雷同的应用。(常见多开应用有VirtualApp、小米分身等)。
模拟器
通过软件模拟移动设备硬件操作,使得App可以直接运⾏在PC上。(常见模拟器有腾讯模拟器、夜神模拟器等)
云手机
通过ARM服务器以及捏造化技能,在云端捏造的原生手机实例。(常见有百度云手机、红手指云手机等)
2、作弊方式分析
​ 作弊方式分析应用内部被篡改的风险。我把作弊方式大致分为两种:篡改和非篡改。
重打包
​ 重打包是指将应用反编译后,修改或添加代码后从新打包,将其安装至设备上,应用运行时就会被加载。
HOOK
​ 当步伐在执行某段代码时,控制其执行恶意代码。这种篡改就被称为HOOK。
主动化工具
​ 基于Google/苹果发布的主动化测试框架,进行一些列如点击、滑动、键盘输入等操作。
0x03-思考
(1)以攻促防。从业务安全场景出发,从作弊者角度思考问题,从数据、原剃头现解决问题。不断进行攻防对抗,才气使研发职员和体系不断成长。
(2)真人化。真人化的演变过程是从协议破解到模拟器,再到真机,目前正在朝真人众包方向发展。如何定义与辨认真实用户和作弊者是新的难题。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 【Qunar风控安全产品的探索之路】