ToB企服应用市场:ToB评测及商务社交产业平台

标题: CTF Web信息搜集 25000字详解 [打印本页]

作者: 麻花痒    时间: 2024-9-29 11:41
标题: CTF Web信息搜集 25000字详解
前言

这段时间开始入门Web,主要是为了在线下赛不那么坐牢
Web的知识还是挺多的,以是必要成体系的学习
每学完一个方面我会写一篇总结性文章,将知识点与例题放在一起,方便背面查阅
如果之后学的更加深入或者遇到什么有代表性的题目,也会添加到文章中
信息收集

渗透的本质是信息收集,信息收集也叫做资产收集。
信息收集是渗透测试的前期主要工作,是非常重要的环节,收集富足多的信息才能方便接下来的测试,信息收集主要是收集网站的域名信息、子域名信息、目标网站信息、目标网站真实IP、敏感/目录文件、开放端口和中间件信息等等。通过各种渠道和手段尽大概收集到多的关于这个站点的信息,有助于我们更多的去找到渗透点,突破口。
常见信息

搜集方面作用whois得到域名注册人的信息:邮箱、电话号码、姓名子域名可以扩大攻击范围,子域名肯定是有关联的,很多时候根本上都同属一个公司端口探测危险端口可以直接爆破入侵,一个Ip大概搭建了多个网站,分布在差别的端口目录扫描目录扫描有的时候可以访问到压缩包源码、编辑器目录、废弃页面、其他站点指纹辨认辨认CMS,探求通杀漏洞旁站查询旁站其实就是同IP站点,肯定和目标站点在同一个内网或者是同一台服务器C段查询C段大概是同一个内网,同一个公司内容敏感信息走漏通过谷歌语法得到其他的东西 分类

域名信息

whois

概述
whois(读作“Who is”,非缩写)是用来查询域名的IP以及所有者等信息的传输协议。简单说,whois就是一个用来查询域名是否已经被注册,以及注册域名的具体信息的数据库(如域名所有人、域名注册商)
收集方法

存案

概述
网站存案也算是中国互联网的一大特色了
非谋划性网站存案(Internet Content Provider Registration Record),简称ICP存案,指中华人民共和国境内信息服务互联网站所需举行的存案登记作业。
如果某网站申请了ICP存案,那么就能通过查询存案可以获取存案人的大量信息
收集方法

注意事项
一些个人网站底部贴的存案号很有大概是假的,或从其他站点复制过来的。以是查询存案信息时尽量通过域名来直接查询。
CDN

概述
內容分发网络(英语:Content Delivery Network或Content Distribution Network,缩写:CDN)是指一种透过互联网相互连接的电脑网络体系,利用最靠近每位用户的服务器,更快、更可靠地将音乐、图片、视频、应用程序及其他文件发送给用户,来提供高性能、可扩展性及低资本的网络内容传递给用户。
恰好在我的博客R1ck’s Portal中,也使用到了这种内容分发网络服务,以是对它的作用的体会非常深刻。
在很大水平上,CDN能抵抗像DDOS之类的攻击,同时还能让站点的真实IP “隐身”
但是这对于我们渗透测试时影响很大:无论我们对CDN的服务器有多大的控制权,也始终影响不到真实站点,也就是源站
此时必要我们绕过CDN,找到真正源站的IP
绕过方法
子域名

概述
收集子域名可以扩大测试范围,同一域名下的二级域名都属于目标范围。
收集方法
解析记载

概述
查询域名的NS记载、MX记载、TXT记载等很有大概指向的是真实ip或同C段服务器。
同时flag也有大概藏在这些解析记载中
常见解析范例
收集方法
旁站

概述
旁站指的是同一服务器上的其他网站,一般是同一ip
收集方法
C段

概述
对目标主机无计可施时,我们可以尝试一下从C段入手。C段入侵是拿下同一C段下的服务器,也就是说是D段1-255中的一台服务器,然后直接从被端掉的服务器出发举行其他测试
收集方法
服务器信息

端口

概述
当确定了目标大概的ip段后,可以先对ip的开放端口举行探测,一些特定服务大概开起在默认端口上,探测开放端口有利于快速收集目标资产,找到目标网站的其他功能站点。通过扫描服务器开放的端口以及从该端口判断服务器上存在的服务。
收集方法
服务器范例

网站服务器有差别的操纵体系:windows、Linux、mac os
windows对大小写不敏感,其他两个对大小写敏感
数据库范例

现在比较常用的数据库有:MySQL、SQL server、Oracle等。SQL server开放的默认端口:1433,MySQL开放的默认端口:3306、Oracle开放的默认端口:1521。
waf防火墙

收集方法
kali自带Wafw00f
语法:wafw00f xxx.com
网站信息

备份文件

除了F12检察源代码,偶然网站的备份文件也会走漏源代码
备份文件是常见的源码走漏的方式,实践中通常是开发者的疏忽而忘记删除备份文件,从而导致服务器中残留源码。我们可以通过访问这些备份文件来审计代码,一般情况下可以用后台扫描工具扫描。
备份文件常见的后缀名

备份文件根本上都是压缩包
.rar .zip .7z .tar .gz .bak
对于bak类的备份文件,可以直接输入文件名称+.bak访问例如:
index.php.bak
.txt .old .temp _index.html .swp .sql .tgz
备份文件常见的文件名

   web website backup back www wwwroot temp db data code test admin user
sql
  gedit备份文件

在Linux下,用gedit编辑器保存后,当前目录下会天生一个后缀为~的文件,其文件内容就是刚编辑的内容。假设刚才保存的文件名为flag,则该文件名为flag~。
通过欣赏器访问这个带有~的文件,便能得到源代码
vim备份文件

使用vim编辑器编写filename文件时,会有一个.filename.swp文件产生,它是隐藏文件。如果编写文件时正常退出,则该swp文件被删除,如果异常退出,该文件则会保存下来,该文件可以用来规复异常退出时未能保存的文件,同时多次意外退出并不会覆盖旧的.swp文件,而是会天生一个新的,例如.swo文件。
针对swp备份文件,我们可以用vim -r下令规复文件的内容
例如当前目录下假如存在.flag.swp文件,则规复下令为vim -r flag
收集方法

敏感目录

概述
通过扫描目录和文件,大致了解同站的的结构,获取突破点,好比后台,文件备份,上传点以及源码的目录
敏感文件常见的如.git文件走漏,.svn文件走漏,phpinfo走漏等
收集方法
CMS范例(指纹辨认)

概述
收集好网站信息之后,应该对网站举行指纹辨认,通过辨认指纹,确定目标的cms及版本,方便制定下一步的测试筹划
CMS内容管理体系的缩写。它是一种软件工具,用于创建、编辑和发布内容。CMS体系可以资助用户创建和管理他们的网站,资助网站管理员管理构成现代网站的许多差别资源,内容范例和各种数据。CMS体系分为四种差别范例:企业内容管理体系(ECM / ECMS),Web内容管理体系,Web组内容管理体系和组件内容管理体系。CMS最善于的就是建设网站,最流行的CMS有:Wordpress,Drupal,Joomla
收集工具
探针走漏

概述
安装了LNMP后或者是配置了PHP情况后,我们一般习惯性地上传一个PHP探针来检测一下我们的PHP情况是否精确地配置,同时偶然遇到一些特殊的程序必要相干的PHP组件支持,我们也可以上传一个PHP探针来检测一下我们的Web情况是否符合要求。
收集方法
谷歌hacker

谷歌语法

具体教程
信息收集之Google Hacking的简单用法_index of /admin_谢公子的博客-CSDN博客
源码走漏

git 源码走漏

git是一个主流的分布式版本控制体系,开发人员在开发过程中经常会忘记.git文件夹,导致攻击者可以通过.git文件夹中的信息获取开发人员提交过的所有源码,进而大概导致服务器被攻击而沦陷

SVN 源码走漏

SVN是一个开放源代码的版本控制体系,和Git雷同。在使用SVN管理本地代码过程中,会主动天生一个名为.svn的隐藏文件夹,其中包含重要的源代码信息。
主要利用**.svn/entrieswc.db文件**
可以使用工具dvcs-ripper
dvcs-ripper必要在linux体系使用
rip-svn.pl -v -u http://www.example.com/.svn/
hg源码走漏

Mercurial 是一种轻量级分布式版本控制体系,使用 hg init的时候会天生.hg,其中包含代码和分支修改记载等信息。
可以使用工具dvcs-ripper
rip-hg.pl -v -u http://www.example.com/.hg/
CVS走漏

CVS是一个C/S体系,多个开发人员通过一个中央版本控制体系来记载文件版本,从而到达保证文件同步的目的。
针对 CVS/Root以及CVS/Entries目录,直接就可以看到走漏的信息。
利用工具dvcs-ripper
rip-cvs.pl -v -u http://www.example.com/CVS/
Bazaar/bzr走漏

bzr是个版本控制工具, 固然不是很热门, 但它也是多平台支持, 并且有不错的图形界面。
使用工具dvcs-ripper
rip-bzr.pl -v -u http://www.example.com/.bzr/
DS_Store 文件走漏

.DS_Store是Mac下Finder用来保存怎样展示 文件/文件夹 的数据文件,每个文件夹下对应一个。如果将.DS_Store上传摆设到服务器,大概造成文件目录结构走漏,特别是备份文件、源代码文件。
使用工具ds_store_exp
python ds_store_exp.py http://www.example.com/.DS_Store
http状态码

相应分为五类:信息相应(100–199),成功相应(200–299),重定向(300–399),客户端错误(400–499)和服务器错误 (500–599):
分类分类形貌1**信息,服务器收到请求,必要请求者继续实验操纵2**成功,操纵被成功接收并处置惩罚3**重定向,必要进一步的操纵以完成请求4**客户端错误,请求包含语法错误或无法完成请求5**服务器错误,服务器在处置惩罚请求的过程中发生了错误 HTTP状态码列表:
状态码状态码英文名称中文形貌100Continue继续。客户端应继续其请求101Switching Protocols切换协议。服务器根据客户端的请求切换协议。只能切换到更高级的协议,例如,切换到HTTP的新版本协议200OK请求成功。一般用于GET与POST请求201Created已创建。成功请求并创建了新的资源。这通常是在 POST 请求,或是某些 PUT 请求之后返回的相应。202Accepted已接受。已经接受请求,但未处置惩罚完成203Non-Authoritative Information非授权信息。请求成功。但返回的meta信息不在原始的服务器,而是一个副本204No Content无内容。服务器成功处置惩罚,但未返回内容。在未更新网页的情况下,可确保欣赏器继续体现当前文档205Reset Content重置内容。服务器处置惩罚成功,用户终端(例如:欣赏器)应重置文档视图。可通过此返回码清除欣赏器的表单域206Partial Content部分内容。服务器成功处置惩罚了部分GET请求300Multiple Choices多种选择。请求的资源可包括多个位置,相应可返回一个资源特征与地址的列表用于用户终端(例如:欣赏器)选择301Moved Permanently永世移动。请求的资源已被永世的移动到新URI,返复书息会包括新的URI,欣赏器会主动定向到新URI。今后任何新的请求都应使用新的URI代替302Found临时移动。与301雷同。但资源只是临时被移动。客户端应继续使用原有URI303See Other检察其它地址。与301雷同。使用GET和POST请求检察304Not Modified未修改。所请求的资源未修改,服务器返回此状态码时,不会返回任何资源。客户端通常会缓存访问过的资源,通过提供一个头信息指出客户端希望只返回在指定日期之后修改的资源305Use Proxy使用代理。所请求的资源必须通过代理访问306Unused已经被废弃的HTTP状态码307Temporary Redirect临时重定向。与302雷同。使用GET请求重定向400Bad Request客户端请求的语法错误,服务器无法明白401Unauthorized请求要求用户的身份认证402Payment Required保留,将来使用403Forbidden服务器明白请求客户端的请求,但是拒绝实验此请求404Not Found服务器无法根据客户端的请求找到资源(网页)。通过此代码,网站设计人员可设置"您所请求的资源无法找到"的个性页面405Method Not Allowed客户端请求中的方法被克制406Not Acceptable服务器无法根据客户端请求的内容特性完成请求407Proxy Authentication Required请求要求代理的身份认证,与401雷同,但请求者应当使用代理举行授权408Request Time-out服务器等待客户端发送的请求时间过长,超时409Conflict服务器完成客户端的 PUT 请求时大概返回此代码,服务器处置惩罚请求时发生了辩论410Gone客户端请求的资源已经不存在。410差别于404,如果资源以前有现在被永世删除了可使用410代码,网站设计人员可通过301代码指定资源的新位置411Length Required服务器无法处置惩罚客户端发送的不带Content-Length的请求信息412Precondition Failed客户端请求信息的先决条件错误413Request Entity Too Large由于请求的实体过大,服务器无法处置惩罚,因此拒绝请求。为防止客户端的连续请求,服务器大概会关闭连接。如果只是服务器暂时无法处置惩罚,则会包含一个Retry-After的相应信息414Request-URI Too Large请求的URI过长(URI通常为网址),服务器无法处置惩罚415Unsupported Media Type服务器无法处置惩罚请求附带的媒体格式416Requested range not satisfiable客户端请求的范围无效417Expectation Failed服务器无法满意Expect的请求头信息500Internal Server Error服务器内部错误,无法完成请求501Not Implemented服务器不支持请求的功能,无法完成请求502Bad Gateway作为网关或者代理工作的服务器尝试实验请求时,从远程服务器接收到了一个无效的相应503Service Unavailable由于超载或体系维护,服务器暂时的无法处置惩罚客户端的请求。延时的长度可包含在服务器的Retry-After头信息中504Gateway Time-out充当网关或代理的服务器,未及时从远端服务器获取请求505HTTP Version not supported服务器不支持请求的HTTP协议的版本,无法完成处置惩罚 ctfshow web1-20

web1(解释)

按F12调出页面源码

可以发现flag就放在html解释中
web2(JS禁用F12)


页面体现无法检察源代码,F12按键和右键均失效
思量到大概是被js给禁用了
方法一:
此处我们在url前加上view-source:直接检察页面源码

在源码中我们能看到js确实禁用了右键和f12等功能
flag仍然藏在解释中
方法二:
由于是JavaScript导致的禁用,那么我们可以直接在欣赏器中关闭JavaScript的功能
以edge欣赏器为例,在设置中搜索JavaScript,在制止栏中添加我们想检察源码的站点url

此时F12功能又规复了

web3(相应体)

根据题目提示,使用burpsuite举行抓包

发现flag藏在相应体中
web4(robots.txt)

题目提示robot,我们直接在网站地址后加/robots.txt

不让爬的文件中有一个flag命名的txt文件,flag应该就在其中

web5(phps源码)

题目提示phps源码
phps文件就是php的源代码文件,通常用于提供给用户(访问者)直接通过Web欣赏器检察php代码的内容。
因为用户无法直接通过Web欣赏器“看到”php文件的内容,以是必要用phps文件代替。
在题目未给出提示时,我们也可以通过扫描后台来发现遗留的phps文件
在url后加上/index.phps下载phps源码

用vscode打开,flag就在phps源码中

web6(备份文件)

使用dirsearch扫描,发现有备份文件

手动在url后添加www.zip

得到备份文件
解压缩后得到flag文件,发现包含的flag格式不符,思量大概是提示文件名

在url后加上fl000g.txt得到最终flag
web7(git走漏)

使用dirsearch扫描,发现/.git/走漏

访问该地址后得到flag

web8(svn走漏)

使用dirsearch扫描,发现/.svn/走漏

访问该地址后得到flag

web9(vim备份)

使用vim编辑器编写filename文件时,会有一个.filename.swp文件产生,它是隐藏文件。如果编写文件时正常退出,则该swp文件被删除,如果异常退出,该文件则会保存下来,该文件可以用来规复异常退出时未能保存的文件,同时多次意外退出并不会覆盖旧的.swp文件,而是会天生一个新的,例如.swo文件。
本题的形貌显然是暗示考点是Vim走漏

而必要修改网页,则必要修改index.php文件
尝试访问index.php.swp,下载得到swp文件,打开后得到flag:

web10(cookie)

检察网页cookie的方式有以下几种:
本题直接在控制台打印cookie信息

得到flag的url编码
web11(域名解析记载)

本题使用在线工具查询相应站点的域名解析记载

在TXT记载中得到flag
web12(社工)

用dirsearch扫到admin这个目录,应该是有登录界面

根据题目提示,密码应该就藏在页面当中
尝试页面下方的电话号码

成功登录
web13(技术文档)

页面底部留有技术文档document

按照指示登录http://http://f78fddce-9ace-4612-a3d3-82c302c63f6e.challenge.ctf.show/system1103/login.php得到flag
web14(网页编辑功能走漏)

用dirsearch扫出editor目录

访问editor,进入一个提交页面

发现有插入文件的功能,那我们就可以直接服务器上的文件了

linux下的特殊目录:/var/www/html,把静态网页文件放到这个目录下就可以通过IP很方便的访问,
如果要访问 /var/www/html/myfolder/test.html
我在欣赏器地址栏输入 http://[ip]/myfolder/test.html就行了。
不外这个便利的功能并不是linux操纵体系自带的,必要启用httpd服务才行。
推测本题的网页在var文件夹下
顺利按/var/www/html的路径找到源代码

在nothinghere下找到flag
web15(社工)

用dirsearch扫完发现存在管理员登录入口

该后台登录体系存在忘记密码功能
同时页面底部也走漏了具体邮箱
第一个题目是在哪个城市

搜索QQ号,通过QQ上的资料确定所在地在西安
提交后体现密码已重置

重新登录并得到flag
web16(php探针)

根据题目的提示,网站应该是遗留了php探针
经过尝试成功访问/tz.php

发现phpinfo处是灰色链接,点击进入phpinfo

查找flag属性并找到flag

web17(sql备份)

用dirsearch扫出sql备份文件

下载后打开,找到flag

web18(查阅js源码)

看到这种游戏范例的题目,大概率是不能手动过关的,只能从修改规则上入手
打开js源码,找到游戏过关相干的代码

发现如果到达100分,会弹窗一段Unicode编码

解码后得到你赢了,去幺幺零点皮爱吃皮看看
在url后加上/110.php得到flag
web19(密码走漏)


分享加密原理后,解密解释中走漏的密文

使用其登录后成功获得flag
web20(mdb走漏)


扫出/db/db.mdb数据库文件
下载后使用记事本打开并查找flag
从0到1

常见的搜集(robots、vim、gedit)

尝试通例的信息收集方法
首先是robots.txt

得到flag目录
获得flag1前半段n1book{info_1
测试是否存在vim备份文件,尝试/.index.php.swp
下载得到_index.php.swp文件
其中有后半段flagp0rtant_hack}
测试是否存在gedit备份文件,尝试/index.php~
得到flag中段s_v3ry_im
粗心的小李(git走漏)

题目提示git走漏,思量git走漏时的三种场景
首先是通例git走漏
使用GitHacker规复源码
githacker --url http://2f16f0e7-c2bf-4ca1-95dd-37e0cf03bd0a.node4.buuoj.cn:81/.git/ --output-folder G:\CTF\Web\工具\GitHacker\result

得到源码index.html
打开后得到flag
CTFHUB 信息走漏

目录遍历


点击开始探求flag,发现嵌套了非常多层目录

将flag_in_here添加到爆破字典中
使用dirsearch举行递归目录扫描,设置最多3层:python dirsearch.py -u http://challenge-f27080f1e67b7730.sandbox.ctfhub.com:10800 -i 200,300-399 -r -R 3

扫到flag文件,访问/flag_in_here/2/4/flag

PHPINFO


点击检察phpinfo,查找flag

备份文件下载

网站源码

使用自定义脚本扫描备份文件

下载www.zip,解压后得到如下文件

txt中体现where is flag ??
尝试在url添加/flag_115928996.txt,得到flag

bak文件

使用自定义脚本扫描得到index.php.bak

下载后得到flag
vim缓存

参考vim走漏原理,在url后加上/.index.php.swp
下载备份文件后得到flag
.DS_Store

在url后加上/.DS_Store,下载得到备份文件

根据提示在url后加上/1626d67afe2fee89348ecaaff46381dc.txt得到flag
Git走漏

Log

使用GitHacker扫描站点的.git文件,天生源码

源代码目录如下

50x.html界面提示log日志

实验git log下令

使用git diff 1355add0bcf41982c67f591f699f4296b311bd07举行回滚
得到flag

Stash

使用GitHacker规复源码githacker --url http://challenge-ceb412434853a026.sandbox.ctfhub.com:10800/.git/ --output-folder G:\CTF\Web\工具\GitHacker\result

得到源码目录如下

实验git log检察版本

实验 git diff HEAD 5aff97711513ad7db6c19d6222860240e91e7491对比与add flag版本的区别

此时有两种解题方法:
flag就在规复的txt文件中
Index

使用GitHacker规复源码githacker --url http://challenge-1f42ffb3a63e3f3b.sandbox.ctfhub.com:10800/.git/ --output-folder G:\CTF\Web\工具\GitHacker\result
源码目录如下

flag在txt文件中
SVN走漏

在kali中使用dvcs-ripper工具
在result目录下实验../rip-svn.pl -v -u http://challenge-461ad970cc7dbf6b.sandbox.ctfhub.com:10800/.svn/

得到的源码在新建的result文件夹中

扫描后发现.svn文件夹
进入后再次扫描,发现数据库文件wc.db

实验cat wc.db | grep -a flag在其中探求flag

   grep指令
  grep 指令用于查找内容包含指定的范本样式的文件,如果发现某文件的内容符合所指定的范本样式,预设 grep
指令会把含有范本样式的那一列体现出来。若不指定任何文件名称,或是所给予的文件名为 -,则 grep 指令会从标准输入装备读取数据。
  shell grep [options] pattern [files]
  
  常用option参数
  
  
  并未发现有用信息后开始手动遍历目录,并在以下目录发现flag

HG走漏

在result目录下实验../rip-hg.pl -v -u http://challenge-461ad970cc7dbf6b.sandbox.ctfhub.com:10800/.hg/

发现报错,使用ls -al扫描发现.hg文件夹依然下载成功

使用tree列出.hg的目录

使用grep匹配flag相干信息

发现历史版本中存在flag_211812339.txt文件
在url后加上/flag_211812339.txt后得到flag

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4