EFK日志平台搭建

光之使者 · 2022-8-12 17:09:32

title: EFK日志平台搭建
date: 2022-06-25 11:14:47
tags:
- EFK
categories:
- ElasticSearch
- FileBeat
- Kibana
前言

日志平台对于开发者来说自然不陌生,无论是处于开发阶段还是测试阶段亦或者是项目一上线后,一个优秀的日志平台能够节省大量的时间。
常见日志平台有ELK也就是ElasticSeatch+Logstash+Kibana组成的一套系统。这套系统劣势就在于Logstash的性能有些不是很理想,官方都有些嫌弃它emmm。
还有阿里的Logtail也是一个不错的选择,性能也是极好,当然是收费的,对于中小型企业或白嫖爱好者不太友好。
接下来就是本章的主角: EFK,它于ELK不同的是使用了FileBeat替换了Logstash。
本章就简单记录一下如何使用EFK整合日志文件,实现一个实时的日志查询平台。
注: EFK使用版本为7.6.0。
ElasticSearch安装

ES下载地址
下载解压即可使用.
如果有需要修改配置,可直接修改config/elasticsearch.yml文件。

#配置的集群名称，默认是elasticsearch，es服务会通过广播方式自动连接在同一网段下的es服务，通过多播方式进行通信，同一网段下可以有多个集群，通过集群名称这个属性来区分不同的集群。
cluster.name: zeus-platform
# 当前ES服务节点的名称
node.name: node-1
# 指定该节点是否有资格被选举成为node
#（注意这里只是设置成有资格，不代表该node一定就是master），默认是true，es是默认集群中的第一台机器为master，如果这台机挂了就会重新选举master。
node.master: true
# 指定该节点是否存储索引数据，默认为true。
node.data: true
# 设置默认索引分片个数，默认为5片。
#index.number_of_shards: 5
# 设置默认索引副本个数，默认为1个副本。如果采用默认设置，而你集群只配置了一台机器，那么集群的健康度为yellow，也就是所有的数据都是可用的，但是某些复制没有被分配
# （健康度可用 curl 'localhost:9200/_cat/health?v' 查看，分为绿色、黄色或红色。绿色代表一切正常，集群功能齐全，黄色意味着所有的数据都是可用的，但是某些复制没有被分配，红色则代表因为某些原因，某些数据不可用）。
#index.number_of_replicas: 1
# 设置临时文件的存储路径，默认是es根目录下的work文件夹。
#path.work: /path/to/work
# 设置日志文件的存储路径，默认是es根目录下的logs文件夹
#path.logs: /path/to/logs
# 设置插件的存放路径，默认是es根目录下的plugins文件夹, 插件在es里面普遍使用，用来增强原系统核心功能。
#path.plugins: /path/to/plugins
#允许访问的网域
network.host: 0.0.0.0
# 设置对外服务的http端口，默认为9200。
http.port: 9200
# 设置节点之间交互的tcp端口，默认是9300。
transport.tcp.port: 9300
#请确保 cluster.initial_master_nodes 中的值与 node.name 完全匹配
cluster.initial_master_nodes: ["node-1"]

复制代码

如果需要修改es所占用内存可以修改config/jvm.options文件。
进入bin目录启动es.

./elasticsearch
# 后台启动
./elasticsearch -d

复制代码

Ik分词器安装

下载地址
直接解压后放到ElasticSearch的``
Kibana安装

下载地址
直接解压
修改config/kibana.yml文件

# 服务端口
server.port: 5601
# 服务host
server.host: "localhost"
# 所要连接的ElasticSearch集群地址
elasticsearch.hosts: ["http://localhost:9200"]
# 如果es需要认证,需要指定用户名和密码
#elasticsearch.username: "kibana"
#elasticsearch.password: "pass"
# Kibana 中文汉化
i18n.locale: "zh-CN"

复制代码

回到bin目录启动kibana

./kibana

复制代码

FileBeat安装及配置

下载地址
直接解压即可
1. 创建索引模板

也就是日志消息最终会被解析称的文档结构。

# 创建filebeat zeus-music采集模块解析日志所需要的模板
PUT _template/zues_music_template
{
"order": 1,
"index_patterns": [
"zues_music_log-*"
],
"settings": {
"index":{
"number_of_shards": "1",
"auto_expand_replicas": "0-1",
"lifecycle":{
"name": "zues_music_log",
"rollover_alias":"zues_music_log"
},
"mapping":{
"total_fields":{
"limit": "10000"
}
}
}
},
//模板字段
"mappings": {
"properties": {
//服务名
"appName":{
"type": "keyword"
},
//追踪ID
"traceId": {
"type": "keyword"
},
//日志级别
"level":{
"type": "keyword"
},
//日志消息
"message":{
"type": "text",
"analyzer": "ik_max_word",
"search_analyzer": "ik_max_word",
"norms": false
},
//时间戳
"@timestamp":{
"type": "date"
}
}
},
"aliases": {
}
}

复制代码

2. 创建解析管道

用于用一段字符串中提取部分数据.
比如本项目日志格式如下:

[zeus-music] 2022-06-25 18:39:29 INFO 4703 [default] [main] com.zero.music.ZeusMusicApplication 这是一条日志

复制代码

所对应的grok格式

\[%{USERNAME:appName}\] %{TIMESTAMP_ISO8601:timestamp} %{LOGLEVEL:level} %{NUMBER:pid} \[%{USERNAME:traceId}\]

复制代码

ElasticSearch会将这段日志解析成一个json格式
将zeus-music值赋值到appName中
将2022-06-25 18:39:29 赋值到timestamp属性中
将INFO值赋值到level属性中。
将4703 赋值到pid属性中。
将default赋值到traceId属性中。
其实就是一个映射过程。
最终会解析成：

{
"appName": [
[
"zeus-music"
]
],
"timestamp": [
[
"2022-06-25 18:39:29"
]
],
"YEAR": [
[
"2022"
]
],
"MONTHNUM": [
[
"06"
]
],
"MONTHDAY": [
[
"25"
]
],
"HOUR": [
[
"18",
null
]
],
"MINUTE": [
[
"39",
null
]
],
"SECOND": [
[
"29"
]
],
"ISO8601_TIMEZONE": [
[
null
]
],
"level": [
[
"INFO"
]
],
"pid": [
[
"4703"
]
],
"BASE10NUM": [
[
"4703"
]
],
"traceId": [
[
"default"
]
]
}

复制代码

在ElasticSearch中创建 pipeline

# 创建filebeat zeus-music采集模块所需要用到的pipeline
PUT /_ingest/pipeline/zeus_music_pipeline
{
//描述
"description": "zeus_music_pipeline",
//处理过程
"processors": [
{
"grok": {
//所要处理的字段名,为zues_music_template中的message字段
"field": "message",
"patterns": [
"\\[%{USERNAME:appName}\\] %{TIMESTAMP_ISO8601:timestamp} %{LOGLEVEL:level} %{NUMBER:pid} \\[%{USERNAME:traceId}\\]"
],
"pattern_definitions": {
"ALL_CODE": "(\n)*"
}
},
//删除 filebeat自带的时间戳字段
"remove": {
"field": "@timestamp"
}
},
{
// 使用自己日志中的时间
"date": {
"field": "timestamp",
"formats": ["yyyy-MM-dd HH:mm:ss"],
"timezone": "Asia/Shanghai",
"target_field": "@timestamp"
},
"remove": {
"field": "timestamp"
}
}
]
}

复制代码

3. 创建所需配置文件

在filebeat目录下创建一个yml文件,作为启动时配置。

touch zeus_music.yml

复制代码

然后将filebeat.yml文件内容拷贝过来,进行修改。

#=========================== Filebeat inputs =============================
## 数据采集配置
filebeat.inputs:
#采集类型: 基于日志文件模式采集
- type: log
# 启用该采集模块
enabled: true
# 所要采集的日志文件源
paths:
- /usr/local/myproject/music/zeus-music/logs/application/all/*.log
# 该模块标签
tags: ['zeus-music']
# 多行日志的前缀,根据该前缀判断是否是同一条日志信息
multiline.pattern: ^\[zeus-music\]
# 开启多行错误日志合并
multiline.negate: true
multiline.match: after
#可选的附加字段。这些田地可以自由采摘
#向爬取的日志文件添加额外信息以进行过滤
fields:
# 日志收集到后,使用该模板来解析日志,映射成json文档,这样才能插入到es中
# 在es中定义该模板
index: "zues_music_template"
#============================= Filebeat modules ===============================
filebeat.config.modules:
# Glob pattern for configuration loading
path: ${path.config}/modules.d/*.yml
# Set to true to enable config reloading
reload.enabled: false
#==================== Elasticsearch template setting ==========================
# 索引模板配置
setup.template.settings:
index.number_of_shards: 1
# 开启使用索引模板
setup.template.enabled: true
# 要使用的索引模板名称
setup.template.name: 'zues_music_template'
# 模板的 index_patterns
setup.template.pattern: 'zues_music_log-*'
# 关闭索引生命周期
setup.ilm.enabled: false
output.elasticsearch:
# ES地址配置
hosts: ["localhost:9200"]
# 日志索引库生成规则,每日的日志生成一个索引
indices:
- index: 'zues_music_log-%{+yyyy.MM.dd}'
when.contains:
fields:
index: 'zues_music_template'
#tags: 'zeus-music'
# 日志解析所需的pipeline
pipeline: "zeus_music_pipeline"
processors:
# 过滤一起自带的元素字段属性
- drop_fields:
fields: ["log","host","input","agent","ecs"]
ignore_missing: false

复制代码

ok,现在基本上已经配置完成.
4. 启动

启动ES、Kibana程序。
启动filebeat,加载配置好的配置文件。

./filebeat -e -c zeus_music.yml

复制代码

正常启动日志

2022-06-25T19:10:28.909+0800 INFO log/harvester.go:297 Harvester started for file: /usr/local/myproject/music/zeus-music/logs/application/all/zeus-music.log
2022-06-25T19:10:29.921+0800 INFO pipeline/output.go:95 Connecting to backoff(elasticsearch(http://localhost:9200))
2022-06-25T19:10:29.970+0800 INFO elasticsearch/client.go:757 Attempting to connect to Elasticsearch version 7.6.0
2022-06-25T19:10:30.012+0800 INFO [license] licenser/es_callback.go:50 Elasticsearch license: Basic
2022-06-25T19:10:30.040+0800 INFO [index-management] idxmgmt/std.go:258 Auto ILM enable success.
2022-06-25T19:10:30.042+0800 INFO [index-management.ilm] ilm/std.go:139 do not generate ilm policy: exists=true, overwrite=false
2022-06-25T19:10:30.042+0800 INFO [index-management] idxmgmt/std.go:271 ILM policy successfully loaded.
2022-06-25T19:10:30.042+0800 INFO [index-management] idxmgmt/std.go:410 Set setup.template.name to '{filebeat-7.6.0 {now/d}-000001}' as ILM is enabled.
2022-06-25T19:10:30.043+0800 INFO [index-management] idxmgmt/std.go:415 Set setup.template.pattern to 'filebeat-7.6.0-*' as ILM is enabled.
2022-06-25T19:10:30.043+0800 INFO [index-management] idxmgmt/std.go:449 Set settings.index.lifecycle.rollover_alias in template to {filebeat-7.6.0 {now/d}-000001} as ILM is enabled.
2022-06-25T19:10:30.043+0800 INFO [index-management] idxmgmt/std.go:453 Set settings.index.lifecycle.name in template to {filebeat {"policy":{"phases":{"hot":{"actions":{"rollover":{"max_age":"30d","max_size":"50gb"}}}}}}} as ILM is enabled.
2022-06-25T19:10:30.048+0800 INFO template/load.go:89 Template filebeat-7.6.0 already exists and will not be overwritten.
2022-06-25T19:10:30.048+0800 INFO [index-management] idxmgmt/std.go:295 Loaded index template.
2022-06-25T19:10:30.051+0800 INFO [index-management] idxmgmt/std.go:306 Write alias successfully generated.
2022-06-25T19:10:30.052+0800 INFO pipeline/output.go:105 Connection to backoff(elasticsearch(http://localhost:9200)) established

复制代码

2022-06-25T19:10:28.909+0800 INFO log/harvester.go:297 Harvester started for file: /usr/local/myproject/music/zeus-music/logs/application/all/zeus-music.log

复制代码

可以看到,已经正常加载了日志目录的日志文件。
不出意外的话,此时你的ElasticSearch已经生成了一个索引库zues_music_log-2022.06.25

5. 踩坑重点

使用Grok解析日志一定要用日志文件内的日志信息为例,控制台与文件内的格式可能有些不同。
通过Grok解析日志抽取的字段名称与ES模板中的字段名是对应的。切记！切记！切记! 我叼nmd。

使用Kibana美化日志查询

进入索引模式

创建索引模式

选择要查看的所有日志索引库

设置筛选字段

进入查看页面

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

		自动登录	找回密码
密码			立即注册

EFK日志平台搭建

本帖子中包含更多资源

0 个回复

快速回复

楼主热帖

标签云

浏览过的版块