ELK学习笔记（三）——使用Filebeat8.15.0收集日志

使用Filebeat收集日志

前面教程已经把ElasticSearch和Kibana部署完毕，接着我们就要使用filebeat去收集我们的java服务日志，这里首先介绍一下ELK和EFK的区别。

一、ELK和EFK的区别

在收集和处理日志时，使用 ELK（Elasticsearch, Logstash, Kibana）和 EFK（Elasticsearch, Filebeat, Kibana）堆栈都有其独特的优势和应用场景。两者之间的主要区别在于日志收集和传输组件的选择：Logstash vs. Filebeat。下面是两者的比较和使用 Filebeat 的一些优势：

ELK（Elasticsearch, Logstash, Kibana）的优势

强大的数据处理能力：
Logstash 拥有丰富的数据处理和过滤插件，能够处理复杂的数据转换和增强，例如解析复杂的日志格式、添加字段、重命名字段、地理定位等。Logstash 支持高级的数据管道操作，如聚合、拆分、条件过滤等。 支持更多的数据源：
Logstash 可以从各种数据源收集数据，不仅仅是日志文件，还包括数据库、消息队列、HTTP 端点等。对于需要集成来自多个不同数据源的数据环境，Logstash 提供了更灵活的选择。 灵活的插件系统：
Logstash 提供了一个插件系统，可以轻松地添加输入、过滤和输出插件，以适应不同的应用场景。

EFK（Elasticsearch, Filebeat, Kibana）的优势

轻量级和高效：
Filebeat 是一个轻量级的日志收集器，专门设计用于收集和转发日志。它消耗的资源比 Logstash 少，因此在性能和效率上更优，尤其适合在资源受限的环境中使用（例如 Kubernetes 环境中的容器）。Filebeat 更容易配置和部署，不需要像 Logstash 那样处理复杂的配置文件和插件管理。 简单易用：
Filebeat 的配置文件相对简单，易于维护和管理。对于基本的日志收集场景，配置成本较低。Filebeat 有内置的模块（例如 system，nginx，apache 等），这些模块已经预先配置好收集和解析某些常见服务的日志，减少了手动配置的工作量。 更适合 Kubernetes 环境：
Filebeat 与 Kubernetes 原生集成得很好，支持自动发现容器日志，可以轻松将每个容器的日志收集并发送到 Elasticsearch。它能自动添加 Kubernetes 元数据（例如 pod 名称、命名空间、标签等），方便在 Kibana 中进行基于 Kubernetes 元数据的日志搜索和分析。在 Kubernetes 环境中，直接部署 Filebeat 作为 DaemonSet 可以高效收集集群中所有节点的日志。 可靠的数据传输：
Filebeat 有内置的背压机制和可靠的传输协议（如使用 ACK 确认机制的 Elasticsearch 输出），确保日志在传输过程中不会丢失。

什么时候选择 EFK（Filebeat）

资源受限的环境：如 Kubernetes 集群或需要在多台机器上部署日志采集器的环境。主要是日志收集，而不需要复杂的日志处理：如果你只需要将日志采集并发送到 Elasticsearch。希望减少复杂性和管理开销：Filebeat 更容易部署和维护。

什么时候选择 ELK（Logstash）

需要复杂的日志处理和增强：如正则表达式解析、数据过滤、条件处理、多步骤处理等。日志源种类繁多：不仅是日志文件，还有其他数据源，如数据库、消息队列等。系统资源不是主要问题：在高性能服务器或数据中心环境中部署。

总之，Filebeat 在轻量、简洁、高效的场景下表现更好，而 Logstash 在需要复杂日志处理的场景下更为适用。根据你的需求选择适合的工具可以显著提高日志收集系统的效率和性能。

前面，我们已经在k8s环境中部署好了ElasticSearch和Kibana。并且我们只是简单的收集一下后端服务产生的打印日志，所以这里我选择使用filebeat去收集日志。

二、部署Filebeat服务

2.1、创建目录

mkdir -p /home/ec2-user/k8s/elk/filebeat
cd /home/ec2-user/k8s/elk/filebeat

12