Logstash将日志写入Redis

为什么要使用Redis

在企业中,日志规模的量级远远超出我们的想象,这就是为什么会有一家公司日志易专门做日志收集,给大型金融公司收集日志,比如银行,因为你有可能看到,1秒钟好几千万的日志量,往服务器写入,那么企业中的集群,架构都不是单台的,而是多台的,一台如果是1千万,那么5台的量级,10台的量级,我们要对他们进行收集,进行分析,难免会在网络传输过程中,丢数据。

日志是什么?
日志对于企业来说,有什么作用?
用户使用我们的产品,体验如何?
用户的客诉,我们能拿出什么样的数据来说话?

一系列的问题,都和日志相关,如果至关重要的那个数据丢失了,那么公司的损失可不仅仅是一条日志那么简单。如果我们不知道,用户对我们产品最感兴趣的地方在哪,那么产品的寿命也就越来越短。如果被攻击了,恶意攻击的IP源我们都找不到,那么或许就不是产品的寿命越来越短,而是这个企业存在的寿命,越来越短。

好吧,一顿排比句,说的那么浮夸,说白了,我就是想要告诉你们,一个大规模日志量级的企业想要做到数据的安全性,数据的一致性,我们需要消息队列:Redis , Kafka,在ELK5版本中,建议使用Redis来做消息队列,Kafka能不能用?也能,只不过会有一些不必要的坑,需要我们去爬。在ELK6版本中,开始使用Kafka来做消息队列。

话不多说,我们接下来就开始将Logstash收集到的日志,输出到Redis中。


Redis部署

#下载
[root@linux-node4 ~]# wget http://download.redis.io/releases/redis-3.2.12.tar.gz
#解压
[root@linux-node4 ~]# tar xf redis-3.2.12.tar.gz
#移动到指定目录
[root@linux-node4 ~]# mv redis-3.2.12 /application/
#做软链接
[root@linux-node4 ~]# ln -s /application/redis-3.2.12 /application/redis
#进入redis目录
[root@linux-node4 ~]# cd /application/redis
#编译
[root@linux-node4 redis]# make
#添加环境变量
[root@linux-node4 redis]# vim /etc/profile.d/redis.sh
export PATH="/application/redis/src:$PATH"
#创建配置文件存放目录
[root@linux-node4 ~]# mkdir -p /data/6379
#编辑redis配置文件
[root@linux-node4 ~]# vim /data/6379/redis.conf
port 6379
daemonize yes
pidfile /data/6379/redis.pid
logfile "/data/6379/redis.log"
dbfilename dump.rdb
dir /data/6379
protected-mode no
requirepass  zls
#启动redis
[root@linux-node4 ~]# redis-server /data/6379/redis.conf

Logstash收集日志输出至Redis

#进入Logstash配置文件目录
[root@linux-node1 ~]# cd /etc/logstash/conf.d/
#编辑Logstash配置文件
[root@linux-node1 conf.d]# vim log_to_redis.conf
input {
  file {
    path => "/usr/local/tomcat/logs/tomcat_access_log*.log"
    start_position => "end"
    type => "tc"
  }
  file {
    path => "/usr/local/nginx/logs/access_json.log"
    start_position => "end"
    type => "ngx"
    codec => json
  }
}

output {
  if [type] == "tc" {
    redis {
      data_type => "list"
      key => "tomcat_log"
      host => "192.168.6.243"
      port => "6379"
      db => "0"
      password => "zls"
   }
}
  if [type] == "ngx" {
    redis {
      data_type => "list"
      key => "nginx_log"
      host => "192.168.6.243"
      port => "6379"
      db => "1"
      password => "zls"
    }
  }
}
#启动Logstash
[root@linux-node1 conf.d]# /usr/share/logstash/bin/logstash -f /etc/logstash/conf.d/log_to_redis.conf &

验证Redis数据

#连接redis
[root@linux-node4 ~]# redis-cli -a zls
#在0库中查看所有key
127.0.0.1:6379> KEYS *
1) "tomcat_log"
#查看tomcat_log的长度(日志的条数)
127.0.0.1:6379> LLEN tomcat_log
(integer) 8
#切换1库
127.0.0.1:6379> SELECT 1
OK
#在1库中查看所有key
127.0.0.1:6379[1]> KEYS *
1) "nginx_log"
#查看nginx_log的长度(日志的条数)
127.0.0.1:6379[1]> LLEN nginx_log
(integer) 14

#演示Logstash如何取走一条nginx日志
127.0.0.1:6379[1]> LPOP nginx_log
"{\"referer\":\"-\",\"type\":\"ngx\",\"http_host\":\"www.elk.com\",\"url\":\"/index.html\",\"path\":\"/usr/local/nginx/logs/access_json.log\",\"upstreamhost\":\"-\",\"@timestamp\":\"2019-08-02T07:55:15.000Z\",\"size\":0,\"clientip\":\"192.168.6.240\",\"domain\":\"www.elk.com\",\"host\":\"192.168.6.240\",\"@version\":\"1\",\"responsetime\":0.0,\"xff\":\"192.168.3.46\",\"upstreamtime\":\"-\",\"status\":\"304\"}"
#再次查看长度
127.0.0.1:6379[1]> LLEN nginx_log
(integer) 13


#演示Logstash如何取走一条tomcat日志
127.0.0.1:6379> KEYS *
1) "tomcat_log"

127.0.0.1:6379> LLEN tomcat_log
(integer) 25

127.0.0.1:6379> LPOP tomcat_log
"{\"path\":\"/usr/local/tomcat/logs/tomcat_access_log2019-08-02.log\",\"@timestamp\":\"2019-08-02T07:59:50.404Z\",\"@version\":\"1\",\"host\":\"linux-node1.98yz.cn\",\"message\":\"{\\\"clientip\\\":\\\"192.168.6.240\\\",\\\"ClientUser\\\":\\\"-\\\",\\\"authenticated\\\":\\\"-\\\",\\\"AccessTime\\\":\\\"[02/Aug/2019:15:59:49 +0800]\\\",\\\"method\\\":\\\"GET / HTTP/1.1\\\",\\\"status\\\":\\\"304\\\",\\\"SendBytes\\\":\\\"-\\\",\\\"Query?string\\\":\\\"\\\",\\\"partner\\\":\\\"-\\\",\\\"AgentVersion\\\":\\\"Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36\\\"}\",\"type\":\"tc\"}"


#再次查看长度
127.0.0.1:6379> LLEN tomcat_log
(integer) 24


Logstash从Redis中取出日志输出到ES

#进入Logstash配置文件目录
[root@linux-node1 ~]# cd /etc/logstash/conf.d/
#编辑Logstash配置文件
[root@linux-node1 conf.d]# vim redis_to_es.conf
input {
  redis {
    data_type => "list"
    key => "tomcat_log"
    host => "192.168.6.243"
    port => "6379"
    db => "0"
    password => "zls"
    codec => "json"
  }

  redis {
    data_type => "list"
    key => "nginx_log"
    host => "192.168.6.243"
    port => "6379"
    db => "1"
    password => "zls"
  }
}

output {
  if [type] == "tc" {
    elasticsearch {
      hosts => ["192.168.6.241:9200"]
      index => "m.elk.com-%{+YYYY.MM.dd}"
  }
}

  if [type] == "ngx" {
    elasticsearch {
      hosts => ["192.168.6.241:9200"]
      index => "www.elk.com-%{+YYYY.MM.dd}"
    }
  }
}
#启动Logstash
[root@linux-node1 conf.d]# /usr/share/logstash/bin/logstash -f /etc/logstash/conf.d/redis_to_es.conf &

验证Logstash中的数据是否被取出

#连接Redis
[root@linux-node4 ~]# redis-cli -a zls
#查看所有key
127.0.0.1:6379> KEYS *
(empty list or set)
#切换1库
127.0.0.1:6379> SELECT 1
OK
#查看所有key
127.0.0.1:6379[1]> KEYS *
(empty list or set)


在ES中查看数据

打开浏览器,访问:http://192.168.6.241:9100/


将ES索引添加到Kibana中

打开浏览器,访问:http://192.168.6.243:5601


Redis key堆积监控

实际环境当中,可能会出现reids当中堆积了大量的数据而logstash由于种种原因未能及时提取日志,此时会导致redis服务器的内存被大量使用,甚至出现如下内存即将被使用完毕的情景.

[root@linux-node4 ~]# free -m
              total        used        free      shared  buff/cache   available
Mem:           3790        3142         432           2         215         406
Swap:          1023         630         393
[root@linux-node4 ~]# vim redis_keylenth.py
#!/usr/bin/env python
#coding:utf-8
#Author Driver_Zeng
import redis
def redis_conn():
    pool=redis.ConnectionPool(host="192.168.6.243",port=6379,db=2,password='zls')
    conn = redis.Redis(connection_pool=pool)
    data = conn.llen('tn')
    print(data)
redis_conn()

[root@linux-node4 ~]# python3 redis_keylenth.py
259
文档更新时间: 2019-08-02 16:39   作者:李延召