logstash filter 处理json

时间：2019-04-03 18:27:41 阅读：262 评论：0 收藏：0 [点我收藏+]

根据输入的json字段，分别建立索引。循环生成注册log和登录log保存到testlog文件中,结果如下:

{"method":"register","user_id":2933,"user_name":"name_91","level":27,"login_time":1470179550}
{"method":"login","user_id":1247,"user_name":"name_979","level":1,"register_time":1470179550}
{"method":"register","user_id":2896,"user_name":"name_1972","level":17,"login_time":1470179550}
{"method":"login","user_id":2411,"user_name":"name_2719","level":1,"register_time":1470179550}
{"method":"register","user_id":1588,"user_name":"name_1484","level":4,"login_time":1470179550}
{"method":"login","user_id":2507,"user_name":"name_1190","level":1,"register_time":1470179550}
{"method":"register","user_id":2382,"user_name":"name_234","level":21,"login_time":1470179550}
{"method":"login","user_id":1208,"user_name":"name_443","level":1,"register_time":1470179550}
{"method":"register","user_id":1331,"user_name":"name_1297","level":3,"login_time":1470179550}
{"method":"login","user_id":2809,"user_name":"name_743","level":1,"register_time":1470179550}

logstash目录下建立配置文件

vim config/json.conf

input {
    file {
        path => "/home/bona/logstash-2.3.4/testlog"
        start_position => "beginning"
        codec => "json"
    }
}


output {
   elasticsearch {
        hosts => ["192.168.68.135:9200"]
        index => "data_%{method}"
   }
}

重点是index中，%{method} 来匹配log中的method字段.

以上log就会分别建立data_login data_register两个索引, 要注意的是索引名称必须全部小写

以下是实例

原始数据：

{"countnum":2,"checktime":"2017-05-23 16:59:32"}

1、无涉及字段类型转换 logstash filter 配置如下参数即可

if [type] == "onlinecount" {

json{

source => "message"

}

2、涉及字段类型转换

logstash filter

if [type] == "onlinecount" {

mutate{

split=>["message",","]

add_field => {

"coutnum" => "%{[message][0]}"

}

add_field => {

"checktime" => "%{[message][1]}"

}

remove_field => ["message"]

}

json{

source => "coutnum"

source => "checktime"

#convert => { "coutnum" => "integer" }

target => "coutnum"

target => "checktime"

}

kafka数据：{
{"cluster":"qy_api_v2_pool","body_bytes_sent":"8579","http_versioncode":"Android_32"}\n
{"cluster":"qy_api_v2_pool","body_bytes_sent":"8579","http_versioncode":"Android_33"}\n
{"cluster":"qy_api_v2_pool","body_bytes_sent":"8579","http_versioncode":"Android_34"}\n
....
}

kafka团队因考虑性能问题，将原始日志多条合并一条发送（每一条用换行符分割），这样我读的kafka就必须拆成一条一条的写入到ES，不然数据就不准确了，请问这种需求该如何处理呢？

已解决，开始走了弯路，用的下列方法导致还在一条数据
filter {
mutate {
split=>["message","
"]
}

正解方案
filter {
split {
field => "message"
}

还有一个小问题split中terminator默认是\n,但是我如下写法为什么切割不成功呢，不写terminator是可以的
filter {
split {
field => "message"
terminator => "\\n"
}

现有json:

{
"name":"zhangsan",
"friends":
{
"friend1":"lisi",
"friend2":"wangwu",
"msg":["haha","yaya"]
}
}
1
2
3
4
5
6
7
8
9
将其解析为:

{
"name":"zhangsan",
"friend1":"lisi",
"friend2":"wangwu",
"msg":["haha","yaya"]
}
1
2
3
4
5
6
logstash.conf

input
{
stdin
{
codec => json
}
}

filter
{
mutate
{
add_field => { "@friends" => "%{friends}" } #先新建一个新的字段，并将friends赋值给它
}
json
{
source => "@friends" #再进行解析
remove_field => [ "@alert","alert" ] #删除不必要的字段，也可以不用这语句
}
}

output
{
stdout { }
}
---------------------
作者：姚贤贤
来源：CSDN
原文：https://blog.csdn.net/u011311291/article/details/86743642
版权声明：本文为博主原创文章，转载请附上博文链接！

logstash filter 处理json

原文：https://www.cnblogs.com/bigben0123/p/10650660.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)