当前位置:首页 > 文章 > 正文内容

你所不知道的日志异步落库

廖万里2年前 (2022-10-27)文章86724

在互联网设计架构过程中,日志异步落库,俨然已经是高并发环节中不可缺少的一环。为什么说是高并发环节中不可缺少的呢? 原因在于,如果直接用mq进行日志落库的时候,低并发下,生产端生产数据,然后由消费端异步落库,是没有什么问题的,而且性能也都是异常的好,估计tp99应该都在1ms以内。但是一旦并发增长起来,慢慢的你就发现生产端的tp99一直在增长,从1ms,变为2ms,4ms,直至send timeout。尤其在大促的时候,我司的系统就经历过这个情况,当时mq的发送耗时超过200ms,甚至一度有不少timeout产生。

考虑到这种情况在高并发的情况下才出现,所以今天我们就来探索更加可靠的方法来进行异步日志落库,保证所使用的方式不会因为过高的并发而出现接口ops持续下降甚至到不可用的情况。

 

方案一: 基于log4j的异步appender实现

此种方案,依赖于log4j。在log4j的异步appender中,通过mq进行生产消费入库。相当于在接口和mq之间建立了一个缓冲区,使得接口和mq的依赖分离,从而不让mq的操作影响接口的ops。

此种方案由于使用了异步方式,且由于异步的discard policy策略,当大量数据过来,缓冲区满了之后,会抛弃部分数据。此种方案适用于能够容忍数据丢失的业务场景,不适用于对数据完整有严格要求的业务场景。

来看看具体的实现方式:

首先,我们需要自定义一个Appender,继承自log4j的AppenderSkeleton类,实现方式如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
public class AsyncJmqAppender extends AppenderSkeleton {
 
    @Resource(name = "messageProducer")
    private MessageProducer messageProducer;
 
    @Override
    protected void append(LoggingEvent loggingEvent) {
        asyncPushMessage(loggingEvent.getMessage());
    }
 
    /**
     * 异步调用jmq输出日志
     * @param message
     */
    private void asyncPushMessage(Object message) {
 
        CompletableFuture.runAsync(() -> {
 
            Message messageConverted = (Message) message;
 
            try {
                messageProducer.send(messageConverted);
            catch (JMQException e) {
                e.printStackTrace();
            }
 
        });
    }
 
 
    @Override
    public boolean requiresLayout() {
        return false;
    }
 
    @Override
    public void close() {
 
    }
}

然后在log4j.xml中,为此类进行配置:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
<!--异步JMQ appender-->
<appender name="async_mq_appender" class="com.jd.limitbuy.common.util.AsyncJmqAppender">
    <!-- 设置File参数:日志输出文件名 -->
    <param name="File" value="D:/export/Instances/order/server1/logs/order.async.jmq" />
    <!-- 设置是否在重新启动服务时,在原有日志的基础添加新日志 -->
    <param name="Append" value="true" />
    <!-- 设置文件大小 -->
    <param name="MaxFileSize" value="10KB" />
    <!-- 设置文件备份 -->
    <param name="MaxBackupIndex" value="10000" />
    <!-- 设置输出文件项目和格式 -->
    <layout class="org.apache.log4j.PatternLayout">
        <param name="ConversionPattern" value="%m%n" />
    </layout>
</appender>
<logger name="async_mq_appender_logger">
    <appender-ref ref="async_mq_appender"/>
</logger>

最后就可以按照如下的方式进行正常使用了:

1
private static Logger logger = LoggerFactory.getLogger("filelog_appender_logger");

注意: 此处需要注意log4j的一个性能问题。在log4j的conversionPattern中,匹配符最好不要出现 C% L%通配符,压测实践表明,这两个通配符会导致log4j打日志的效率降低10倍。

方案一很简便,且剥离了接口直接依赖mq导致的性能问题。但是无法解决数据丢失的问题(但是我们其实可以在本地搞个策略落盘来不及处理的数据,可以大大的减少数据丢失的几率)。但是很多的业务场景,是需要数据不丢失的,所以这就衍生出我们的另一套方案来。

 

方案二:增量消费log4j日志

此种方式,是开启worker在后台增量消费log4j的日志信息,和接口完全脱离。此种方式相比方案一,可以保证数据的不丢失,且可以做到完全不影响接口的ops。但是此种方式,由于是后台worker在后台启动进行扫描,会导致落库的数据慢一些,比如一分钟之后才落库完毕。所以适用于对落库数据实时性不高的场景。

具体的实现步骤如下:

首先,将需要进行增量消费的日志统一打到一个文件夹,以天为单位,每天生成一个带时间戳日志文件。由于log4j不支持直接带时间戳的日志文件生成,所以这里需要引入log4j.extras组件,然后配置log4j.xml如下:

你所不知道的日志异步落库

之后在代码中的申明方式如下:

1
private static Logger businessLogger = LoggerFactory.getLogger("file_rolling_logger");

最后在需要记录日志的地方使用方式如下:

1
businessLogger.error(JsonUtils.toJSONString(myMessage))

这样就可以将日志打印到一个单独的文件中,且按照日期,每天生成一个。

然后,当日志文件生成完毕后,我们就可以开启我们的worker进行增量消费了,这里的增量消费方式,我们选择RandomAccessFile这个类来进行,由于其独特的位点读取方式,可以使得我们非常方便的根据位点的位置来消费增量文件,从而避免了逐行读取这种低效率的实现方式。

注意,为每个日志文件都单独创建了一个位点文件,里面存储了对应的文件的位点读取信息。当worker扫描开始的时候,会首先读取位点文件里面的位点信息,然后找到相应的日志文件,从位点信息位置开始进行消费。这就是整个增量消费worker的核心。具体代码实现如下(代码太长,做了折叠):


本文链接:https://www.kkkliao.cn/?id=137 转载需授权!

分享到:

添加博主微信共同交流探讨信息差网赚项目: 19528888767 , 请猛戳这里→点我添加

版权声明:本文由廖万里的博客发布,如需转载请注明出处。

“你所不知道的日志异步落库” 的相关文章

日本拆无人机后曝光:核心芯片来自美国,大疆会走上华为的老路吗?

日本拆无人机后曝光:核心芯片来自美国,大疆会走上华为的老路吗?

大疆无人机在日被拆解,确认核心部件源自美国?在无人机领域盛传一句话:“世界无人机只分为两类,大疆和其他‘玩具机’”。因此,作为入选了胡润全球独角兽企业的大疆无人机公司,一直是美国、日本等多个国家高精尖企业眼中的“香饽饽”。他们试图攻克大疆的操作原理,更致力于找到突破中国无人机第一的弱点。2020年大...

突然崩了!一则大消息,这类股集体跳水,2000亿巨头重挫12%!千亿疫苗白马暴跌16%!信创板块又火了,恒生科技指数继续大涨

突然崩了!一则大消息,这类股集体跳水,2000亿巨头重挫12%!千亿疫苗白马暴跌16%!信创板块又火了,恒生科技指数继续大涨

中国基金报 颜颖大家好,来一起关注今天上午的市场行情和最新资讯。10月27日上午,A股重要指数全线高开:上证指数高开0.18%,深证成指涨0.23%,创业板指涨0.18%。盘面上,发电设备、贵金属、教育等板块早盘涨幅居前,医疗板块陷入调整,旅游、海运等板块跌幅居前。港股市场高调高开:恒指高开2.63...

蛋黄胆固醇高,还能不能吃?早上坚持吃水煮蛋,有什么好处?

蛋黄胆固醇高,还能不能吃?早上坚持吃水煮蛋,有什么好处?

说到鸡蛋,能想到很多食物,只是一颗小小的鸡蛋,却能变着花样的去进行制作,且大多还是比较简单的做法,其中一个比较简单的做法,也是大家比较常用的一个做法,就是清水煮鸡蛋。有的人早餐会吃一个水煮鸡蛋,可帮助补充营养,适当多吃鸡蛋,确实能给身体带来一些好处,同样,也是会存在一些不好的说法,让部分人群对于吃鸡...

6G专利申请量比拼:美国占比35.2%,日本占比9.9%,中国排第几?

6G专利申请量比拼:美国占比35.2%,日本占比9.9%,中国排第几?

5G对于现在的人们来说已经不是什么神秘的存在,很多国家通过近些年的研究都已经逐步掌握了5G技术。不过就5G技术发展的成熟度、设备完善程度以及信号铺设范围来说,我国都是当之无愧的世界第一。但是随着科技技术的不断发展,对于6G的技术研发也被提上日程。不少国家都开始攻克6G技术,并取得了各项专利。根据有关...

微信一定要关闭的6个设置

微信一定要关闭的6个设置

微信里面的个人隐私信息必须要注意,尤其是微信里面设置里面的一些功能,都应该要及时关闭,以免自己就的个人隐私遭到暴露。1,自动扣费/免密支付项目点击我→服务→点击钱包→选择支付设置→关闭自动续费、免密支付,这两项不需要的。2,关闭自动下载点击我→设置→点击通用→选择照片/视频→关闭自动下载。如果不关闭...

最简单的生活一天花多少钱?

最简单的生活一天花多少钱?

90后负债女孩的极简主义:月薪6000+,一天的真实花销精简但你绝对想不到!广西农村姑娘在广州,网贷负债6w,人情债接近3w,到手月薪6000+,在珠江新城商业CBD上班,一天真实的花销在多少?道出多少负债人的辛酸!疫情这3年的收入,固定死工资基本就这个数了,负债之下一直没啥存款,都是还没发工资都被...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。