Kafka- flume报错：org.apache.flume.ChannelFullException: The channel has reached it‘s capacity.|电子爱好者

admin管理员组
文章数量:1611515

场景还原:

在测试环境进行数据清洗，由原始日志数据发送至HDFS，过程为：

原始日志文件–>flume->kafka->flume->HDFS

今天测试一亿条数据时出现问题，问题发生位置在flume->HDFS,问题整体描述如下：

  ERROR kafka.KafkaSource: KafkaSource EXCEPTION, {}
org.apache.flume.ChannelFullException: The channel has reached it's capacity. This might be the result of a sink on the channel having too low of batch size, a downstream system running slower than normal, or that the channel capacity is just too low. [channel=c2]
	at org.apache.flume.channel.file.FileChannel$FileBackedTransaction.doPut(FileChannel.java:505)
	at org.apache.flume.channel.BasicTransactionSemantics.put(BasicTransactionSemantics.java:93)
	at org.apache.flume.channel.BasicChannelSemantics.put(BasicChannelSemantics.java:80)
	at org.apache.flume.channel.ChannelProcessor.processEventBatch(ChannelProcessor.java:191)
	at org.apache.flume.source.kafka.KafkaSource.doProcess(KafkaSource.java:311)
	at org.apache.flume.source.AbstractPollableSource.process(AbstractPollableSource.java:60)
	at org.apache.flume.source.PollableSourceRunner$PollingRunner.run(PollableSourceRunner.java:133)
	at java.lang.Thread.run(Thread.java:748)

问题原因分析

主要看一下这一句:
org.apache.flume.ChannelFullException: The channel has reached it's
 capacity. This might be the result of a sink on the channel having too
 low of batch size, a downstream system running slower than normal, or
 that the channel capacity is just too low. [channel
译文:

这可能是由于通道上的接收器批大小过低、下游系统运行速度比正常慢，或者通道容量过低造成的。

分析:

日志打出来的很清楚了,意思就是HDFS Sink 接受的速度小于source的速度,还有一种可能就是channel的内存较小,导致数据溢出.所以根据日志在CDH中进行参数调整,将上述问题的情况调整一下.

操作步骤

调整channel的内存大小,设置超时时间,对大数据量进行缓冲.

参数说明
capacity 在 channel 中最多能保存多少个 event。默认是100
transactionCapacity 在每次从source中获取数据或者将数据sink出去的一次事务操作中，最多处理的 event 数。默认是100
byteCapacity 在 channel 中最多能容纳所有event body的总字节数。默认是 JVM最大可用内存（-Xmx ）的80% 。需要注意的是，如> 果你设置多个memory channel，并且它们的数据都是从同一个source来的，那么计算时是用所有channel中event body的字节数加起来计> 算的，也就是说会重复计算，所以需要注意一下。不建议将该值设置为0
byteCapacityBufferPercentage 这个值的含义跟上面一样，只不过这个是计算event header跟最大可用内存的字节占比。默认是20，也> > 就是最大可用内存的20%
keep-alive 尝试添加或者删除一个event的超时时间，单位为秒。默认是3，也就是3秒

我的设置如下:
通道支持事务的最大大小
a1.channels.c1.transactionCapacity=1000000
#添加或者删除一个event的超时时间，单位为秒，默认是3
a1.channels.c1.keep-alive=60
#添加event，最多保存多少个event，默认是100
a1.channels.c1.capacity=1000000
C2也进行了如上配置,最后flume没报错,并且开始上传一亿条数据.

参数	说明
capacity	在 channel 中最多能保存多少个 event。默认是100
transactionCapacity	在每次从source中获取数据或者将数据sink出去的一次事务操作中，最多处理的 event 数。默认是100
byteCapacity	在 channel 中最多能容纳所有event body的总字节数。默认是 JVM最大可用内存（-Xmx ）的80% 。需要注意的是，如> 果你设置多个memory channel，并且它们的数据都是从同一个source来的，那么计算时是用所有channel中event body的字节数加起来计> 算的，也就是说会重复计算，所以需要注意一下。不建议将该值设置为0
byteCapacityBufferPercentage	这个值的含义跟上面一样，只不过这个是计算event header跟最大可用内存的字节占比。默认是20，也> > 就是最大可用内存的20%
keep-alive	尝试添加或者删除一个event的超时时间，单位为秒。默认是3，也就是3秒

总结

在数据量大的时候,我们需要清楚flume以及kafka的运行机制,并且要知道flume的吞吐量,

比如说一亿条数据,采用flume的默认event保存机制100条是完全不够支撑的,

将超时时间换做60s给予缓冲,使用1000000的event来进行存储则可以解决面对的问题.

第二种解决办法(未尝试)

从java最大内存大小入手

修改java最大内存大小

vi bin/flume-ng

JAVA_OPTS="-Xmx2048m"

把jvm的堆空间设置大一点，防止flume本身的配置满足要求，但是堆大小不满足

参考链接

参考一:参考链接 1

参考二:参考链接 2

本文标签：报错 org Kafka flume Apache

版权声明：本文标题：Kafka- flume报错：org.apache.flume.ChannelFullException: The channel has reached it‘s capacity. 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1728620378a1166280.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

‘UTF-8‘ codec can‘t decode byte 0xcd in position 2: invalid continuation byte:python报错

6小时前

在python中读取文件时，有时会遇到这个报错: utf-8 codec cant decode byte 0xcd in position 2: invalid continuation byte 其实就是文件的编

UnicodeEncodeError: 'latin-1' codec can't encode characters in position报错问题

6小时前

UnicodeEncodeError: ‘latin-1’ codec can’t encode characters in position问题问题： UnicodeEncodeError: latin-1 cod

Python报错 UnicodeDecodeError: ‘gbk‘ codec can‘t decode bytein position 2: illegal multibyte sequence

6小时前

Python在读取文本信息时候出现以下的错误提示： UnicodeDecodeError: gbk codec cant decode byte 0xbf in position 2: illegal multiby

Unexpected token o in JSON at position 1 报错原因及解决方法

6小时前

解决： 使用JSON.stringify()方法 cookie.set(guli_ucenter, JSON.stringify(this.loginInfo), { domain: localhost }) 将

pandas - read_csv报错：‘utf-8‘‘gbk‘ codec can‘t decode byte 0xb1 in position 0:invalid start byte

6小时前

文章目录问题描述原因解决方法问题描述桌面上有个Excel文件，转换为csv文件后，导入jupyter notebook，read_csv报错：

运行.py文件报错：UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xaf in position 55: illegal multibyte

6小时前

运行一个py文件时，控制台报如下错误，这个报错原因是python和win10系统，打开文件时默认的编码方式冲突导致：python默认的是gbk&

python3报错处理：UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 0-1

6小时前

一、背景说明最开始不愿意使用Python，一大原因是因为Python2默认使用ASCII编码处理中文可以说是一件痛苦的事情。仅从更换默认编码一项变换，就可以说Python3和Python2不算

TypeError: conv2d(): argument ‘padding‘ (position 5) must be tuple of ints, not str【报错】

5小时前

出现这个错误可能不是程序本身的错误，我在找的时候并没有发现程序中padding有相关的赋值，conv2d的参数都是封装好的。查看需要安装的包发现是torch版本的问题，所

Unexpected token o in JSON at position 1 报错原因

5小时前

写在前面的话这个问题在之前做项目时碰到过一次，当时按照网上的做法，去掉JSON.parse()这一层转换后就没有这个报错了，数据也能正常使用，就没多想

python爬虫(使用requests)报错，UnicodeEncodeError: ‘latin-1‘ codec can‘t encode characters in position

5小时前

1、初学爬虫，在写爬取拉勾网职位信息程序时，遇到报错如下： 2、查找资料后发现，在使用response.post发送带中文的json数据时&#x

解决python报错：‘gbk‘ codec can‘t decode byte 0x99 in position 1008: illegal multibyte sequence

5小时前

python读取文件时，出现UnicodeError报错，如下：解决方法： open(‘filename’,‘r’, encoding‘UTF-8’

报错Uncaught SyntaxError: Unexpected token ( in JSON at position 0 at htmlloginlogin.html:1

5小时前

报错信息： Uncaught SyntaxError: Unexpected token ( in JSON at position 0 at htmlloginlogin.html:1首先点击定位到positi

完美解决：python报错：‘utf-8‘ codec can‘t decode byte 0xa1 in position 56: invalid start byte

5小时前

现在很多读取文件默认就是使用utf-8来解码，但是有一些文本文件编码的时候却不一定使用的是utf-8编码，所以读取会出问题。解决办法： 1.打开文件另存为&#xf

Hibernate异常之org.hibernate.QueryParameterException:Position beyond number of declared ordinal .....

5小时前

1、异常描述 org.hibernate.QueryParameterException: Position beyond number of declared ordinal parameters.Remember that ord

惠普主机做完系统报错“选定的启动映像未通过身份验证”

5小时前

搜了一堆资料折腾半天，发现官网的教程最靠谱。 https:support.hpcn-zhdocumentc05194536

关于win7win10连接共享打印机出现报错0x00000011b问题

2小时前

win10更新后部分局域网电脑无法连接到打印机并报错异常0x00000011b。主要原因是win10的部分更新补丁有问题导致，主要是（KB5005565）的更新后出现的

flume —— capacity、transactionCapacity、flumeBatchSize、BatchSize解释与优化

2小时前

flume 调优配置参数解释 channel type必填：memory capacity默认值：100解释：通道中存储的最大事件数 transactio

flume启动失败：org.apache.flume.ChannelException: Put queue for MemoryTransaction of capacity 10000 full

1小时前

flume.conf配置报错日志信息：跪求大神解决！

flutter项目报错：Error: Entrypoint isn‘t within the current project

5分钟前

Error: Entrypoint isnt within the current project 网上看到很多中解决办法，但是我都试了都不行；然后换了一种搜索方式搜到一篇文章大概是我不小心

【实习小tip】axios发送POST请求时携带文件加参数的写法以及文件上传报错：Current request is not a multipart request

1分钟前

问题：axios发送POST请求时携带文件加参数的写法以及文件上传报错：Current request is not a multipart request Current request is

电子爱好者 - 最新技术资讯及电子产品介绍！

Kafka- flume报错：org.apache.flume.ChannelFullException: The channel has reached it‘s capacity.

场景还原:

在测试环境进行数据清洗，由原始日志数据发送至HDFS，过程为：

原始日志文件–>flume->kafka->flume->HDFS

今天测试一亿条数据时出现问题，问题发生位置在flume->HDFS,问题整体描述如下：

问题原因分析

主要看一下这一句:

译文:

这可能是由于通道上的接收器批大小过低、下游系统运行速度比正常慢，或者通道容量过低造成的。

分析:

日志打出来的很清楚了,意思就是HDFS Sink 接受的速度小于source的速度,还有一种可能就是channel的内存较小,导致数据溢出.所以根据日志在CDH中进行参数调整,将上述问题的情况调整一下.

操作步骤

调整channel的内存大小,设置超时时间,对大数据量进行缓冲.

我的设置如下:

C2也进行了如上配置,最后flume没报错,并且开始上传一亿条数据.

总结

在数据量大的时候,我们需要清楚flume以及kafka的运行机制,并且要知道flume的吞吐量,

比如说一亿条数据,采用flume的默认event保存机制100条是完全不够支撑的,

将超时时间换做60s给予缓冲,使用1000000的event来进行存储则可以解决面对的问题.

第二种解决办法(未尝试)

从java最大内存大小入手

修改java最大内存大小

vi bin/flume-ng

JAVA_OPTS="-Xmx2048m"

把jvm的堆空间设置大一点，防止flume本身的配置满足要求，但是堆大小不满足

参考链接

参考一:参考链接 1

参考二:参考链接 2

更多相关文章

‘UTF-8‘ codec can‘t decode byte 0xcd in position 2: invalid continuation byte:python报错

UnicodeEncodeError: 'latin-1' codec can't encode characters in position报错问题

Python报错 UnicodeDecodeError: ‘gbk‘ codec can‘t decode bytein position 2: illegal multibyte sequence

Unexpected token o in JSON at position 1 报错原因及解决方法

pandas - read_csv报错：‘utf-8‘‘gbk‘ codec can‘t decode byte 0xb1 in position 0:invalid start byte

运行.py文件报错：UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xaf in position 55: illegal multibyte

python3报错处理：UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 0-1

TypeError: conv2d(): argument ‘padding‘ (position 5) must be tuple of ints, not str【报错】

Unexpected token o in JSON at position 1 报错原因

python爬虫(使用requests)报错，UnicodeEncodeError: ‘latin-1‘ codec can‘t encode characters in position

解决python报错：‘gbk‘ codec can‘t decode byte 0x99 in position 1008: illegal multibyte sequence

报错Uncaught SyntaxError: Unexpected token ( in JSON at position 0 at htmlloginlogin.html:1

完美解决：python报错：‘utf-8‘ codec can‘t decode byte 0xa1 in position 56: invalid start byte

Hibernate异常之org.hibernate.QueryParameterException:Position beyond number of declared ordinal .....

惠普主机做完系统报错“选定的启动映像未通过身份验证”

关于win7win10连接共享打印机出现报错0x00000011b问题

flume —— capacity、transactionCapacity、flumeBatchSize、BatchSize解释与优化

flume启动失败：org.apache.flume.ChannelException: Put queue for MemoryTransaction of capacity 10000 full

flutter项目报错：Error: Entrypoint isn‘t within the current project

【实习小tip】axios发送POST请求时携带文件加参数的写法以及文件上传报错：Current request is not a multipart request

发表评论

推荐文章

forlinx335x系统移植

WIN10 系统如何安装 IIS (Internet Information Services) 因特网信息服务

【Leetcode】1678. Goal Parser Interpretation

win7环境下安装office2010及其安装过程中出现error1935解决办法

maven出现No plugin found for prefix ‘help‘ in the current project and in the plugin groups [org.ap

热门文章

win10计算机管理 用户,Win10专业版系统管理员帐户的开启设置方法

virt-manager打开img镜像卡在further output written to devttyS0

Connection timed out: connect. If you are behind an HTTP proxy, please configure the proxy settings

我心中的微信小程序 韩俊强的博客

“no space left on device”（磁盘空间不足）问题

关于社会大环境

Dicom Tag（决定CT成像的方向）： Image Position，Image Orientation和Patient Position

使用windows必备的185个技巧

用2个无线路由器桥接实现扩大无线范围方法

IE11 For Win7、win2008中文版官方下载地址

最新文章

【unity】android错误Field currentActivity or type signature not found

currentdate mysql,如何使用列时间戳默认为current_date创建mysql表？

升级 GLIBC 2.29 checking LD_LIBRARY_PATH variable... contains current directory error 解决方案

ElementUI分页Pag的currentPage自动到第一页

Collecting package metadata (current_repodata.json): failed

NavigationDuplicated: Avoided redundant navigation to current location: “home“.

oracle current_schema参数详解

centos7的mysql启动不了：log sequence number 2710184143 is in the future! Current system log sequence numbe

proto_path passed empty directory name. (Use “.“ for current directory.)

Bug：el-pagination设置current-page渲染失败

jenkins报SSH: Current build result is [NOT_BUILT], not going to run.错误

将超时时间换做60s给予缓冲,使用`1000000`的event来进行存储则可以解决面对的问题.

`第二种解决办法(未尝试)`

`从java最大内存大小入手`

`修改java最大内存大小`

`vi bin/flume-ng`

`JAVA_OPTS="-Xmx2048m"`

`把jvm的堆空间设置大一点，防止flume本身的配置满足要求，但是堆大小不满足`

win10计算机管理用户,Win10专业版系统管理员帐户的开启设置方法

我心中的微信小程序韩俊强的博客

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载