大数据流式处理spark streaming与storm怎么选?
网友回复
Storm的计算模型:
针对每条记录的流式实时计算框架,是一种比较纯粹的实时计算框架,但是存在一个问题! Storm由于每来一条数据都会处理下,所以吞吐量并不高。 为什么吞吐量不高? 因为每条数据过来就直接处理,那么每条数据的处理都存在开销。也就是说,storm机器的很多计算资源都会消耗在大量的其他方面,比如数据的传输、校研,通信等等,所以吞吐量并...点击查看剩余70%
大数据流式处理spark streaming与storm怎么选?
网友回复
Storm的计算模型:
针对每条记录的流式实时计算框架,是一种比较纯粹的实时计算框架,但是存在一个问题! Storm由于每来一条数据都会处理下,所以吞吐量并不高。 为什么吞吐量不高? 因为每条数据过来就直接处理,那么每条数据的处理都存在开销。也就是说,storm机器的很多计算资源都会消耗在大量的其他方面,比如数据的传输、校研,通信等等,所以吞吐量并...点击查看剩余70%