搜索

回答

Storm的计算模型：

针对每条记录的流式实时计算框架，是一种比较纯粹的实时计算框架，但是存在一个问题！
Storm由于每来一条数据都会处理下，所以吞吐量并不高。
为什么吞吐量不高？
因为每条数据过来就直接处理，那么每条数据的处理都存在开销。也就是说，storm机器的很多计算资源都会消耗在大量的其他方面，比如数据的传输、校研，通信等等，所以吞吐量并不能说非常高！

Spark streaming流计算框架：
会把一个时间batch里面过来的数据都收集起来，然后再一次性，作为一个batch给Spark Streaming Application进行处理。
Spark streaming的计算模型是基于batch的，所以严格意义上来说，spark streaming不是纯碎的实时计算框架，更多的是一种准实时计算框架。
所以，Spark streaming的吞吐量，远远高于Storm，因为对每条数据处理的额外开销少了。对一个batch，才有数据传输、通信的开销。

Storm支持在分布式流式计算程序（Topology）在运行过程中，动态的调整并行度，从而动态提高并发处理能力，而spark Streaming是无法动态调整并行度的。

网友回复

我知道答案，我要回答

我有问题

回答

win10上powershell运行wsl报错Wsl/0x80072f7d如何解决？

人工智能技术属于科学范畴吗？

pi与claw及codex有啥不同？

有没有在电脑上运行iphone虚拟机的软件？

如何将电脑扬声器声音同步输出到另外一台手机或电脑上/

为啥图片和视频大模型的提示词支持json和python代码？

Chromium的 Kiosk 模式是干啥的？

豆包如何生成15秒以上的视频？

ai文本大模型最后会升级成做任何动画片吗？

python有没有一键扒谱和音乐背景旋律与人声分离的库？