走进Spark Streaming
文件大小: 117k
源码售价: 10 个金币 积分规则     积分充值
资源说明:离散流DStream DStream是Spark Streaming中的一个最基本的抽象,代表了一系列连续的数据流,本质上就是一系列的RDD。StreamingContext会根据设置的批处理的时间间隔将产生的RDD归为一批,这一批RDD就是一个DStream,该DStream里面产生都是相同业务逻辑的RDD,只不过是RDD里面读取的数据不相同。 DStream每隔一段时间生成一个RDD,我们对DStream进行操作,本质上就是对里面的对应时间的RDD进行操作。 DStream与DStream之间存在依赖关系,在一个固定时间点,两个存在依赖关系的DStream对应的RDD也存在依赖关系,每个
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。