流式计算适用于什么样的场景?宜信普惠为你科普

2023-06-28 16:54:08

 

在如今的大数据时代,流式计算的应用可谓是至关重要。流式计算可以广泛应用于金融银行、互联网、物联网等诸多领域,如股市实时分析、插入式广告投放、交通流量实时预警等场景,主要是为了满足该场景下的实时应用需求。

数据往往以数据流的形式持续到达数据计算系统,计算功能的实现是通过有向任务图的形式进行描述,数据流在有向任务图中流过后,会实时产生相应的计算结果。整个数据流的处理过程往往是在毫秒级的时间内完成的,这只有流式计算能达到。

那么流式计算有哪些特点呢?又适用于哪些场景呢?接下来就跟随宜信普惠来看下吧。

流计算的特点:

1、实时(realtime)且无界(unbounded)的数据流。流计算面对计算的 是实时且流式的,流数据是按照时间发生顺序地被流计算订阅和消费。且由于数据发生的持续性,数据流将长久且持续地集成进入流计算系统。例如,对于网站的访问点击日志流,只要网站不关闭其点击日志流将一直不停产生并进入流计算系统。因此,对于流系统而言,数据是实时且不终止(无界)的。

2、持续(continuos)且高效的计算。流计算是一种”事件触发”的计算模式,触发源就是上述的无界流式数据。一旦有新的流数据进入流计算,流计算立刻发起并进行一次计算任务,因此整个流计算是持续进行的计算。

3、流式(streaming)且实时的数据集成。流数据触发一次流计算的计算结果,可以被直接写入目的数据存储,例如将计算后的报表数据直接写入RDS进行报表展示。因此流数据的计算结果可以类似流式数据一样持续写入目的数据存储。

以下举几个典型的例子。

例一:明细报表的导出业务。

报表导出通常要查出所有的数据,对数据处理后,将数据导出到文件,这是典型的批量模型,如果查询的数据量大,很容易内存不足。可以用流式计算来优化,即:对数据库过来的结果集流式处理,程序收到小批量就直接处理,处理后直接写文件,然后将内存释放。

流式处理的关键在于数据在持续流动中即时处理,中间可能根据需要会有小缓存或者完全没有,对小批量(例子是10条实际也可能是1条)的数据进行处理,然后释放内存。简单地说,就是增量计算,边加载边处理边释放,就像水流一样,没有积压。

例子二:成本计算

有些月结业务不一定要等到月底一次性计算。完全可以在日常业务中流式计算。以成本计算来说,企业经常在月底进行一次性的计算,月结压力很大。其实根据业务的情况,实时计算。也就是说业务发生后就触发计算,或者每天晚上对当天数据增量计算。这样就把月末批量计算改成了日常的流式计算。

这里,流式计算就变成一种思想:将一次性批量改造成多次即时触发的计算。

例子三:大数据分析

生产系统日志的数据量非常大,特别是IOT产生日志量是海量.这种情况可以把数据流式加载到数据库,数据库对流入的 数据流式处理,直接更新分析模型,这样来解决实时分析的需求。

流式计算这种无积压的计算模式占用内存小,实时性高,只要业务允许,应优先考虑这种模式。

以上就是宜信普惠对流式计算的相关介绍,想要了解更多,欢迎咨询宜信普惠,我们将竭诚为您服务!


以上就是关于《流式计算适用于什么样的场景?宜信普惠为你科普》的全部内容,本文网址:https://www.7ca.cn/baike/48334.shtml,如对您有帮助可以分享给好友,谢谢。
标签:
声明

排行榜