2019大数据产业峰会|星环科技季钱飞:流处理的下一阶段——实时智能决策引擎
既然我们发现其中会存在这么多问题,所以我们决定在slipstream当中引入一个专门的规则处理模块,可以看到将整个规则处理流程分为了4个阶段,第一规则的定义、第二规则库管理、第三规则解析执行、第四规则响应处理。通过这样一个细分我们希望能够帮助客户/合作伙伴提供一个一站式智能决策开发平台。 星环科技为何能实现这个目标?目前来说,我们已经实现的功能主要包括,第一是基于SQL的规则开发编程接口,能够跟现在大数据的生态是完美兼容的;第二我们对规则提供了一个多版本的管理机制,可以实现在线规则更新和升级;第三是我们能够自动利用分布式的计算引擎实现类型的规则处理,同时会结合现在在一些客户、一些行业的积累实现了很多台湾判断和响应策略的通过用范式。 接下来可以看一个简单的基于stream rule engine的处理。第一是指标定义,我们现在接入规则都是基于一些指标的判断,指标定义方面引入两层抽象,metricgroup,每个metrc是根据不同的维度、不同的指标计算出来的,slipstream会根据同一个metricgroup中进行自动的优化。第二是规则定义,同样引入了两层,ruleset包含一组相关的规则,同时可以在ruleset上定义一些匹配的策略,希望都满足之后进行处理还是特定规则或者一定比例的规则满足就做一些特别的处理,在那个基础之上抽象出来三个规则管理相关的接口,通过start stop规则处理的任务,如果发生了变化或者更新,通过不停机的在线升级。 刚才提的第三个问题,我们自己开发了一套规则引擎分布式实时缓存系统,系统采用了分层的架构。第一层是基于executor内存过素缓存平台,可以实现整个写入微秒级别的延迟,达到单物理节点百万的吞吐。第二层是基于transwarpshiva的缓存,可以将中间指标进行缓存,同时还实现的高速缓存和外部存储之间的自动刷出和加载策略,将内存写入达到一定之后自动刷缓。当然虽然这个缓存系统最初是为规则引擎内部所使用的,我们发现其实大量的用户为中间计算出来的指标是有些查询需求的,所以我们也对外暴露了一些中间指标的访问接口,目前支持两种访问策略,一个是发布订阅模式一个是批量读的模式。 当然我们现在已经有些客户和合作伙伴基于这样一个规则引擎在开发当中的决策系统,但是毕竟是属于全新的功能模块,所以还是有大量的工作需要完善和探索。 我个人觉得在实质规则处理方面接下来有这几个尝试的方向: 1、首先还要不断的优化整个规则处理的性能,以满足更多行业对规则判断高性能要求的需求,让我们这样一个实时规则模块实现它的创新价值; (编辑:西安站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |