140d1a512b24433163226806fdb225e7.gif

文 | 宋慧

出品 | CSDN

数字化转型,是 IT 界熟悉和不断深入实践的重要议题。在业务的数字化与降本增效之后,我们看到 IT 也在对开发自身与企业运营流程进行自动化的升级,例如用全栈的自动化开发测试运维工具和技术去提升软件与应用开发效率。在场景与数据更复杂的企业运营流程中,IT 技术也正在改变以往需要大量人力调研分析的复杂情况,这就是流程挖掘。

比起上一代企业信息化技术,流程挖掘还非常年轻。因为流程挖掘融合了数据挖掘、机器学习,以及企业业务流程管理多个领域技术,用技术去优化、改造业务流程,实现数字化转型与降本增效。也正因为此,流程挖掘技术赛道在一两年间成为企业级 IT 市场追捧的热点。来自中国的技术团队望繁信在今天重磅发布了流程挖掘的完整平台级产品——数字北极星流程智能平台软件,发布会上,望繁信团队不仅分享了最新的流程挖掘技术突破与探索,也首次公开了行业解决方案模板,以及多家头部客户采用流程挖掘的实践经验。CSDN 独家专访了望繁信科技 CTO 李进峰,李博士曾是 IBM 大数据相关技术研究与落地的负责人,他详细分享和介绍了流程挖掘的独特价值,与望繁信在流程挖掘技术的积累与思考。

04aaf71dbf9d6fa99b7b301c9077069c.png

从粗放式到精细化的数字化进程,流程挖掘正当时

我们都知道,IT 和数字化转型在近年快速发展进程中,已经走过了粗放式、一窝蜂上线部署的阶段,在高度不确定性的商业环境中,数字化转入关注降本增效的精细化转型升级阶段。不过早期各类业务数字化与 IT 系统上线,产生和积累了大量的数据,这让数据分析与流程挖掘有了施展拳脚的时机。

在望繁信资料中,我们也看到了非常形象和直观的图表,以往企业管理的流程优化依靠咨询专家和大量人工调研的方式,以人的经验为主导,所做的优化如果不经数据验证,仍然是粗放,看似简化的,而仔细梳理后会发现企业实际流程图(以财务发票付款流程为例)依然庞杂繁琐。

d6be038fe24997a751b4bd6e08fc6dde.png

企业实际流程的规模与复杂度其实远超过人与管理经验以为的

57da6797880f27fe7d48c70b72947bd7.pngddc4890ec8f9a6998076f7095de2a8d1.png

(以财务发票付款流程为例)实际流程图显示,以人的经验所做流程优化,未经数据验证,实际情况并非如此

涉及到管理和流程的优化,我们就会想到 RPA 和 BI。李进峰博士早前详细分享过流程挖掘与 RPA 与 BI 的区别,简单来说,流程挖掘技术从管理层面对业务流程优化改造(仅含部分执行层面技术),而 RPA 则是更直接从执行层面做任务挖掘,所以两个技术不直接相关。只是已经上市的 RPA 厂商 UiPath 收购了流程挖掘公司 ProcessGold,引发了 RPA 与流程挖掘的关联热度,但目前并没有看到 UiPath 使用流程挖掘的分析结果去指导 RPA 执行。而 BI 与流程挖掘,李博士举过一个形象的比喻,BI 是(企业通用数据分析和展示的)傻瓜相机,而流程挖掘是(流程科学领域的)单反相机,两者从解决通用问题还是定制问题、数据引擎、算法模型等方面都不相同,BI 与流程挖掘有交集,但更多是并列的关系。

4da464297a004dab5b518e7ba9d08fd6.jpeg

流程挖掘涉及到的核心算法

对于以往流程与管理咨询服务的提供者来说,使用流程挖掘工具将极大提升效率。李博士也提到了与以往咨询项目的对比,以 6 个月的咨询项目为例,采用流程挖掘技术将可以减少 40-60% 的顾问成本,这样咨询专家就可以将流程挖掘梳理、提供的核心 KPI 和目标,结合自身行业与专业积累,去做进一步的分析,甚至增加为企业提供的流程咨询项目数量。

30a8aca5db936ef22c4f5779a8140bf1.png

100%自研 PQL 与流程挖掘核心算法,是望繁信的底气

回到流程挖掘技术与产品,其中关键的流程图生成模型,流程主干、节点分层的清晰程度与实现路径千差万别,李博士表示望繁信的流程图生成模型清晰度已经达到和超过国际主流产品。另外学术研究领域在使用流程挖掘模型生成 BPM 系统流程图,流程挖掘厂商可以直接采用,用于数据执行校验,望繁信将推出简化版本的 BPMN,让中国用户更方便理解与实施整体业务流程。而基于行业与业务场景的流程挖掘模型,将随着流程挖掘在各行业落地实施中,积累沉淀为可复用的通用模型,这也是国外厂商与望繁信沉淀和提供的行业解决方案。

82ac20040cffbc9f509c5d325b57f2d0.png

望繁信自主研发、完整的平台级流程挖掘产品架构图

想要实现关键流程图的清晰度与实效,绝不是一朝一夕可以实现。据介绍,望繁信拥有 100% 国产自研的 PQL 计算引擎,以及针对流程数据的算法专利,这些核心技术优势是中国技术团队比肩国际大厂的底气。李博士也详细介绍了数据库与算法的核心技术思路。

171c7d7f506e0f4ee311516a24d3668a.jpeg

李博士以某个场景流程图举例,图为望繁信与国际知名厂商的流程图对比

首先,就要提到与以往 BI 的 SQL 数据库所不同的,流程挖掘所需的 PQL(Process Query Language)翻译过来叫做流程查询语言。PQL 是专门针对业务流程定制化开发的一套语言,它能直接翻译成机器可执行的一段代码,广泛应用于优化执行效率、查询违规流程、权责分离、三单匹配、工单分配等业务场景,相比于传统 BI 的方法,不仅更容易而且计算效率更高。流程挖掘是通过流程定制化开发的语言 PQL 去满足企业在流程相关场景下的业务要求。

望繁信自研的流程挖掘 PQL 可以达到 20 亿行数据在 4 秒钟之内返回结果,这种实时处理效果用传统 BI 的列式数据库通用方式是无法实现的。这主要由于流程挖掘 PQL 采用(与 BI 不同的)特殊函数,以及数据的并行化处理。(需要说明的是,数据量上 BI 某些函数的数据处理量可达百亿或千亿行秒级响应,流程挖掘目前峰值仅几十亿行。)现在,望繁信科技不仅拥有目前通用的 PQL 里面所有的函数,而且还投入巨大精力自研了很多中国特色的函数,而这些是其他公司没有的。

bc24d6a00a30eda9d9eb9030c35d6cef.jpeg

望繁信流程挖掘 PQL 的设计思路

另外望繁信的自研算法,具体会有根因分析,瓶颈分析,聚类分析,并行分析,流程预测等等。具体来说,望繁信依照不同 CPU 架构和计算单元、缓存机制,对数据做了最小切片,避免计算单元跨不同数据分区,降低计算效率。另外,在数据存储层、CPU 计算层、函数执行计划层,望繁信技术团队都在做简化、压缩的工作,以提高执行效率。

除了 PQL 与核心算法,流程挖掘所用到的数据则是望繁信与数据厂商一家一家去对接,实现端到端打通,现在,望繁信已经实现了 20 多种数据库协议、标准的对接。

对于接下来的产品与技术研发重点,李博士表示,自动化方面流程挖掘与 RPA 执行层深度耦合,已经是红海,望繁信不会重点去做。望繁信希望是以流程挖掘和数据为基础,去反推企业管理流程的体系和标准化,再进一步以标准流程管理体系去业务 IT 系统中检查数据和流程的问题。这也是出于中外企业 IT 发展的不同历程的考虑,李博士提到,国外企业先有流程管理,再有流程挖掘。中国发展历程则是先上马 IT 业务系统,满足发展需求,接下来才是思考建设流程管理与标准体系。

技术层面,在已有基础之上,望繁信技术团队会继续增强流程挖掘数据库的性能,如 CPU 的计算性能和内存的使用率,在用户侧以最少的资源完成流程挖掘。算法方面上面提及的算法,望繁信团队希望以字节为单位去优化算法。最终,打通流程管理和流程分析。

就像德勤管理咨询在 2022 年发布的技术趋势中提到,IT 正在进行自我颠覆,自动化技术正在规模化应用。而 IT 的魅力也正在此,提供的效率工具,将一直为数字化和降本增效提供核心支撑,而现在,流程挖掘也登上中国数字化的舞台,望繁信的流程挖掘核心技术与产品方案将为企业提升生产力带来实效。CSDN 将持续关注和报道流程挖掘技术最新进展。

Logo

20年前,《新程序员》创刊时,我们的心愿是全面关注程序员成长,中国将拥有新一代世界级的程序员。20年后的今天,我们有了新的使命:助力中国IT技术人成长,成就一亿技术人!

更多推荐