金融科技2030数智化平台将成核心竞争力
回顾近几十年来金融科技的发展,可以分为三个阶段:2010之前是科技“支持”业务的阶段,科技是工具,支持业务开展;2010到2020年,科技与业务是“伙伴”关系,科技在一定程度上和业务进行协同;当下已进入第三个10年,2020到2030年是科技“重塑”业务的阶段,科技会有更多机会赋能业务,使业务呈现出新的形态,在这个过程中,数智化平台会成为核心竞争力。基于这样的趋势判断,恒生进行了相应的战略性布局,追求高效能、高性能、高智能,打造横断性数智能力底座。
“高效能”是指提高生产效能、开发效能,需要打造数字化的、研发协作一体化的平台,用平台的方式提高效能,让平台不仅具有研发、生产的能力,还具有管理的能力。金融行业最核心的技术要求是分布式、低时延,“高性能”的重点在于如何提供分布式、低时延的底座,提高核心业务处理的性能。
“高智能”是指提高数据智能分析的能力。数智能力在最底层,是综合的、弥漫式的能力,可以体现在方方面面,既赋能开发环境,又赋能运行环境,既赋能稳态,也赋能敏态,同时也能赋能技术底座、运维、各业务场景。
具体来说,数智能力主要赋能四大场景。一是财富经纪数智化,重点在于营销及对客服务,包括通过机器提高对客服务效率、AI生成营销内容等;二是资管数智化,重点在于数据价值挖掘,包括AI算法深度挖掘数据价值赋能投研风控;三是运营运维数智化,重点在于业务处理效能提升,包括表格及文档自动化提高运营估值效率、NL2X赋能开发人员等;四是数智化底座,重点在于让AI能力更快落地,包括AI工程化落地、快速适配、降低项目及开发成本等。除了技术布局之外,为了更好地实现跨产品线的平台赋能,让平台能够在底层给更多的产品线以有力的支撑,恒生对平台进行了流程化改造,从今年开始实施流程化组织的模式,实现跨产品线平台赋能。
数智化核心技术的三大方向
结合恒生实践认为,数智化核心技术主要可分为三大方向:语言处理的技术、知识处理的技术以及智能多媒体处理的技术。
▶语言处理的技术:NLP&OCR
NLP与OCR是语言处理的两大技术,前者包括对话、标签、词库建设、精准理解等,后者主要是对文档的智能识别,例如处理复杂的印章、表格等。下一步,恒生会将NL2X(自然语言到Everything)作为语言处理技术的主攻方向,探索用自然语言去驱动对数据表、数据库的操作,驱动对知识图谱的操作,驱动对流程的操作,驱动对监控大屏和驾驶舱的操作,驱动程序接口,驱动系统命令,应用于方方面面的场景。NL2X的核心技术主要包括Subcat句法分析技术、意图映射技术以及SQL装配技术。前不久,恒生在全国知识图谱与语义计算大会(CCKS 2022)发布了金融NL2SQL评测任务,希望与合作伙伴共同将NL2SQL等NL2X技术在金融场景推向深入。低码是NL2X的典型应用场景。如果能够通过自然语言去驱动程序接口,则有助于实现低码甚至无码,让业务人员直接通过语言去调用相应的资源,实现多模态公民体验,例如通过拍照获得所见即所得的GUI(Graphical User Interface,图形用户界面),通过语控实现即席查询、即席编码,通过拖拉拽实现即席配置。在投研场景,可以通过语控技术打造研究员工作台,赋能获取数据、将数据灌入第三方数据处理软件等操作。在问答场景,已经有很多智能语音助手在各个场景中用对话驱动工作,那么在金融场景中,语控可以走多远?目前恒生正在做相关的预研工作,希望能够对自然语言NL2X精准解析的能力进行孵化、打磨,逐渐让更成熟的能力走向全行业。
▶知识处理的技术:知识图谱&事理图谱
在恒生体系内,不论是恒生研究院,还是聚源、丹渥,在知识图谱方面都有大量的实践,包括产业链图谱、权益图谱、面向领域的图计算等。金融行业很多投资决策都是事件驱动的,而传统的知识图谱是面向实体的。从面向实体到面向事件,这里需要有一个跨越。在事理图谱方面,恒生有独特的四象限模型,上为抽象,下为具体,左为实体,右为事件。通过这个方式,可以去用一种更综合的方式去表示事件,并对事件进行一定的推理、推演,不仅可以描述事件,还可以预测新的事件发生,进行一些事件预警。四象限理论不仅能够用于事理图谱的构建,同时也能用于行业事件标签的标准化表示,为其提供学理上的依据,基于相应的研究成果,恒生也在与合作伙伴共同承担证标委相关课题预研工作。
△四象限模型
▶多媒体处理的技术:智能多媒体&数字人
金融领域智能多媒体技术的应用主要包括文档转视频、视频双录、图片转数据等。文档转视频服务的核心是将上市公司的年报转成短视频,将文字资讯与相应的画面进行配合,形成短视频。视频双录解决的是身份认证这一法定要求的问题。图片转数据的一个主要应用场景是研报图片转数据,研报中的一些成果是以图片而非数据的形式展现的,因此必须把图片(包括量纲等信息)转成数据。在数字人方面,恒生主要播报型与客服型两种类型,相关预研、技术储备也在进展当中。
结合金融行业属性,探索创新机制
金融行业有很强的行业属性,金融科技从业者不只需要懂科技,还需要懂细节、懂流程、懂数据、懂价值判断,作为通用技术的人工智能等数智化技术很难轻易进入。那么如何结合行业属性激活创新机制?目前恒生采用先锋实验室机制,以课题合作为抓手,进行课题研究、技术/业务咨询、联合行业标准制定、创新产品共创、创新解决方案合作,与合作伙伴共同探索技术创新、集成创新、业务创新。除了与金融机构共同进行场景的探索,恒生也积极与高校开展技术合作,例如与浙江大学联合培养博士后,重点面向金融科技及业务研究;与复旦大学共同探索NLP、深度学习技术研究;携手数据库领域国内顶尖的研究团队——华东师范大学研发数据库。在先锋实验室的创新投入方面,除了前文提到的数智化技术,金融分布式数据库LightDB也是投入重点。当下产业链安全已经被提上重要日程,金融机构在更换数据库时有明确的诉求,包括稳定性、高性能、可靠性、长期的售后保障、总拥有成本降低、分布式、易运维性、生态完善等。在研发LightDB的过程中,恒生有一些感悟,一是要继承,站在巨人肩膀之上,不能白手起家,因此经过深入调研后,LightDB选择了PostgreSQL作为开源底座;二是要务实,要确定有限的可行目标,而非一步登天;三是要落地,小步前进,每一步走得坚实;四是要打磨,按照金融级的标准严格要求自己、进行测试;五是要合作,引入学界顶级的团队(华师大数据库团队),充分发挥顶级的专家智慧;六是要创新,引入新时代的新技术打法,例如关注加密存储、带密查询、带密计算等新的技术。面对数智化技术以及数据库等方向的创新与落地需求,恒生通过先锋实验室机制连接行业、连接技术资源,不仅关注已经成熟的技术、产品方向,也在仰望星空、关注无人区,挖掘可以落地且具有一定前瞻性的课题。金融科技2030的更多可能性,期待行业合作伙伴与恒生共同探索。
来源:恒生技术之眼(作者白硕)
留言与评论(共有 0 条评论) “” |