专访有光科技:如何在金融领域实现多语言ASR和NLP

在本文中,我们采访到了有光科技首席科学家及CTO与Albert Lam,就有光科技如何应用多语言语音识别和NLP于金融领域进行了探讨。

Albert Lam 2019-07-12

请简单介绍一下有光科技

有光科技(Fano Labs)是香港大学的衍生科技公司。由香港大学电气与电子工程(EEE)博士研究生Miles Wen博士和香港大学信息工程系讲座教授Victor Li On Kwok教授创立,我们专注于自动语音识别(ASR),自然语言处理(NLP)以及大数据技术,帮助企业的客户服务,合规服务以及其他业务线。有光科技在首席科学家Albert Lam博士和香港大学EEE兼职助理教授领导的内部研究团队带领下,致力于研究最前沿的语音和NLP技术,并将知识转化为产品和行业解决方案。

在公司成立初期,我们很幸运得到许多组织和导师的支持。公司总部位于香港科技园内,并得到了香港大学和香港政府的资助,我们专注于核心技术和产品的研发。 2017年11月,有光科技完成了Pre-A轮融资,成为维港投资第一家投资的香港高科技创业公司。维港投资是世界上一些最具创新力的公司和颠覆性技术的领先投资者,投资的公司包括Facebook,DeepMind, Skype和Siri在内。

2018年,我们在成都、深圳和广州设立了分支机构。我们的人工智能客户服务系统荣获了2018年香港ICT大奖金奖,以及2018年亚太ICT联盟APICTA奖项。此外,我们的解决方案得到了市场的广泛认可,并得到了已经广泛用于电信、金融、政府和其他私营和公共部门。

据统计到2021年,NLP市场价值将会达到160.7亿美元,您如何解释这种爆炸性增长?

多年来,智慧城市,智能商务和智能未来一直以来是人们关注的技术主题。人工智能,特别是在语音识别和NLP方面,在其中发挥着不可避免的作用。例如,我们会在手机中使用个人助理来发送消息,播放音乐,甚至发布在线购物订单。这背后,理解语音命令或查询,软件需要将语音输入转录为文本,然后使用NLP技术理解文本。虚拟银行,物联网和呼叫中心等应用程序也需要同样的技术,这就解释了为什么NLP市场在未来被认为是非常巨大的。

有光科技专注于方言的语音识别和NLP技术,专注于企业呼叫中心应用。在中国,有200万名代理商在呼叫中心工作,每年的运营成本超过100亿美元。作为全球最大的市场和人工智能技术发展的领导者之一,中国必将成为市场的重要参与者,并将在未来几年取得显着增长。

有光科技为何专注于进行中文和中文方言的研究?


作为一家在香港成立并在香港发展的创业公司,我们发现香港的许多公司都面临着世界其他地区也会遇到的客户服务难点。他们希望通过使用AI助手使他们的客户服务变得更加智能。他们正面临着呼叫中心人员流动率高,劳动力成本高的挑战,其中一些人因为代理商不能很好地理解他们的需求,正在失去客户。然而,目前市场上骄傲没有为广东话开发的合适解决方案。有些人尝试内地或美国的特定供应商提供的解决方案,但事实证明这种解决方案不适合港式粤语。所以,我们想尝试用我们的AI技术来解决这个问题。从那时起,我们便开始研究和开发我们自己的AI客户服务系统。

从开发粤语ASR和NLP技术开始,我们还构建了处理各种语言的引擎,包括英语,普通话,四川语和其他方言。世界上有将近1亿人会说广东话,说其他方言的人数量更大。我们相信,在这些市场中采用人工智能技术,使他们的业务和生活变得更加智能是非常重要和有价值的。

中文中,普通话和其他方言的NLP分类有什么区别?

最大的区别来自数据。您可能知道,数据在人工智能的开发中非常重要,尤其是机器学习技术。中国互联网上有大量的语音和文本数据生成,传输和存档,可以作为培训自动语音识别(ASR)和NLP引擎的无穷无尽的燃料。然而对于一些方言来说,这却是完全不同的。

由于我们可以获得的模型培训数据资源非常有限,我们通过优化算法,努力使系统性能最大化。此外,为了获得更好的NLP结果,我们不断收集特定领域和本地语言数据集,以使我们的模型能够理解特定的知识,这使我们的解决方案能够用于许多不同的行业和应用程序。


有光科技的技术独特性体现在哪里?

与我们通常在智能手机上使用的ASR引擎不同,智能手机只能理解与标准语言的日常对话,在大多数情况下,我们的引擎专为需要考虑许多因素的企业呼叫中心而设计,包括重音,域名知识,噪音,设备等。以银行呼叫中心的ASR引擎为例,我们可以期望它理解一些特定领域的词,例如“未来价格”或“定期存款”,这些词在使用通用ASR模型时可能会被误解。此外,引擎应该能够处理通过电话系统传输的语音信号,以避免识别准确性差,因为其采样率远低于智能手机。

我们拥有一支由著名大学教授和博士组成的内部研究团队,能够为客户建立定制的语音识别模型,满足他们的独特需求。此外,与市场上仅提供基于云的解决方案的大多数供应商不同,我们能够为客户部署内部语音识别模型,以确保所有数据的安全性和受到良好保护。


作为一家香港公司,有光科技如何与内地公司竞争?

有光科技的独特之处在于我们拥有强大的研发团队,对当地市场有着深刻的理解。我们拥有方言和小语种专业,能够为香港和内地的客户提供量身定制的解决方案。大多数大公司专注于大市场,但通常忽视少数人的重要性。我们通过中国四川的呼叫中心发现的一个有趣的事实是,超过70%的呼叫者说四川语,这是中国西南地区常用的方言,超过3亿人使用。

说实话,像我们一样规模的初创公司与内地和美国的大公司竞争并不容易。但是,我们认为市场上仍有很多机会,因为NLP是一项新兴技术,而且行业的爆发尚未到来。除了竞争,我们更欢迎合作。凭借对技术和目标市场的不同关注,有光科技还可以与其他ASR和NLP公司合作,为客户提供全面的解决方案。

随着中国引入新的数据保护法规,有光科技将如何应对这一规定?

数据安全始终是我们客户及其客户最关注的问题之一,尤其是在金融行业。 有光科技的使命是确保客户数据和用户信息的安全。我们的系统是在强大而安全的架构下构建的,可以防止来自外部的威胁和攻击。将系统部署在私有云上,系统处理的所有数据都传输并存储在安全的网络环境中。通过采用软件,硬件和管理程序中的多种方法,我们设法确保数据处理符合客户和当地政府的规定。

您详细介绍一下ASR和NLP解决方案的具体应用案例?

我们在香港实施的第一个项目为是CLP构建AI客户服务系统,我们部署了支持语音的聊天机器人,以回答客户提出的常见问题。聊天机器人能够识别和理解粤语的语音查询,甚至是粤语和英语的混合语言,这种语言使用方法在香港很常见。使用NLP技术,聊天机器人可以理解不同表达背后的真实含义,并为用户提供适当的响应。

我们的语音分析系统通过识别和分析他们的通话记录并向经理提供业务见解,帮助银行和保险公司进行客户服务质量保证和合规性检查。有光科技已成功为各行各业的客户提供人工智能解决方案,包括政府部门,电信服务提供商和金融机构,帮助他们显着降低人工成本,提高客户服务质量。

创业过程中最具挑战性的时刻是什么?

最大的挑战之一来自人力资源。在香港聘请语音识别和NLP专家并不容易。虽然在一些本地大学有一些博士毕业生的语音识别和NLP培训,但他们中的许多人更喜欢在海外工作或在内地工作,可能是因为香港的整个工作并不够具备竞争力。但是随着更多政府政策的公布,情况正好转好,但我们仍有很长的路要走。我们希望大学和地方机构的各种人工智能技术有更好的研究氛围,从而帮助香港建立更好的研究生态系统。

您认为您的技术如何应用于金融行业并从中受益?

我们已经金融行业中拥有了很多应用。基于文本的聊天机器人或语音机器人可以了解客户的查询,并通过文本,语音或您想要的任何其他方式与他们进行通信。 Speech Analytics系统可以准确地检测销售电话中的不合规行为,优化KYC和AML的流程,从而减少合规性问题导致的罚款或诉讼,提高客户服务质量。 我们的语音生物识别技术可以通过语音验证缩短冗长的身份验证过程,并提供更好的用户体验。

您预计未来,尤其是在中国,NLP会发生什么变化?有光科技的未来计划是什么?

近年来,NLP技术在中国和海外迅速发展。 这些技术广泛应用于客户服务、智能家居、智能手机助手等。随着技术的发展,这些技术在未来肯定会越来越受欢迎。 作为世界上最复杂的语言之一,中国NLP研究是一个具有挑战性且前景广阔的课题。 随着业务的发展,我们将遇到各种不同行业和不同语言的应用案例。 然而,凭借我们的研究能力,并且在该领域不断积累的经验,有光科技已经为未来的变化和挑战做好了充分准备。