当前位置:客户联络中心

智能客服不“智能”:这里有一份智能客服数据解决方案

日期:2020年09月15日  来源:数据堂
分享到:

拨打海底捞餐厅的客服电话,一个语气热情的女声从电话那头传来,很多人可能都没有意识到,这并不是人工客服,而是智能电话机器人的声音。

同样,当你拨打10086/10010客服热线,电话那头不再是话务员,而是智能机器人客服在接听。所有这些变化都得益于智能客服的普及。

在客服语音识别技术的支持下,智能客服为企业与海量用户之间的沟通建立了一种基于自然语言的快捷有效的技术手段,能够降低客服中心的人力成本、提升客服中心的运营效率。

不过,随着智能客服在各个行业的普及,越来越多人反映智能客服有时并不“智能”。

当你拨打银行客服电话时,经常会听到“请直接说出你要办理的业务”的提示,但“答非所问”的现象十分常见。一位市民曾表示,与智能客服的交流“还是和机器交流的感觉,而且你说话一定要短,不然也得重来一遍”。

造成智能客服“兜圈子”、“听不懂人话”的一个重要原因在于语音语言的复杂性。

首先,中国有七大方言区、数十种方言,不同的地域有不同的口音特点。所以,如何识别客户的方言以及带有口音的普通话,成为客服语音识别亟待解决的问题。

其次,人们习惯于以非常自然的方式同客服进行对话,语速快、吐字不清、抢话叠字等说话习惯同样会对客服语音识别的准确率产生影响。

最后,电话信道数字语音的采样频率定义为8kH,音质较差,且各行各业都拥有自己独特的领域术语,客观上也为客服语音识别构成了挑战。

数据堂在深刻理解智能客服场景的基础上,对海量原始语音数据进行提取、分类、标注等一系列处理,将混杂的数据转化为可供机器深度学习的智能客服专业数据,为上述客服语音识别面临的技术挑战提供了可靠的数据解决方案。

普通话语音识别

构建普通话基础语音数据,能够有效提升智能客服系统对普通话识别的精准度。

数据堂开发的普通话基础语音数据包括普通话朗读数据、重口音普通话数据和普通话自然对话数据。

朗读数据能够为客服语音识别提供模型,重口音普通话数据能够提高各地口音语音的适应性,而自然对话数据能够提高自然风格语音的适应性。

 

数据堂自有版权普通话语音数据

 

朗读数据
1  1505小时普通话手机采集语音数据
2  2000小时普通话手机采集语音数据

重口音数据
1  1025小时重口音普通话手机采集语音数据
2  662小时重口音普通话手机采集语音数据
3  132小时重口音普通话手机采集语音数据

自然对话数据
1  1000小时普通话多人自然对话语音数据
2  2000小时普通话两人自然对话语音数据
3  1420小时普通话自然语音手机采集数据

方言语音识别

与普通话语音识别的解决方案类似,基础语音数据也是提升方言语音识别精准度的重要保障。

数据堂开发的方言语音基础数据包括方言朗读数据和方言自然对话数据。

方言朗读数据是构建方言语音识别模型的基础,方言自然对话数据能够提高自然风格语音的适应性。

 

数据堂自有版权方言语音数据

 

朗读数据
1  1044小时闽南语手机采集语音数据
2  1652小时粤语手机采集语音数据
3  1032小时上海方言手机采集语音数据
4  250人苏州方言手机语音采集数据
5  400人杭州方言手机语音采集数据
6  1002小时长沙方言手机采集语音数据
7  794小时四川方言手机采集语音数据
8  1000小时武汉方言手机采集语音数据
9  1000小时昆明方言手机采集语音数据
10  312人东北方言手机采集语音数据
11  463人河南方言手机采集语音数据
12  738小时维语手机采集语音数据
13  204人台湾普通话手机采集语音数据

自然对话数据
1  607小时粤语自然对话语音数据
2  700小时四川方言自然对话语音数据
3  500小时河南方言自然对话语音数据

数据定制服务

为了有效解决客服语音识别所面临的领域术语难题,数据堂特提供数据定制服务。

 

客服语音标注示例

数据堂积累了近十年标注经验,打造了一个业内领先的数据处理平台。

数据堂创建了可视化数据制作流程和管理制度,拥有语音、文本、图片和视频等近20种丰富的可配置工具,掌握多个领域20余个场景的预处理能力,保障了自动标注的高效性。

为保障数据的质量,数据堂采取了标注(多人拟合)、质检(机器质检、人工抽检)、人工验收等多级数据质量管控措施。

数据堂保密性极高的标注服务基地

数据堂提供的数据处理平台私有化部署+云标注的模式能够有效保护客服数据所涉及的企业机密或客户隐私。

数据堂的语音数据产品可以做到从智能客服实际应用场景出发,帮助客户快速提升语音识别的性能。

数据堂在人工智能数据服务领域将持续发挥导向性作用,不断优化自身业务与技术实力,为人工智能技术研发与应用提供数据能源支持。