语音交互方法与流程-k8凯发

文档序号:36566800发布日期:2023-12-30 08:10阅读:21来源:国知局
语音交互方法与流程
语音交互方法、装置、芯片、电子设备及介质
技术领域
1.本技术涉及电子设备技术领域,特别涉及一种语音交互方法、装置、芯片、电子设备及介质。


背景技术:

2.电子设备可以安装有语音助手应用程序,并通过语音助手实现用户与电子设备间的语音交互。
3.一种相关技术中,电子设备可以在用户发出语音后,分析处理用户语音以获得语音交互结果信息,进而对语音交互结果信息进行播报,以向用户反馈语音交互处理结果。
4.但该相关技术的实现使得用户对语音助手所处状态无感知,影响用户的语音交互体验。


技术实现要素:

5.本技术实施例提供了一种语音交互方法、装置、芯片、电子设备及介质,能够支持用户与电子设备间的语音交互,且通过显示页面动画可提升用户的语音交互体验。
6.第一方面,本技术实施例提供一种语音交互方法,包括:响应于对电子设备的语音助手的激活请求,初始化语音助手;在初始化语音助手之后,显示语音助手处于第一状态时的第一页面,第一页面包括对应第一状态的第一动画;其中,第一状态为语音聆听状态、语音识别结果显示状态、语音交互结果显示状态、或者介于语音识别结果显示状态和语音交互结果显示状态之间的目标状态。
7.本技术实施例中,语音助手在语音交互过程中的状态可以有聆听状态、识别状态、结果状态以及思考状态(即目标状态)。
通过在初始化语音助手后,显示语音助手所处状态的页面,并限定页面包括状态对应的动画,可便于用户直观获知语音助手所处状态,为用户与电子设备间的语音交互提供支持。
8.可选地,语音交互方法还包括:在初始化语音助手的过程中,将第一动画的图片集合加载到电子设备的内存中;显示语音助手处于第一状态时的第一页面这一步骤包括:显示内存中加载的第一动画的图片集合。
9.通过在初始化语音助手的过程中预加载页面动画至内存中,则需要显示页面动画时,可以快速显示内存中已加载好的页面动画,提高图片加载效率,如此可支持电子设备在语音交互过程中对页面动画的流畅显示。
10.可选地,第一动画的图片数量小于或者等于电子设备单次播放动画的允许显示图片数量;显示语音助手处于第一状态时的第一页面这一步骤包括:循环播放第一动画。
11.通过对页面动画的图片数量进行限制,可以避免出现动画循环播放过程中动画效果不连续的问题,保证动画图片显示的完整性,以提升页面动画的显示效果。
12.可选地,循环播放第一动画这一步骤包括:使用第一帧率,执行对第一动画的循环播放;其中,使用第一帧率单次播放第一动画的用时在电子设备单次播放动画的允许用时
范围内。
13.通过对页面动画的播放帧率进行限制,可以避免出现动画循环播放过程中动画效果不连续的问题,保证动画图片显示的完整性,以提升页面动画的显示效果。
14.可选地,在第一状态为语音识别结果显示状态的情况下,显示语音助手处于第一状态时的第一页面这一步骤包括:在获取到语音识别结果的情况下,若对应第一页面的第一标识信息为第一信息,通过开始循环播放第一动画、以及显示语音识别结果,以显示第一页面;该语音交互方法还包括:在开始循环播放第一动画之后,将第一标识信息设置为不同于第一信息的其他信息;在结束显示第一页面之后,将第一标识信息设置为第一信息。
15.通过按需修改第一标识信息,可使得识别页面(即语音助手处于语音识别结果显示状态时的页面)显示期间,新生成的语音识别结果不会导致识别页面中的识别动画反复重新开始播放,从而保证识别动画循环播放的连续性,以提升识别动画显示的流畅性。
16.可选地,第二页面为语音助手处于第二状态时的页面,第二页面包括对应第二状态的第二动画,第一状态和第二状态为语音聆听状态、语音识别结果显示状态、语音交互结果显示状态和目标状态中的两种状态;该语音交互方法还包括:显示从第一动画向第二动画过渡的第一过渡动画;在显示第一过渡动画之后,将第一过渡动画的状态设置为不可见状态,并显示第二动画。
17.基于不同页面间页面动画的不同,通过在页面切换期间播放相应的过渡动画,可以提升页面动画切换的流畅性。
通过在播放过渡动画后,将过渡动画设置为不可见,可以避免出现过渡动画和页面动画叠加显示而影响动画显示效果的问题,如此可提升页面动画显示效果。
18.可选地,在第一状态为语音识别结果显示状态、第一页面包括第一语音识别结果的情况下,方法还包括:获取第一处理信息,第一处理信息为通过处理第一语音识别结果所得到的信息;若第一处理信息包括第一跳转指令,则显示语音助手处于目标状态的第三页面,第三页面包括对应目标状态的动画;若第一处理信息包括语音交互结果信息,则显示语音助手处于语音交互结果显示状态的第四页面,第四页面包括所获取的语音交互结果信息、以及对应语音交互结果显示状态的动画;若第一处理信息包括应用显示指令,则显示与所获取的应用显示指令相对应的应用程序的页面。
19.基于用户语音交互需求的不同,语音交互结果的类型相应不同,比如可以为显示信息,也可以为打开应用程序。
基于对语音交互结果的获取时效性,语音交互结果可能存在延迟获得的情况。
如此,基于语音交互结果的类型以及对语音交互结果的获取时效性,在显示识别页面后可以按需跳转至结果页面、应用页面或思考页面,以供用户获知语音交互所处状态。
20.可选地,在显示语音助手处于目标状态的第三页面之后,方法还包括:获取到第二语音识别结果或者第二处理信息,第二处理信息为通过处理第一语音识别结果所得到的信息;若获取到第二语音识别结果,则显示语音助手处于语音识别结果显示状态的第五页面,第五页面包括第二语音识别结果和第一动画;若获取到第二处理信息、且第二处理信息包括语音交互结果信息,则显示语音助手处于语音交互结果显示状态的第六页面,第六页面包括所获取的语音交互结果信息、以及对应语音交互结果显示状态的动画;若获取到第二处理信息、且第二处理信息包括应用显示指令,则显示与所获取的应用显示指令相对应的
应用程序的页面。
21.显示思考页面期间,若用户继续发出语音,则可以跳转回识别页面,反之则基于语音交互结果的类型,按需跳转至结果页面或应用页面,如此可实现不同情况下的语音交互页面按需跳转,满足用户的语音交互需求。
22.第二方面,本技术实施例提供一种语音交互装置,包括:初始化模块,用于响应于对电子设备的语音助手的激活请求,初始化语音助手;显示模块,用于在初始化语音助手之后,显示语音助手处于第一状态时的第一页面,第一页面包括对应第一状态的第一动画;其中,第一状态为语音聆听状态、语音识别结果显示状态、语音交互结果显示状态、或者介于语音识别结果显示状态和语音交互结果显示状态之间的目标状态。
23.第三方面,本技术实施例提供一种电子芯片,包括:处理器,其用于执行存储在存储器上的计算机程序指令,其中,当计算机程序指令被处理器执行时,触发电子芯片执行如第一方面中任一项的方法。
24.第四方面,本技术实施例提供一种电子设备,电子设备包括用于存储计算机程序指令的一个或多个存储器、以及一个或多个处理器,其中,当计算机程序指令被一个或多个处理器执行时,触发电子设备执行如第一方面中任一项的方法。
25.第五方面,本技术实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,当计算机程序在计算机上运行时,使得计算机执行如第一方面中任一项的方法。
26.第六方面,本技术实施例提供一种计算机程序产品,计算机程序产品包括计算机程序,当计算机程序在计算机上运行时,使得计算机执行如第一方面中任一项的方法。
27.前述各个方面的技术效果可互相参考,在此不再赘述。
附图说明
28.为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍。
29.图1为本技术实施例提供的一种电子设备的结构示意图;图2为本技术实施例提供的一种手表显示初始化页面时的示意图;图
3a~

3b为本技术实施例提供的一种手表显示聆听页面时的示意图;图
4a~

4c为本技术实施例提供的一种手表显示识别页面时的示意图;图
5a~

5c为本技术实施例提供的一种手表显示结果页面时的示意图;图6为本技术实施例提供的一种手表显示闹钟页面时的示意图;图
7a~

7b为本技术实施例提供的一种手表显示思考页面时的示意图;图8为本技术实施例提供的一种语音交互方法的示意图;图9为本技术实施例提供的另一种手表显示聆听页面时的示意图;图
10为本技术实施例提供的一种手表的软件框架示意图;图
11为本技术一个实施例提供的一种方法的流程示意图。
具体实施方式
30.为了更好的理解本技术的技术方案,下面结合附图对本技术实施例进行详细描
述。
31.应当明确,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。
基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本技术保护的范围。
32.在本技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本技术。
在本技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
33.应当理解,本文中使用的术语“至少一个”是指一个或者多个,“多个”是指两个或两个以上。
本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。
其中a,b可以是单数或者复数。
另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。“以下至少一项”及其类似表达,是指的这些项中的任意组合,包括单项或复数项的任意组合。
例如,a,b和c中的至少一项可以表示:a,b,c,a-b,a-c,b-c,
或a-b-c,其中a,b,c可以是单个,也可以是多个。
34.应当理解,尽管在本技术实施例中可能采用术语第一、第二等来描述设定阈值,但这些设定阈值不应限于这些术语。
这些术语仅用来将设定阈值彼此区分开。
例如,在不脱离本技术实施例范围的情况下,第一设定阈值也可以被称为第二设定阈值,类似地,第二设定阈值也可以被称为第一设定阈值。
35.本技术任一实施例提供的语音交互方法可以应用于图1所示的电子设备
100
中。
图1示出了电子设备
100
的结构示意图。
36.一个实施例中,图1所示电子设备可以为手机、平板电脑等终端设备。
另一实施例中,图1所示电子设备可以为可穿戴设备,如可穿戴的运动手表等。
37.电子设备
100
可以包括处理器
110,内部存储器
121,天线2,无线通信模块
160,音频模块
170,扬声器
170a,麦克风
170c,传感器模块
180,按键
190,马达
191,指示器
192,摄像头
193,显示屏
194等。
其中传感器模块
180
可以包括压力传感器,触摸传感器等。
38.可以理解的是,本技术实施例示意的结构并不构成对电子设备
100
的具体限定。
在本技术另一些实施例中,电子设备
100
可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。
图示的部件可以以硬件,软件或软件和硬件的组合实现。
39.处理器
110可以包括一个或多个处理单元,例如:处理器
110可以包括应用处理器(application processor,ap),调制解调处理器,图形处理器(graphics processing unit,gpu),图像信号处理器(image signal processor,isp),控制器,视频编解码器,数字信号处理器(digital signal processor,dsp),基带处理器,和/或神经网络处理器(neural-network processing unit,npu)等。
其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
控制器可以根据指令操作码和时序信号,产生操作控制信号,完成取指令和执行指令的控制。
40.一些实施例中,处理器
110可以是片上装置soc(system on chip,系统级芯片),该处理器
110中可以包括中央处理器(central processing unit,cpu),还可以进一步包括其他类型的处理器。
一些实施例中,处理器
110可以是pwm控制芯片。
41.处理器
110还可包括必要的硬件加速器或逻辑处理硬件电路,如asic,或一个或多个用于控制技术方案程序执行的集成电路等。
此外,处理器
110可以具有操作一个或多个软件程序的功能,软件程序可以存储在存储介质中。
42.处理器
110中还可以设置存储器,用于存储指令和数据。
在一些实施例中,处理器
110中的存储器为高速缓冲存储器。
该存储器可以保存处理器
110刚用过或循环使用的指令或数据。
如果处理器
110需要再次使用该指令或数据,可从所述存储器中直接调用。
避免了重复存取,减少了处理器
110的等待时间,因而提高了系统的效率。
43.一些实施例中,电子设备
100
的存储器可以是只读存储器(read-only memory,rom)、可存储静态信息和指令的其它类型的静态存储设备、随机存取存储器(random access memory,ram)或可存储信息和指令的其它类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,eeprom),或者还可以是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何计算机可读介质。
44.一些实施例中,处理器
110可以和存储器可以合成一个处理装置,也可以是彼此独立的部件,处理器
110可用于执行存储器中存储的程序代码。
具体实现时,该存储器也可以集成在处理器
110中,或者,独立于处理器
110。
45.在一些实施例中,处理器
110可以包括一个或多个接口。
接口可以包括集成电路(inter-integrated circuit,i2c)接口,集成电路内置音频(inter-integrated circuit sound,i2s)接口,脉冲编码调制(pulse code modulation,pcm)接口,通用异步收发传输器(universal asynchronous receiver/transmitter,uart)接口,移动产业处理器接口(mobile industry processor interface,mipi),通用输入输出(general-purpose input/output,gpio)接口,用户标识模块(subscriber identity module,sim)接口,和/或通用串行总线(universal serial bus,usb)接口等。
46.可以理解的是,本技术实施例示意的各模块间的接口连接关系,只是示意性说明,并不构成对电子设备
100
的结构限定。
在本技术另一些实施例中,电子设备
100
也可以采用上述实施例中不同的接口连接方式,或多种接口连接方式的组合。
47.电子设备
100
的无线通信功能可以通过天线2,无线通信模块
160,调制解调处理器以及基带处理器等实现。
48.天线2用于发射和接收电磁波信号。
电子设备
100
中的每个天线可用于覆盖单个或多个通信频带。
不同的天线还可以复用,以提高天线的利用率。
49.无线通信模块
160
可以提供应用在电子设备
100
上的包括无线局域网(wireless local area networks,wlan)(如无线保真(wireless fidelity,wi-fi)网络),蓝牙(bluetooth,bt),全球导航卫星系统(global navigation satellite system,gnss),调频(frequency modulation,fm),近距离无线通信技术(near field communication,nfc),红外技术(infrared,ir)等无线通信的凯发k8ag旗舰厅真人平台的解决方案。
无线通信模块
160
可以是集成至少一个通信处理模块的一个或多个器件。
无线通信模块
160
经由天线2接收电磁波,将电磁波信号调频以及滤波处理,将处理后的信号发送到处理器
110。
无线通信模块
160
还可以从处理器
110接收待发送的信号,对其进行调频,放大,经天线2转为电磁波辐射出去。
50.在一些实施例中,电子设备
100
的天线2和无线通信模块
160
耦合,使得电子设备
100
可以通过无线通信技术与网络以及其他设备通信。
所述无线通信技术可以包括全球移动通讯系统(global system for mobile communications,gsm),通用分组无线服务(general packet radio service,gprs),码分多址接入(code division multiple access,cdma),宽带码分多址(wideband code division multiple access,wcdma),时分码分多址(time-division code division multiple access,td-scdma),长期演进(long term evolution,
lte),bt,gnss,wlan,nfc,fm,和/或ir技术等。
51.一个实施例中,电子设备
100
可以为用户的可穿戴手表,用户的可穿戴手表可以通过蓝牙无线通信技术与用户的手机或平板电脑通信,比如可以将用户语音发送给手机,并接收手机返回的语音识别结果,然后通过手表显示屏显示接收到的语音识别结果,以及接收手机基于语音识别结果生成并返回的应用显示指令,并执行接收到的应用显示指令(如打开手表上的某一应用程序等)。
52.电子设备
100
通过gpu,显示屏
194,以及应用处理器等实现显示功能。gpu为图像处理的微处理器,连接显示屏
194和应用处理器。gpu用于执行数学和几何计算,用于图形渲染。
处理器
110可包括一个或多个gpu,其执行程序指令以生成或改变显示信息。
53.显示屏
194用于显示图像,视频等。
显示屏
194包括显示面板。
显示面板可以采用液晶显示屏(liquid crystal display,
lcd),有机发光二极管(organic light-emitting diode,oled),有源矩阵有机发光二极体或主动矩阵有机发光二极体(active-matrix organic light emitting diode的,amoled),柔性发光二极管(flex light-emitting diode,fled),miniled,microled,micro-oled,量子点发光二极管(quantum dot light emitting diodes,qled)等。
在一些实施例中,电子设备
100
可以包括1个或n个显示屏
194,n为大于1的正整数。
54.内部存储器
121可以用于存储计算机可执行程序代码,所述可执行程序代码包括指令。
内部存储器
121可以包括存储程序区和存储数据区。
其中,存储程序区可存储操作系统,至少一个功能所需的应用程序(比如声音播放功能,图像播放功能等)等。
存储数据区可存储电子设备
100
使用过程中所创建的数据(比如音频数据,电话本等)等。
此外,内部存储器
121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件,闪存器件,通用闪存存储器(universal flash storage,ufs)等。
处理器
110通过运行存储在内部存储器
121的指令,和/或存储在设置于处理器中的存储器的指令,执行电子设备
100
的各种功能应用以及数据处理。
55.一个实施例中,语音交互过程中所显示页面动画的图片集合,可以存储在内部存储器
121中。
56.电子设备
100
可以通过扬声器
170a,麦克风
170c,以及应用处理器等实现音频功能。
例如音乐播放,录音等。
57.一个实施例中,电子设备
100
可以通过麦克风
170c采集用户在语音交互过程中所发出语音的语音信号,并可以通过扬声器
170a播报通过处于语音信号所得的语音交互结果信息,以及通过显示屏
194显示语音交互结果信息,以通过语音播报、信息显示的方式向用户反馈语音交互结果。
58.压力传感器用于感受压力信号,可以将压力信号转换成电信号。
在一些实施例中,压力传感器可以设置于显示屏
194。
压力传感器的种类很多,如电阻式压力传感器,电感式
压力传感器,电容式压力传感器等。
当有触摸操作作用于显示屏
194,电子设备
100
根据压力传感器检测所述触摸操作强度。
电子设备
100
也可以根据压力传感器的检测信号计算触摸的位置。
59.触摸传感器,也称“触控器件”。
触摸传感器可以设置于显示屏
194,由触摸传感器与显示屏
194组成触摸屏,也称“触控屏”。
触摸传感器用于检测作用于其上或附近的触摸操作。
触摸传感器可以将检测到的触摸操作传递给应用处理器,以确定触摸事件类型。
可以通过显示屏
194提供与触摸操作相关的视觉输出。
在另一些实施例中,触摸传感器也可以设置于电子设备
100
的表面,与显示屏
194所处的位置不同。
60.按键
190
包括开机键,音量键,以及用于激活语音助手的快捷键等。
按键
190
可以是机械按键,也可以是触摸式按键。
61.一个实施例中,用户可以按压该快捷键以使电子设备
100
初始化语音助手。
62.一个实施例中,在电子设备
100
通过显示屏
194显示结果页面期间,用户可以通过触摸结果页面的指定区域,以触发电子设备
100
跳转至聆听页面。
63.马达
191可以产生振动提示。
马达
191可以用于来电振动提示,也可以用于触摸振动反馈。
指示器
192可以是指示灯,可以用于指示充电状态,电量变化,也可以用于指示消息,未接来电,通知等。
64.电子设备
100
的软件系统可以采用分层架构,事件驱动架构,微核架构,微服务架构,或云架构。
65.电子设备可以安装有语音助手应用程序(或简称语音助手),并通过语音助手实现用户与电子设备间的语音交互。
举例来说,在电子设备运行语音助手期间,用户可以向电子设备发出询问天气情况的语音,电子设备经对用户发出的语音进行语音交互处理,可以获取到天气信息,并将获取到的天气信息反馈给用户。
66.一个实施例中,该电子设备可以为可穿戴设备,比如用户的可穿戴运动手表。
可行地,可穿戴设备可以通过与终端设备相配合,以实现语音交互功能。
比如,用户的运动手表可以将用户语音发送给用户的手机来进行语音识别处理,并显示手机反馈的语音识别结果。
67.另一实施例中,该电子设备可以为手机、平板电脑等用户终端设备。
可行地,终端设备可自行实现语音交互功能。
68.一种相关技术中,电子设备可以在用户发出语音后,分析处理用户语音以获得语音交互结果信息,进而对语音交互结果信息进行播报,以向用户反馈语音交互处理结果。
但该相关技术的实现使得用户对语音助手所处状态无感知,影响用户的语音交互体验。
69.为提升用户的语音交互体验,本技术实施例中,电子设备可以在初始化语音助手之后,显示包括有状态相关动画的语音助手页面,以便用户获知语音助手所处状态。
下面,对本技术的一些实施例进行分别说明,不同的实施例之间实现方式和有益效果可相互参考。
尽管分别介绍,但是多种实施例可以同时实现在同一个电子设备上,本技术对此不做限定。
70.在本技术一个实施例中,电子设备响应于用户激活语音助手的请求,可以初始化语音助手,且在初始化语音助手期间显示初始化页面,初始化页面可以包括表示电子设备处于初始化语音助手状态的信息。
71.示例性地,手表显示初始化页面时的示意图可以如图2所示,参考图2,初始化页面中的“正在连接
…”
表示手表处于初始化语音助手状态。
72.一种可行实现方式中,用户可以通过触发用于激活语音助手的按键,以向电子设备发出激活语音助手的请求。
参考图2,手表的用于激活语音助手的按键可以为标号
201所示按键。
73.另一种可行实现方式中,用户还可通过说出设定激活词的方式,以向电子设备发出激活语音助手的请求。
74.在本技术一个实施例中,电子设备在初始化语音助手之后,可以存在语音聆听状态(或称聆听状态)、语音识别结果显示状态(或称识别状态)、语音交互结果显示状态(或称结果状态)、以及介于语音识别结果显示状态和语音交互结果显示状态之间的目标状态(或称思考状态)。
下面,分别对语音助手在不同状态下的页面及动画进行说明。
75.(1)聆听状态在本技术一个实施例中,电子设备可以显示语音助手处于聆听状态的页面(或称聆听页面),且聆听页面包括对应聆听状态的动画(或称聆听动画)。
电子设备显示聆听页面期间,用户可以发出语音,比如可以发出询问天气情况的语音。
76.可行地,电子设备可以通过顺序显示组成聆听动画的多张图片,以显示聆听动画。
则电子设备显示聆听页面期间,聆听动画的显示存在连贯动态效果。
77.示例性地,手表显示聆听页面时某一时刻下的示意图可以如图
3a所示,手表显示聆听页面时另一时刻下的示意图可以如图
3b所示。
参考图
3a和图
3b可知,手表显示聆听页面期间,聆听动画的显示存在动态效果,其中聆听动画在某一时刻显示为标号
301a所示图像,而在另一时刻显示为标号
301b所示图像。
78.可行地,除了包括聆听动画,聆听页面还可包括表示电子设备处于聆听状态的信息。
参考图
3a和图
3b,聆听页面中的文字“嗨,我在听
…”
和标识
302可以表示手表处于聆听状态。
79.(2)识别状态在本技术一个实施例中,电子设备可以对用户语音进行处理(自主识别语音或者发送其他设备进行识别)以获得语音识别结果,之后可以显示语音助手处于识别状态的页面(或称识别页面)。
此时,用户可以查看到已发出语音的语音识别结果。
80.可行地,电子设备可以通过顺序显示组成识别动画的多张图片,以显示识别动画。
则电子设备显示识别页面期间,识别动画的显示存在连贯动态效果。
81.为保证语音识别的及时性,在用户发出语音期间,电子设备可以依次获取(比如逐字获取、逐词获取等)用户顺序发出的语音信号,进而在识别页面中依次显示相应的语音识别结果。
如此,电子设备显示聆听页面和识别页面期间,用户可以持续发出语音,电子设备可对用户语音进行处理,获得的语音识别结果可被实时显示在识别页面中。
82.比如,若用户发出“天气预报”语音,则识别页面可以先显示包括语音识别结果“天气”的识别页面,再显示包括语音识别结果“天气预报”的识别页面。
83.示例性地,手表显示包括语音识别结果“天气预报”的识别页面时的示意图可以如图
4a所示。
手表显示识别页面期间,识别动画的显示存在动态效果,参考图
4a,识别动画在某一时刻显示为标号
401所示图像。
84.再比如,若用户发出“明天的天气”语音,则识别页面可以先显示包括语音识别结果“明天”的识别页面,再显示包括语音识别结果“明天的”的识别页面,之后显示包括语音识别结果“明天的天气”的识别页面。
示例性地,手表显示包括语音识别结果“明天的天气”的识别页面时的示意图可以如图
4b所示。
85.又比如,若用户发出“闹钟”语音,则识别页面可以显示包括语音识别结果“闹钟”的识别页面。
示例性地,手表显示包括语音识别结果“闹钟”的识别页面时的示意图可以如图
4c所示。
86.考虑到电子设备显示聆听页面和识别页面期间,用户可以持续发出语音,则参考图
3a和图
3b、以及参考图
4a~

4c,聆听动画和识别动画可以为相同的动画。
87.(3)结果状态在本技术一个实施例中,电子设备在获取到语音交互结果后,若语音交互结果为语音交互结果信息(如天气信息),则可以显示语音助手处于结果状态的页面(或称结果页面),且结果页面包括对应结果状态的动画(或称结果动画),以及包括语音交互结果信息。
如此,用户可以查看到语音交互结果信息。
88.可行地,电子设备可以通过顺序显示组成结果动画的多张图片,以显示结果动画。
则电子设备显示结果页面期间,结果动画的显示存在连贯动态效果。
89.可行地,若不存在与用户语音识别结果(比如用户发出“但是”语音)相匹配的信息,则语音交互结果信息可以为预设信息。
90.示例性地,手表显示包括预设信息的结果页面的示意图可以如图
5a所示。
参考图
5a,预设信息可以为“我不太理解你的意思,再给我一点时间学习吧。”。
参考图
5a,结果动画在某一时刻显示为标号
501a所示图像。
91.可行地,语音交互结果信息可以为与用户语音识别结果相匹配的信息。
92.一个示例中,语音识别结果为“天气预报”,则手表显示结果页面的示意图可以如图
5b所示。
参见图
5b,结果页面包括结果动画、以及与语音识别结果为“天气预报”相匹配的语音交互结果信息。
参考图
5b,结果动画在某一时刻显示为标号
501b所示图像。
93.另一示例中,语音识别结果为“明天的天气”,则手表显示结果页面的示意图可以如图
5c所示。
参见图
5c,结果页面包括结果动画、以及与语音识别结果为“明天的天气”相匹配的语音交互结果信息。
94.示例性地,参考图
5a~

5c可知,手表显示结果页面期间,结果动画的显示存在动态效果,其中结果动画在某一时刻显示为标号
501a所示图像,而在另一时刻显示为标号
501b所示图像。
95.示例性地,参考图
3a和图
3b、图
5a~

5c,结果动画与聆听动画可以为不同的动画。
96.示例性地,参考图
4a~

4c、图
5a~

5c,结果动画与识别动画可以为不同的动画。
97.在本技术一个实施例中,电子设备在获取到语音交互结果后,若语音交互结果为应用显示指令(如打开某一应用程序的指令),则可以打开应用程序并显示应用程序的页面。
如此,用户可以使用应用程序。
98.示例性地,该应用程序可以为电子设备上的闹钟、运动、摄像头等应用程序。
示例性地,语音识别结果为“闹钟”,则手表显示闹钟页面的示意图可以如图6所示。
99.(4)思考状态
基于对语音交互结果的获取时效性,语音交互结果可能存在延迟获得的情况。
如此,在本技术一个实施例中,电子设备在显示识别页面期间,若获取到向语音助手处于思考状态的页面(或称思考页面)跳转的指令,则显示思考页面。
100.可行地,电子设备可以通过顺序显示组成思考动画的多张图片,以显示思考动画。
则电子设备显示思考页面期间,思考动画的显示存在连贯动态效果。
101.一个示例中,手表显示思考页面时某一时刻下的示意图可以如图
7a所示。
另一示例中,手表显示思考页面时某一时刻下的示意图可以如图
7b所示。
102.参考图
7a和图
7b可知,手表显示思考页面期间,思考动画的显示存在动态效果,其中思考动画在某一时刻显示为标号
701a所示图像,而在另一时刻显示为标号
701b所示图像。
103.可行地,除了包括思考动画,思考页面还可包括其他信息。
一个实施例中,该其他信息可以为识别页面中显示的语音识别结果(比如图
7a所示出的“明天的天气”)。
另一实施例中,该其他信息可以为表示用户可发出语音的设定信息(比如图
7b所示出的“你说,我在听
……”
)。
104.示例性地,参考图
3a和图
3b、参考图
4a~

4c、图
5a~

5c、图
7a和图
7b,思考动画分别与聆听动画、识别动画和结果动画不同。
105.若电子设备显示思考页面期间,获取到语音交互结果,且语音交互结果为应用显示指令,则可以打开应用程序并显示应用程序的页面。
106.若电子设备显示思考页面期间,获取到语音交互结果,且语音交互结果为语音交互结果信息,则可以显示结果页面,且结果页面包括结果动画和语音交互结果信息。
107.若电子设备显示思考页面期间,获取到语音识别结果,则可以显示识别页面,且识别页面包括识别动画和语音识别结果。
108.可见,本技术实施例通过在初始化语音助手后,显示语音助手所处状态的页面,并限定页面包括状态对应的动画,可便于用户直观获知语音助手所处状态,为用户与电子设备间的语音交互提供支持,如此可提升用户的语音交互体验。
109.参考图8,以手表实现语音交互功能为例,本技术实施例提供的一种语音交互方法可以包括以下步骤
1~
步骤
8。
110.步骤1,在用户长按手表的用于激活语音助手的快捷键的情况下,手表初始化语音助手,并在初始化语音助手期间显示正在连接页面
31。
111.示例性地,快捷键可以为图2中标号
201所示按键。
用户通过长按快捷键,可以向手表发出激活语音助手的请求,以使手表初始化语音助手。
112.示例性地,正在连接页面
31可以如图2所示。
113.步骤2,手表在语音助手初始化成功后,显示聆听页面
32,聆听页面
32包括聆听动画。
114.动画可以包括多张图片,手表可以通过顺序显示多张图片来显示动画。
115.示例性地,聆听页面
32可以如图
3a、图
3b所示,聆听动画可以为通过线的动态变化来呈现动画效果的线动动画。
116.手表显示聆听页面
32期间,手表可以通过蓝牙,将用户所发出语音的语音信号发送给手机。
手机可以对手表发来的语音信号进行识别,并将识别到的语音识别结果反馈至
手表。
117.步骤3,手表在接收到手机发来的语音识别结果后,显示识别页面
33,识别页面
33包括识别动画和接收到的语音识别结果。
118.示例性地,识别页面
33可以如图
4a~

4c所示,识别动画可以为通过线的动态变化来呈现动画效果的线动动画。
119.参考图8,在聆听动画和识别动画为相同动画的情况下,手表在显示聆听动画和显示识别动画之间,可以不显示过渡动画。
120.一个实施例中,手机可以根据用户说话的时间间隔,确定用户是否已完成语音输出。
手机若确定出用户已完成语音输出,则可以在反馈相应语音识别结果后,开始生成语音交互结果,进而将语音交互结果反馈给手表。
121.若用户发出语音以询问信息,则手机生成的语音交互结果可以为语音交互结果信息,并生成为2的消息状态;若用户发出语音以请求打开某一应用程序,则手机生成的语音交互结果可以为该应用程序的应用显示指令,并生成为3的消息状态;若手机未在设定时段内生成语音交互结果,即若手机延迟生成语音交互结果,则可以生成为0或1的消息状态。
122.手机通过生成不同数值的消息状态,以支持手表据此执行相应不同的处理流程,以匹配用户的语音交互需求和手机生成语音交互结果的时效性。
其他实施例中,也可以将消息状态设置为其他不同数值,本实施例对此不作限定。
123.步骤4,手表接收到手机发来的消息状态,若消息状态为0或1,执行步骤5,若消息状态为2且接收到手机发来的语音交互结果信息,执行步骤6,若消息状态为3且接收到手机发来的闹钟显示指令,显示闹钟页面
36。
124.示例性地,闹钟页面
36可以如图6所示。
其他实施例中,若手机发来其他应用(如运动应用等)的显示指令,则手表显示其他应用的页面。
125.步骤5,手表显示思考页面
35,思考页面
35包括思考动画,并执行步骤7或步骤
8。
126.示例性地,思考页面
35可以如图
7a~

7b所示,思考动画可以为通过点的动态变化来呈现动画效果的点动动画。
127.参考图8,在识别动画和思考动画为不同动画的情况下,手表在显示识别动画和显示思考动画之间,可以显示自识别动画向思考动画过渡的过渡动画(即线到点的过渡动画),以使得动画显示效果平滑不突兀。
128.一个实施例中,手表可以在显示思考页面
35期间,先显示线到点的过渡动画,再显示思考动画,以实现自识别动画向思考动画的平滑过渡。
129.手机延迟生成语音交互结果的情况下,手表可以先显示思考页面
35,并待手机生成并反馈语音交互结果后,再根据语音交互结果展示相应页面。
130.步骤6,手表显示结果页面
34,结果页面
34包括结果动画和语音交互结果信息。
131.示例性地,结果页面
34可以如图
5a~

5c所示,结果动画可以为通过不规则球形的动态变化来呈现动画效果的球动动画。
132.参考图8,在识别动画和结果动画为不同动画的情况下,手表在显示识别动画和显示结果动画之间,可以显示自识别动画向结果动画过渡的过渡动画(即线到球的过渡动画),以使得动画显示效果平滑不突兀。
133.一个实施例中,手表可以在显示结果页面
34期间,先显示线到球的过渡动画,再显
示结果动画,以实现自识别动画向结果动画的平滑过渡。
134.在本技术一个实施例中,在手表显示结果页面
34后,若用户需要执行再一次的语音交互,可以触摸手表显示屏的指定区域(比如可以为结果页面
34中结果动画的显示区域)。
响应于用户对该指定区域的触摸操作,手表可以再次显示聆听页面
32,即由结果页面
34跳转至聆听页面
32。
135.参考图8,在结果动画和聆听动画为不同动画的情况下,手表在显示结果动画和显示聆听动画之间,可以显示自结果动画向聆听动画过渡的过渡动画(即球到线的过渡动画),以使得动画显示效果平滑不突兀。
136.一个实施例中,手表可以在显示聆听页面
32期间,先显示球到线的过渡动画,再显示聆听动画,以实现自结果动画向聆听动画的平滑过渡。
137.步骤7,手表接收到手机发来的消息状态时,若消息状态为2且接收到手机发来的语音交互结果信息,执行步骤6,若消息状态为3且接收到手机发来的闹钟显示指令,显示闹钟页面
36。
138.若手机在手表显示思考页面
35期间发来语音交互结果,则手表根据语音交互结果,由思考页面
35按需跳转至结果页面
34或闹钟页面
36。
139.参考图8,在思考动画和结果动画为不同动画的情况下,手表在显示思考动画和显示结果动画之间,可以显示自思考动画向结果动画过渡的过渡动画(即点到球的过渡动画),以使得动画显示效果平滑不突兀。
140.一个实施例中,手表可以在显示结果页面
34期间,先显示点到球的过渡动画,再显示结果动画,以实现自思考动画向结果动画的平滑过渡。
141.步骤8,手表接收到手机发来的语音识别结果时,显示识别页面
33,识别页面
33包括识别动画和获取到的语音识别结果。
142.若手机对用户是否已完成语音输出的判断与用户实际需求不符,则可能存在手机反馈消息状态后,又接收到手表发来的语音信号的情况,则手机可在手表显示思考页面
35期间,将新识别到的语音识别结果反馈至手表,以使手表由思考页面
35跳转回识别页面
33,并对新识别到的语音识别结果进行显示。
143.如此,不同于步骤3中手机在手表显示识别页面
33之前和显示识别页面
33期间发来的语音识别结果,步骤8中的语音识别结果为手表在显示思考页面
35期间手机发来的语音识别结果,则手表显示页面可以由思考页面
35跳转回识别页面
33。
144.一个实施例中,手表可以显示自思考动画向识别动画过渡的过渡动画(即点到线的过渡动画),以使动画显示效果平滑不突兀。
另一实施例中,考虑到相较于其他页面(如识别页面、结果页面),思考页面的显示时长较短,则也可不显示自思考动画向识别动画过渡的过渡动画。
145.基于图8所示实施例的语音交互处理逻辑,若由手机等终端设备作为执行主体来实现语音交互功能,则终端设备可以获取用户所发出语音的语音信号,并对语音信号进行识别,并通过识别页面显示语音识别结果,以及根据语音识别结果生成语音交互结果,并基于语音交互结果的内容和生成语音交互结果的时效性,在显示识别页面之后,按需显示应用页面、结果页面或者思考页面。
上述的需要在手机和手表间传递的信息,可在手机内部模块间进行传递处理。
关于终端设备进行语音交互处理的具体实现逻辑可参考图8所示实施
例的相关技术描述,在此不做赘述。
146.对于数据处理能力较弱、内存较小的终端设备,该终端设备实现语音交互功能时,可能存在因图片加载耗时而导致动画播放不流畅的问题。
下面,对可以解决该问题的技术内容进行说明。
147.图8所示实施例中,手表需在显示结果页面
34之前,获取到结果动画的图片集合,以支持在显示结果页面
34期间,通过顺序显示图片集合中的图片来显示结果动画。
148.一种可行实现方式中,可以在显示识别页面
33或思考页面
35之后、以及在显示结果页面
34之前,获取结果动画。
其中,手表可以使用结果页面切换函数(比如switchtopage(result)函数),来实现向结果页面切换的页面切换过程。
在页面切换过程中,手表可以采用xml
(extensible markup language,可扩展标记语言)文件解析方式,将结果动画的图片集合从gui(graphical user interface,图形用户页面)文件中加载到内存中。
149.但结果页面切换函数存在耗时,比如由于结果动画的动画效果较为复杂,结果动画的数据量(比如图片数量可在
70
张左右)较大,则switch to page(result)函数的耗时可达
1080ms,使得在页面切换过程中ui(user interface,用户页面)任务一直加载图片,则识别页面(或思考页面)切换结果页面过程中存在动画播放不流畅的问题。
150.为解决该问题,在本技术一个实施例中,可以在手表初始化语音助手的过程中,即在手表显示正在连接页面
31的过程中,执行图片预加载处理,以将结果动画的图片集合从gui文件中加载到内存中,如此可提高图片加载效率。
151.以识别页面切换结果页面为例,由于在待显示结果页面之前,结果动画资源已被加载到内存中,则手表显示识别页面后即可从内存中获取结果动画的图片集合以显示结果页面,而无需从gui文件中获取结果动画的图片集合,如此使得手表在页面切换过程中依次显示识别动画、自识别动画向结果动画过渡的过渡动画、以及结果动画,动画播放流畅不间断,则用户的语音交互体验更好。
152.一个实施例中,手表可以将结果动画的第一帧图片加载到页面动画显示位置处,以便需要显示结果动画时,从结果动画的第一帧图片开始,顺序显示结果动画的各个图片。
153.若手表在初始化过程中预加载多个页面动画,则手表可以将预加载的各个页面动画的第一帧图片(该第一帧图片用于标识页面动画开始显示时的图片)均置于同一显示位置(比如图
4a中标号
401所示图像的位置)处的不同图层中,并通过控制各个图层的显示时段(或称隐藏时段),以在不同页面显示过程中显示相应的页面动画。
154.一个实施例中,手表还可在初始化语音助手的过程中,执行对过渡动画的预加载处理。
可行地,手表可以将过渡动画的第一帧图片加载到页面动画显示位置处,以便需要显示过渡动画时,从过渡动画的第一帧图片开始,顺序显示过渡动画的各个图片。
155.不同于手表,对于文件读取速度和图片的绘制速度等性能更优的终端设备(比如手机),终端设备实现语音交互功能时,可以在识别页面切换结果页面期间,从gui文件中获取结果动画,而不执行在初始化语音助手期间预加载结果动画的操作。
156.对于数据处理能力较弱、内存较小的终端设备,该终端设备实现语音交互功能时,可能存在因动画播放不完整而导致动画播放不连续的问题。
下面,对可以解决该问题的技术内容进行说明。
157.图8所示实施例中,受限于手表芯片的数据处理能力以及手表功耗等性能特点,可
以对手表单次播放动画的允许显示图片数量进行限制,比如动画组件对动画播放数量可以存在
50
张限定,即手表播放一次动画所能显示图片的最大数量为
50。
若动画的图片集合中图片的数量超过该最大数量,则会存在手表循环播放动画过程中,动画播放不连续的问题。
158.比如由于结果动画的动画效果较为复杂,结果动画的图片数量可以超过
50
张,则手表每次播放结果动画时可以仅顺序显示所有图片中的前
50
张图片,而其余图片不显示,如此使得结果动画播放不连续,而影响用户的语音交互体验。
159.为支持结果动画播放的连续性,在本技术一个实施例中,可以对结果动画的图片数量进行限定,使得结果动画的图片数量小于或者等于手表单次播放动画的允许显示图片数量,比如结果动画的图片数量不超过
50
张。
基于此,手表在结果页面显示期间,可以循环播放结果动画,且每一次播放结果动画的过程均通过顺序播放组成结果动画的每一张图片来实现,如此可实现结果动画的循环连续播放,则用户的语音交互体验更好。
160.除了对动画的图片数量进行限制以匹配手表性能,还可对图片的播放速度进行限制,以匹配手表性能和提升动画显示效果。
示例性地,结果动画的图片数量可为
49张,手表对结果动画的播放帧率为
20
帧每秒。
161.不同于手表,对于内存更大、数据处理能力更强的终端设备(比如手机),终端设备实现语音交互功能时,可以不对动画的图片数量进行限制,或者终端设备播放一次动画所能显示图片的最大数量更大。
162.终端设备(如手机、手表等)实现语音交互功能时,可能存在因用户陆续发出语音所触发的识别动画反复重新开始播放的问题。
下面,对可以解决该问题的技术内容进行说明。
163.图8所示实施例中,基于用户先后发出的语音,手表在识别页面
33中可以先后显示相应的语音识别结果。
比如用户语音为“明天的天气”,则手表的识别页面
33可以先显示“明天”,再显示“明天的”,之后显示“明天的天气”,即手表在识别页面
33中先后显示“明天”、“的”、“天气”这三个语音识别结果。
164.一种可行实现方式中,手表每次收到手机发来的语音识别结果后,均可调用显示识别页面函数(比如记作show recognition page函数)以实现蹦字回显功能。
由于show recognition page函数中存在开始播放识别动画函数(比如recognition animated-》start()函数),则手表在反复调用show recognition page函数的操作会导致recognition animated-》start()被重复调用,从而导致在手表显示识别页面
33期间,识别动画反复的重新播放,使得识别动画的播放不连贯。
165.为解决手表在每次收到语音识别结果后重新播放识别动画,使得识别页面显示期间识别动画播放不连贯的问题,在本技术一个实施例中,手表在每次收到语音识别结果后,可以获取识别页面的标志位,若标志位为true,则表示识别页面显示期间非首次收到语音识别结果(即在识别页面显示期间收到的语音识别结果),识别动画已开始播放,则手表可以不调用recognition animated-》start(),如此使得识别动画基于已有的播放进度接续播放。
166.反之,若识别页面的标志位为false,则表示识别页面显示期间首次收到语音识别结果(即在显示识别页面之前收到的语音识别结果),识别动画尚未开始播放,则手表可以调用recognition animated-》start()以开始循环播放识别动画,之后将识别页面的标示
位设置为true。
167.一个实施例中,手表可以在结束显示识别页面后,将识别页面的标示位设置为false,以支持手表下次显示识别页面时,再次开始循环播放识别动画。
168.通过按需设置识别页面的标志位,手表在识别页面显示期间对识别动画连续播放,而不受用户陆续发出新语音的影响。
169.终端设备(如手机、手表等)实现语音交互功能时,可能存在过渡动画和页面动画叠加显示而影响动画显示效果的问题。
下面,对可以解决该问题的技术内容进行说明。
170.图8所示实施例中,手表显示结果页面、思考页面、以及聆听页面的过程中,可以先显示过渡动画,再显示页面动画,以支持页面切换过程中的动画连贯播放。
171.一种可行实现方式中,以显示思考页面为例,可以在思考页面显示流程的代码程序中设置线到点过渡动画的第一帧图像的标识(比如图像的id),以可以根据该标识,自过渡动画的第一帧图像开始,依次显示过渡动画的各个图像,来实现对过渡动画的显示过程。
以及可以在思考页面显示流程的代码程序中设置思考动画的第一帧图像的标识,如此可以根据该标识,在结束对过渡动画的显示后,自思考动画的第一帧图像开始,依次显示思考动画的各个图像,来实现对思考动画的显示过程。
其中,过渡动画的第一帧图像和思考动画的第一帧图像可以位于同一显示位置处的不同图层。
由于在播放思考动画期间,虽然不播放过渡动画,但过渡动画的第一帧图像在思考动画的显示位置处,则会存在开始播放思考动画时,过渡动画的第一帧图像和思考动画叠加显示的问题,从而影响用户的语音交互体验。
172.在手表由显示结果页面向显示聆听页面切换的情况下,手表开始显示聆听页面时的示意图可以如图9所示。
参考图9所示的手表显示聆听页面时的示意图,手表开始显示聆听页面的聆听动画时,存在聆听动画和球到线的过渡动画叠加显示的情况,叠加显示的动画图像如标号
901所示图像。
173.为解决过渡动画和页面动画叠加显示的问题,在本技术一个实施例中,可以在播放过渡动画之后,以及在播放页面动画之前,将过渡动画的状态设置为不可见状态。
示例性地,可以将过渡动画的状态设置false。
174.通过在显示线到点过渡动画后,将线到点过渡动画的状态设置为false,可使得手表显示思考动画时,线到点过渡动画的第一帧图像不被显示,如此可以避免存在显示思考动画时,过渡动画的第一帧图片和思考动画叠加显示的情况。
175.参考图
10,本技术一个实施例提供了一种手表的软件框架,包括应用层
21、框架层
22、内核层
23、硬件抽象层
24和硬件驱动层
25。
176.应用层
21可以包括多类应用程序,比如互联互通
211(比如语音助手应用程序)、健康应用
212(比如心率应用程序)、运动应用
213(比如专业运动应用程序)、系统应用
214(比如闹钟应用程序)等应用程序。
177.框架层
22包括应用框架
221、基础库
222、算法库
223(包括运动算法)、传统蓝牙协议栈
224和低功耗蓝牙协议栈
225。
其中,应用框架
221包括用户界面框架
2211、系统基本能力
2212(包括互联互通和语音服务)、底层软件服务能力
2213、运动健康服务能力
2214(包括运动服务)、硬件服务能力
2215。
178.其中,手表使用语音助手时可依赖于用户界面框架
2211中的uikit,以实现对语音助手的动画显示及文字显示。uikit的功能实现可依赖于用户界面框架
2211中的js(javascript)、c
等开源库的库函数。
179.内核层
23包括操作系统
231。
180.硬件抽象层
24包括按键
241、触摸屏
242、flash存储器
243、显示屏
244、蓝牙
245。
181.硬件驱动层
25包括触摸屏驱动
251、flash驱动
252、显示屏驱动
253、蓝牙驱动
254。
182.参见图
10,响应于用户对按键
241中语音助手快捷键的操作,手表可以初始化语音助手应用程序,并通过内部的显示屏相关组件,通过显示屏显示初始化页面。
183.手表可以通过内部的语音服务,获取用户所发出语音的语音信号。
184.基于手表中的互联互通相关组件,手表可通过蓝牙通信技术与外部设备如手机进行通信,比如手表将采集到的语音信号发送给手机,并接收手机反馈的语音识别结果、语音交互结果等。
185.若语音交互结果包括语音交互结果信息,则手表可以通过显示屏显示包括语音交互结果信息的结果页面。
在手表显示结果页面期间,用户可以按需触摸显示屏的指定区域,以请求开始下一次的语音交互流程。
186.若语音交互结果包括应用显示指令,则手表可以通过显示屏显示相应的应用页面,比如闹钟页面、心率页面、专业运动页面等。
187.手表的flash存储器可用于存储手表实现语音交互功能的代码程序,以及可以存储页面动画的图片集合。
188.图
10所示手表的软件框架还可包括其他组件,比如应用层
21还可包括用于实现通信功能的联系人、通话、通话记录等通信应用类应用程序,硬件抽象层
24还可包括用于实现感知功能的加速度、陀螺仪、定位模块等传感器,本实施例在此不做一一列举。
189.参考图
11,本技术一个实施例提供了一种语音交互方法,该方法可以包括以下步骤
1101~
步骤
1102。
该方法可以应用于可穿戴设备、终端设备等电子设备。
190.步骤
1101,响应于对电子设备的语音助手的激活请求,初始化语音助手。
191.参考图2,用户可以长按手表的按键
201以发出激活请求,手表收到激活请求后可以初始化语音助手,以使语音助手处于运行状态。
192.一个实施例中,用户可以对终端设备发出对应激活词的语音,以请求终端设备激活语音助手。
193.步骤
1102,在初始化语音助手之后,显示语音助手处于第一状态时的第一页面,第一页面包括对应第一状态的第一动画。
其中,第一状态为语音聆听状态、语音识别结果显示状态、语音交互结果显示状态、或者介于语音识别结果显示状态和语音交互结果显示状态之间的目标状态(即本技术其他实施例所述的思考状态)。
194.一个实施例中,终端设备在初始化语音助手后,可以依次显示聆听页面、识别页面、结果页面,以及可以基于语音交互结果的生成时效性,按需显示思考页面,以及实现页面跳转显示。
终端设备显示语音助手分别处于聆听状态、识别状态、思考状态、结果状态时的页面的相关技术实现,可参考本技术其他实施例的说明,在此不做赘述。
195.在图
11所示语音交互方法的一个实施例中,语音交互方法还可以包括:在初始化语音助手的过程中,将第一动画的图片集合加载到电子设备的内存中。
如此,电子设备显示语音助手处于第一状态时的第一页面的步骤可以包括:显示内存中加载的第一动画的图片集合。
196.一个实施例中,可以从gui文件中获取页面动画的图片集合,并加载到内存中。
197.不同状态下的页面动画的图片加载耗时可以存在差异,如此可以在初始化语音助手期间,对图片加载耗时高的页面动画进行预加载。
在初始化语音助手期间预加载的页面动画,可以包括聆听动画、识别动画、思考动画、结果动画中的部分或全部。
198.一个实施例中,电子设备可以将预加载的各个页面动画的第一帧图片均置于同一显示位置处的不同图层中,并通过控制各个图层的显示时段,以在不同页面显示过程中显示相应的页面动画。
199.一个实施例中,电子设备在初始化语音助手过程中还可预加载过渡动画,并将预加载的各个过渡动画的第一帧图片(该第一帧图片用于标识过渡动画开始显示时的图片)置于上述显示位置处的不同图层中。
200.通过在初始化语音助手期间预加载页面动画至内存中,可以避免存在因图片加载耗时而导致动画播放不流畅的问题。
201.在图
11所示语音交互方法的一个实施例中,第一动画的图片数量小于或者等于电子设备单次播放动画的允许显示图片数量。
如此,电子设备显示语音助手处于第一状态时的第一页面这一步骤可以包括:循环播放第一动画。
202.在页面显示期间,可以循环播放页面动画,以提升用户的语音交互体验。
203.一个实施例中,可以对电子设备所显示的各个页面动画的图片数量均进行限制。
204.通过根据电子设备的设备性能,对页面动画的图片数量进行限制,可使得页面动画循环连续播放,以避免存在因图片数量过多而导致动画播放不完整,从而导致动画播放不连续的问题。
205.在图
11所示语音交互方法的一个实施例中,电子设备循环播放第一动画的步骤可以包括:使用第一帧率,执行对第一动画的循环播放;其中,使用第一帧率单次播放第一动画的用时在电子设备单次播放动画的允许用时范围内。
比如使用第一帧率单次播放第一动画的用时小于或者等于电子设备单次播放动画的允许用时。
206.一个实施例中,可以对电子设备所显示的各个页面动画的播放帧率均进行限制。
207.通过对页面动画的播放帧率进行合理限制,可以避免出现页面动画过快或过慢播放的情况,通过适宜的页面动画播放速度来显示页面动画,有助于提升用户的语音交互体验。
208.在图
11所示语音交互方法的一个实施例中,在第一状态为语音识别结果显示状态的情况下,电子设备显示语音助手处于第一状态时的第一页面这一步骤可以包括:在获取到语音识别结果的情况下,若对应第一页面的第一标识信息为第一信息,通过开始循环播放第一动画、以及显示语音识别结果,以显示第一页面。
而若第一标识信息为第二信息,通过接续循环播放第一动画、以及显示语音识别结果,以显示第一页面。
209.若为第一信息,可以调用相关函数以开始循环播放识别动画,并显示当前接收到的语音识别结果。
若为第二信息,识别动画已开始循环播放,故可以不调用相关函数以使识别动画接续循环播放,并显示当前接收到的语音识别结果。
210.一个实施例中,第一信息可以为true,第二信息可以为false。
211.可行地,在第一状态为语音识别结果显示状态的情况下,语音交互方法还可包括:在开始循环播放第一动画之后,将第一标识信息设置为不同于第一信息的其他信息(比如
第二信息)。
212.通过在开始循环播放识别动画后,对识别页面的标识信息进而修改,可使得识别页面显示期间,首次获得语音识别结果时开始循环播放识别动画,而非首次获得语音识别结果时继续循环播放识别动画,以避免识别页面显示期间反复重新开始播放识别动画而导致识别动画播放不连续。
213.可行地,在第一状态为语音识别结果显示状态的情况下,语音交互方法还可包括:在结束显示第一页面之后,将第一标识信息设置为第一信息。
214.通过在结束显示识别页面后,对识别页面的标识信息进而修改,可使得再次显示识别页面时,开始循环播放识别动画,而避免存在再次显示识别页面期间未显示识别动画的情况。
215.电子设备在新获取到语音识别结果后,基于识别页面的标识信息不同,按需执行开始循环播放识别动画的操作,以使识别动画开始循环播放或接续循环播放。
如此可以避免存在因用户陆续发出语音所触发的识别动画反复重新开始播放的问题,支持电子设备在识别页面显示期间对识别动画的连续性播放。
216.在图
11所示语音交互方法的一个实施例中,第二页面为语音助手处于第二状态时的页面,第二页面包括对应第二状态的第二动画,第一状态和第二状态为语音聆听状态、语音识别结果显示状态、语音交互结果显示状态和目标状态中的两种状态。
基于此,语音交互方法还可以包括:显示从第一动画向第二动画过渡的第一过渡动画。
217.第一页面的页面动画和第二页面的页面动画不同或者差距较大,如此可以在自第一页面向第二页面切换时,显示用于在两个页面动画间过渡动画效果的过渡动画,如此以呈现页面动画的连贯性切换效果。
参考图8,基于图8所示实施例中页面的页面动画,过渡动画可以有线到球的过渡动画、线到点的过渡动画等。
218.可行地,语音交互方法还可包括:在显示第一过渡动画之后,将第一过渡动画的状态设置为不可见状态,并显示第二动画。
219.一个实施例中,通过将过渡动画设置为不可见状态,可以在显示页面动画时不会叠加显示过渡动画。
通过在显示过渡动画后修改其状态为不可见状态,可以避免存在过渡动画和页面动画叠加显示的情况。
220.在图
11所示语音交互方法的一个实施例中,在第一状态为语音识别结果显示状态、第一页面包括第一语音识别结果的情况下,语音交互方法还可以包括:获取第一处理信息,第一处理信息为通过处理第一语音识别结果所得到的信息。
221.示例性的,手机通过处理已识别出的语音识别结果,可以生成第一处理信息,并将第一处理信息发送给手表,手表可以根据第一处理信息的内容进行相应页面显示。
222.若第一处理信息包括第一跳转指令,则显示语音助手处于目标状态的第三页面,第三页面包括对应目标状态的动画。
比如,若手机延迟生成语音交互结果,则可以反馈第一跳转指令,以使手表从识别页面跳转至思考页面。
223.若第一处理信息包括语音交互结果信息,则显示语音助手处于语音交互结果显示状态的第四页面,第四页面包括所获取的语音交互结果信息、以及对应语音交互结果显示状态的动画。
比如,若用户发出信息询问语音,则手机生成的语音交互结果可以包括语音交互结果信息,以使手表从识别页面跳转至结果页面。
224.若第一处理信息包括应用显示指令,则显示与所获取的应用显示指令相对应的应用程序的页面。
比如,若用户发出请求打开应用的语音,则手机生成的语音交互结果可以包括应用显示指令,以使手表从识别页面跳转至相应应用的页面。
225.一个实施例中,参考图8,获取到第一跳转指令的情况可以为手表接收到为0或1的消息状态的情况;获取到语音交互结果信息的情况可以为手表接收到为2的消息状态并接收到语音交互结果信息的情况;获取到应用显示指令的情况可以为手表接收到为3的消息状态的情况。
226.基于用户的不同语音交互需求以及对语音交互结果的生成时效性的不确定性,电子设备在显示识别页面后,可以按需跳转至结果页面、思考页面或应用页面,以匹配用户需求和语音交互结果的生成时效性。
227.在图
11所示语音交互方法的一个实施例中,在显示语音助手处于目标状态的第三页面之后,语音交互方法还可以包括:获取到第二语音识别结果或者第二处理信息,第二处理信息为通过处理第一语音识别结果所得到的信息。
228.示例性地,若用户在手表显示思考页面期间发出语音,则手表可以获取到手机对用户所发出语音的语音识别结果,否则可以获取到手机延迟生成的第二处理信息。
229.若获取到第二语音识别结果,则显示语音助手处于语音识别结果显示状态的第五页面,第五页面包括第二语音识别结果和第一动画(此处表示为识别动画)。
比如,若用户在手表显示思考页面期间发出语音,则手机可以生成并反馈相应的语音识别结果,以使手表从思考页面跳转回识别页面。
230.若获取到第二处理信息、且第二处理信息包括语音交互结果信息,则显示语音助手处于语音交互结果显示状态的第六页面,第六页面包括所获取的语音交互结果信息、以及对应语音交互结果显示状态的动画。
比如,若用户发出信息询问语音,则手机延迟生成的语音交互结果可以包括语音交互结果信息,以使手表从思考页面跳转至结果页面。
231.若获取到第二处理信息、且第二处理信息包括应用显示指令,则显示与所获取的应用显示指令相对应的应用程序的页面。
比如,若用户发出请求打开应用的语音,则手机延迟生成的语音交互结果可以包括应用显示指令,以使手表从思考页面跳转至相应应用的页面。
232.一个实施例中,参考图8,获取到第二语音识别结果的情况可以为手表接收到语音识别结果的情况;获取到语音交互结果信息的情况可以为手表接收到为2的消息状态并接收到语音交互结果信息的情况;获取到应用显示指令的情况可以为手表接收到为3的消息状态的情况。
233.在电子设备延迟获得语音交互结果的情况下,电子设备显示相应的思考页面,并在显示思考页面之后,按需跳转至结果页面、应用页面或跳转回识别页面,以匹配用户需求。
234.关于图
11所示语音交互方法的具体技术实现可参考本技术其他实施例的相关技术说明,在此不作赘述。
235.本技术实施例还提供一种语音交互装置,包括:初始化模块,用于响应于对电子设备的语音助手的激活请求,初始化语音助手;显示模块,用于在初始化语音助手之后,显示语音助手处于第一状态时的第一页面,第一页面包括对应第一状态的第一动画;其中,第一
状态为语音聆听状态、语音识别结果显示状态、语音交互结果显示状态、或者介于语音识别结果显示状态和语音交互结果显示状态之间的目标状态。
236.本技术实施例还提供一种电子芯片,该任务处理芯片安装在电子设备(ue)中,电子芯片包括:处理器,其用于执行存储在存储器上的计算机程序指令,其中,当计算机程序指令被处理器执行时,触发电子芯片执行本技术任意方法实施例提供的方法步骤。
237.本技术实施例还提出了一种终端设备,终端设备包括通信模块、用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发终端设备执行本技术任意方法实施例提供的方法步骤。
238.本技术实施例还提出了一种服务器设备,服务器设备包括通信模块、用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发服务器设备执行本技术任意方法实施例提供的方法步骤。
239.本技术实施例还提供一种电子设备,电子设备包括多根天线、用于存储计算机程序指令的存储器、用于执行计算机程序指令的处理器和通信装置(比如可以基于nr协议实现
5g通信的通信模块),其中,当计算机程序指令被该处理器执行时,触发电子设备执行本技术任意方法实施例提供的方法步骤。
240.具体的,在本技术实施例中,一个或多个计算机程序被存储在上述存储器中,该一个或多个计算机程序包括指令,当该指令被上述设备执行时,使得上述设备执行本技术实施例所述的方法步骤。
241.进一步的,本技术实施例阐明的设备、装置、模块,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。
242.本领域内的技术人员应明白,本技术实施例可提供为方法、装置、或计算机程序产品。
因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。
而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。
243.在本技术所提供的几个实施例中,任一功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。
基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。
244.具体的,本技术实施例中还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行本技术实施例提供的方法步骤。
245.本技术实施例还提供一种计算机程序产品,该计算机程序产品包括计算机程序,当其在计算机上运行时,使得计算机执行本技术实施例提供的方法步骤。
246.在本技术所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。
例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
另一点,所显示
或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
247.作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。
可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
248.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
249.以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。
上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(processor)执行本技术各个实施例所述方法的部分步骤。
而前述的存储介质包括:u盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
250.本技术实施例中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。
在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
251.本技术可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。
一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。
也可以在分布式计算环境中实践本技术,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。
在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
252.本领域普通技术人员可以意识到,本技术实施例中描述的各单元及算法步骤,能够以电子硬件、计算机软件和电子硬件的结合来实现。
这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。
专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
253.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,本技术中的各个实施例各个实施例之间相同相似的部分互相参见即可。
比如本技术实施例描述的系统、装置和单元的具体工作过程,可以参考本技术方法实施例中的对应过程,在此不再赘述。
254.以上所述仅为本技术的具体实施例而已,并不用以限制本技术,本技术保护范围应以权利要求为准。
当前第1页1  
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
网站地图