一种基于5g的手机数据传输方法和系统与流程-k8凯发

文档序号:37023173发布日期:2024-02-09 13:17阅读:76来源:国知局
一种基于5g的手机数据传输方法和系统与流程

本发明涉及数据传输,更具体地说,本发明涉及一种基于5g的手机数据传输方法和系统。


背景技术:

1、申请公开号为cn116527572a的专利公开了一种基于5g的多路径数据传输系统,包括:主控模块:作为整个系统的核心,控制系统的运行;5g模组:搭载至少两个5g模块,与主控模块进行通信,通过多路径传输控制协议,聚合两条5g链路,实现5g多路径数据的传输;数据交互模块:与外部设备构成局域网,并与主控模块进行通信,实现数据的采集;人机交互模块:与主控模块进行通信,实现系统的控制和交流。本发明实现了mptcp和5g技术的融合,成功将不同运营商的5g通信链路聚合,解决了现有5g网络目前覆盖性能较差、上行速率受限以及基站分布不均匀,导致不能满足日益增长的高速通信和基于物联网的应用需求问题。

2、申请公开号为cn115551093a的专利公开了一种5g基站的低时延数据传输方法,包括步骤:s1、将5g基站与用户终端建立连;s2、在5g基站侧配置与用户终端对应的多个实体;s3、配置允许的最大传输时延参数t;s4、根据最大传输时延参数t进行数据传输。本发明通过设置最大时延参数来控制数据传输的时间,如果发现超时,则立即删除该超时数据,并统计超时传输的次数,重新配置资源调度的优先等级,这样,可以有效减少空口资源的浪费,提高数据传输的时效性,进一步降低时延。

3、目前,随着5g网络的快速建设,大量新业务和应用涌现,这给网络的稳定运维带来了前所未有的挑战,现有的网络切换机制存在明显的缺陷,主要体现为:在移动性预测上,仍停留在传统的静态分析,无法实现设备个体精确建模,预测结果存在大量偏差,在业务感知上,现网络对新业务理解不够,无法根据业务场景实时调整手段,另外,各类网络调度措施之间缺乏协同,无法做到统筹兼顾,难以实现用户体验和网络收益的双赢;例如,在高铁场景中,因线路骤变,若无法准确预测旅客移动轨迹,将导致频繁错切、信令大量耗费的严重问题,再如针对新兴的ar/vr超高清视频业务,若网络无法感知识别业务形式,仍将其作为普通数据流对待,继而导致抖动大、延时长的失败体验,此外,在城市商圈区域,各类网络主体(运营商/第三方服务商等)可能针对自己侧采取本地优化,这将造成区域网络整体效率大幅下降的局面这些问题的存在,严重制约了运营商提升5g网络运维水平的能力,也无法满足用户日益增长的网络体验需求。

4、鉴于此,本发明提出一种基于5g的手机数据传输方法和系统以解决上述问题。


技术实现思路

1、为了克服现有技术的上述缺陷,为实现上述目的,本发明提供如下技术方案:一种基于5g的手机数据传输方法,包括:

2、s1、采集设备业务参数、设备数据和基站数据;

3、s2、根据设备业务参数计算收益值,根据设备数据和收益值构建设备加权函数;根据基站数据构建基站加权函数;根据设备加权函数和基站加权函数构建移动设备与n个5g基站之间的博弈资源对抗模型;

4、s3、利用强化学习中的q学习方法对博弈资源对抗模型迭代计算求解;得到值矩阵;

5、s4、采集历史移动设备数据;根据历史移动设备数据建立用于预测联合状态的深度序列学习模型,根据预测的联合状态构建移动设备时间序列状态;

6、s5、联立值矩阵和移动设备时间序列状态,构建时序值矩阵;将时序值矩阵采用深度强化学习方法获取最优切换决策序列,根据所述最优切换决策序列分时段发起移动设备的切换请求。

7、进一步地,所述设备业务参数包括数据业务平均吞吐量、单位数据吞吐量收入、语音业务平均持续时间、单位时间语音收入、视频业务平均码率和单位视频码率收入;

8、所述设备数据包括平均时延和移动性开销;所述基站数据包括基站负载提升值和平均传输功率;

9、所述收益值的计算方式包括:

10、收益值;

11、其中,为数据业务平均吞吐量;为单位数据吞吐量收入;为语音业务平均持续时间;为单位时间语音收入;为视频业务平均码率;为单位视频码率收入;

12、所述平均时延是一个预定义的业务质量统计参数,由网络侧的质量监控系统实时统计汇总,直接调用;

13、测算移动设备切换前后的位置变化,即为移动性开销;

14、获取移动设备在切换前后的位置坐标;通过移动设备自身的gps或定位模块获取切换前后的位置坐标,并上报网络侧;网络侧收到位置坐标后,按照坐标系的计算方法获得两位置之间的距离ds;查询移动设备的类型参数,获取其平均移动速度v;移动时间开销=距离ds/平均速度v;移动时间开销即为移动性开销;

15、构建设备加权函数;

16、其中,、和为设备权重参数;

17、所述博弈资源对抗模型的构建方式包括:

18、获取参与博弈决策的每个移动设备,确定移动设备的唯一标识id;获取每个移动设备当前所运行的业务类型;将每个移动设备定义设备动作空间,设备动作空间包括移动设备可申请切换的l个相邻基站;

19、获取移动设备周边参与博弈决策的每个基站,确定基站的唯一标识id;获取每个基站的网络频谱资源信息和基站参数;将每个基站定义基站动作空间,基站动作空间包括接受切换请求和拒绝切换请求;

20、移动设备接入后,计算基站负载提升值;

21、基站负载提升值的计算过程包括:

22、获取基站的当前业务数n和移动设备的业务类型;根据业务类型查询对应类业务的平均占用带宽bw_语音、bw_数据和bw_视频;

23、计算基站当前总占用带宽bw_总=n×bw_语音 n×bw_数据 n×bw_视频;

24、移动设备接入后,总业务数变为n 1,则总占用带宽为bw_新总=(n 1)×bw_语音 (n 1)×bw_数据 (n 1)×bw_视频;带宽提升量bw_提升=bw_新总-bw_总;

25、带宽提升量与基站总带宽计算负载提升=bw_提升/基站总带宽;

26、查表获取移动设备的平均传输功率;

27、构建基站加权函数;

28、其中,和为基站权重参数;

29、结合设备加权函数和基站加权函数获取博弈资源对抗模型;

30、博弈资源对抗模型。

31、进一步地,所述q值矩阵的获取过程包括:

32、s301、定义博弈资源对抗模型中的状态空间和动作空间;其中,状态空间表示场景数量;动作空间表示每种状态下可供移动设备或基站选择执行的不同行为数量;初始化一个存储状态-动作值函数的矩阵,其中矩阵的大小为,矩阵的行表示状态,列表示动作;矩阵中的每个元素表示在状态下选择执行动作对应的价值,初始化全部矩阵元素为0;

33、s302、设定迭代终止条件,迭代终止条件为最大迭代数m或矩阵元素值变化小于设置阈值p;设定q学习算法的参数,参数包括学习率,折扣因子,在ε贪婪策略中探索概率ε;

34、s303、基于ε贪婪策略以固定概率ε选择当前值最大的动作,同时以1-ε概率随机选择一个动作;执行所选择的动作后,环境状态从转移到,并产生一个即时收益;收集执行动作后环境的反馈,反馈包括新的状态和即时收益;

35、s304、更新;

36、更新公式为;

37、式中,为环境状态;为在状态下可选择执行的动作;为即时收益;为执行完动作后的新的环境状态;为学习率;为折扣因子;为下一状态下所有可能的动作对应的值最大值;为更新符号;

38、s305、判断是否满足终止条件,若不满足则继续更新;若满足则得到状态空间下的值矩阵。

39、进一步地,所述历史移动设备数据包括历史定位轨迹数据和历史业务数据;

40、历史定位轨迹数据包括设备经纬度坐标及其对应的设备定位时间戳;

41、历史业务数据包括业务类型、业务流量和网络连接数及其对应的时间戳;

42、联合状态为未来f天的定位轨迹数据和业务数据;

43、深度序列学习模型为联立定位预测模型和参数预测模型获取;

44、定位预测模型获取方式包括:

45、将历史定位轨迹数据作为测试数据集,并进行曲线拟合;

46、曲线拟合过程包括:

47、用线性多项式拟合曲线、二次多项式拟合曲线和三次多项式分别进行拟合曲线;线性多项式拟合曲线为;二次多项式拟合曲线;三次多项式拟合曲线;式中,为设备定位时间戳;为设备经纬度坐标;、、和为待求的参数,均通过曲线拟合得出;

48、计算线性多项式、二次多项式和三次多项式拟合曲线的预测点位误差;预测点位误差;

49、其中,实际值为测试数据集中的真实值;预测值为拟合曲线计算的预测值;为测试数据集大小;

50、选取多项式拟合曲线、二次多项式拟合曲线和三次多项式拟合曲线中预测点位误差最小的拟合曲线,即最佳拟合的曲线;最佳拟合的曲线即为定位预测模型。

51、进一步地,参数预测模型为arima时间序列预测模型,其获取方式包括:

52、采集最近r天内的历史业务数据作为历史样本,历史样本中包括4个字段;4个字段分别为时间戳、业务类型、业务流量和网络连接数;将历史样本按照时间顺序构建输入样本矩阵,每一行代表一个采样点位;

53、将输入样本矩阵的数据进行预处理;将24小时的全天数据依照分时段划分为g个时段区间,统计计算每个时段区间内各类业务数据所占比重,得到不同业务类别在各个时间段内的分布统计量;用于相应调整预测结果;

54、将网络连接数的时间序列数据建立arima自回归滑动平均模型;进行平稳性检验,对不满足稳定条件的序列进行差分处理,直至达到稳定条件;

55、确定时间序列的ar和ma阶数,配置arima(p,d,q)模型的参数;

56、利用配置好的参数将arima自回归滑动平均模型训练和优化,输入训练数据为预处理的输入样本矩阵,训练目标为预测未来f天内每小时的网络连接数;获得未来f天内网络连接数的时间序列;训练完成的arima自回归滑动平均模型即为参数预测模型。

57、进一步地,所述联立定位预测模型和参数预测模型获取深度序列学习模型的方式包括:

58、将过去r天的历史定位轨迹数据和历史业务数据作为历史训练集;将预测得到的未来f天内设备经纬度坐标及其对应的定位时间戳、业务类型、业务流量和网络连接数及其对应的时间戳;利用时间戳进行时间对齐,并作为未来数据集;

59、构建卷积神经网络lstm模型;输入层为历史训练集和未来数据集拼接而成的三维矩阵;

60、卷积神经网络lstm模型包括卷积层、池化层、lstm层和全连接层;编译卷积神经网络lstm模型,配置优化器和损失函数;

61、优化器选用adam算法;adam算法基于优化随机梯度下降,自适应地对学习率进行调整;

62、损失函数选用均方误差;

63、其中,为样本数量;为模型预测得到的第个样本输出;为第个样本真实的标签输出;

64、函数计算预测值和真实值之间的均方差,惩罚得到的损失数值越小模型效果越好;以历史训练集为卷积神经网络lstm模型输入,训练目标是预测出未来数据集;

65、将历史训练集按照批大小分批输入卷积神经网络lstm模型,卷积神经网络lstm模型输出一批预测结果;计算这一批预测结果和未来数据集批之间的均方误差函数值;利用反向传播算法,将损失误差沿着模型计算图反方向回传,更新每层的卷积神经网络lstm模型的参数;

66、当训练达到预定的迭代轮数后,获得最终训练好的深度序列学习模型;使用训练好的深度序列学习模型进行预测;输入给定的过去r天历史数据,深度序列学习模型预测输出未来f天的联合状态。

67、进一步地,所述移动设备时间序列状态的构建方式包括:

68、根据预测的联合状态,提取未来f天内的时间戳、经纬度坐标、业务类型、业务流量和网络连接数;将提取的数据重新组织成v个时间序列,时间序列状态包括时间戳序列、经纬度坐标时间序列、业务类型时间序列、业务流量时间序列和网络连接数时间序列;即构建出移动设备在未来f天内的移动设备时间序列状态;

69、所述时序值矩阵的构建方式包括:

70、从移动设备时间序列状态中,提取所有时刻的状态参数,构成状态空间s,状态参数包括移动设备当前所运行的业务类型、移动设备的位置坐标和运动速度;业务类型包括语音业务、视频业务和数据业务;

71、从值矩阵中,提取移动设备所有可选择的基站切换动作,构成动作空间a;初始化存储状态-动作值的时序矩阵;时序矩阵的行表示不同时刻的设备状态,时序矩阵表示l个相邻基站作为基站切换动作;矩阵元素表示在状态下选择动作的价值,初始化为0。

72、进一步地,所述时序值矩阵采用深度强化学习方法获取最优切换决策序列的过程包括:

73、构建深度强化学习模型为端到端的深度神经网络,输入为设备的状态,输出为当前状态下各个基站切换动作的值;

74、深度强化学习模型内部结构包括卷积层、lstm循环层和全连接层,卷积层负责提取输入状态的时空特征表示,lstm层负责挖掘状态序列的时序关联特征,全连接层完成状态动作值函数的估计;

75、令马尔可夫决策过程(mdp)的五元组中即时奖励为;通过采取时序上的折扣累积方法定义总奖励,公式为:;

76、其中,是数值为0-1的折扣因子;为决策序列终止时刻;表示的是当前的时间点,从该时刻开始计算一个序列中的累积折扣收益;模型的目标是配置参数使得总奖励最大化;

77、深度强化学习模型训练目标是逼近状态-动作值函数,在每一训练步,输入一个采样状态,模型预测输出当前状态下各个基站切换动作对应的值;执行动作后环境给出反馈的实际即时奖励;计算预测值和实际奖励的误差,通过损失函数反向传播更新模型参数;

78、在训练完成深度强化学习模型后,输入需要决策的时序状态,模型输出该状态下,不同基站切换动作对应的值,根据值最大选择基站,推演形成整个序列,计算序列总奖励,输出总奖励最大的最终序列,作为最优切换决策。

79、进一步地,所述根据所述最优切换决策序列分时段发起移动设备的切换请求的过程包括:

80、s501、最优切换决策序列按照时间顺序给出了从时刻t1到tn,移动设备在每个时间点需要切换到的目标基站;网络侧得到最优切换序列后,转换为信令交互过程;

81、s502、在时刻t1,网络侧向移动设备发送切换命令,通知设备切换到对应目标基站;移动设备收到切换命令后,向网络发送切换准备就绪信令;网络侧向源基站发送资源释放信令,向目标基站发送资源准备信令;

82、s503、源基站响应,释放移动设备占用资源;目标基站响应,预留资源;网络侧向移动设备发送确认信令,授权其执行切换资源重配置流程;移动设备与目标基站进行随机接入,完成切换;

83、s504、按照时间顺序,每到最优切换序列给出的时刻,重复执行s501-s503,完成切换,到时刻tn全部切换完成。

84、一种基于5g的手机数据传输系统,其基于所述的一种基于5g的手机数据传输方法实现,包括:收集接收模块,用于采集设备业务参数、设备数据和基站数据;

85、对抗模型构造模块,用于根据设备业务参数计算收益值,根据设备数据和收益值构建设备加权函数;根据基站数据构建基站加权函数;根据设备加权函数和基站加权函数构建移动设备与n个5g基站之间的博弈资源对抗模型;

86、求解模块,用于利用强化学习中的q学习方法对博弈资源对抗模型迭代计算求解;得到值矩阵;

87、状态构建模块,用于采集历史移动设备数据;根据历史移动设备数据建立用于预测联合状态的深度序列学习模型,根据预测的联合状态构建移动设备时间序列状态;

88、决策实施模块,用于联立值矩阵和移动设备时间序列状态,构建时序值矩阵;将时序值矩阵采用深度强化学习方法获取最优切换决策序列,根据所述最优切换决策序列分时段发起移动设备的切换请求。

89、本发明一种基于5g的手机数据传输方法和系统的技术效果和优点:

90、实现了智能感知和业务关联的移动网络切换新机制;通过构建序列学习模型,实现移动设备个体级别的高精度移动性预测,准确得到用户未来的服务需求和网络连接趋势,大幅减少预测偏差;通过建立移动设备与网络资源之间的关联认知模型,进行面向业务场景的切换控制,按照业务优先级进行基站动态切换,极大提升用户感知体验;本实施例利用强化学习算法,在保证单个用户效果提升的同时,实现了整个网络全局收益的最大化,获得考虑各方博弈的最优网络切换均衡解;融合个体建模、业务感知和全局优化为一体实现了稳定的5g网络运维。

当前第1页1  
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
网站地图