本技术涉及数据处理,具体而言,本技术涉及一种针对游戏实体的处理方法、装置、电子设备及存储介质。
背景技术:
1、在游戏领域进行游戏实体对齐对构建游戏知识图谱有着十分重要的影响,实体对齐旨在判断两个或多个不同信息来源的实体是否指向真实世界中的同一个对象,若多个实体指向同一个对象,则需在这些实体之间构建对齐关系,对于彼此之间可以建立对齐关系的实体,还可对实体包含的信息进行融合和聚集,从而形成全面、准确、完整的对象描述。
2、现有方案进行实体对齐时,主要依据游戏实体的游戏文本这种单模态数据进行实体对齐,游戏文本包括游戏名称和游戏详情信息(例如游戏玩法),然而由于不同游戏实体在不同数据源中的数据格式不同,因此难以进行游戏实体对齐,且仅通过游戏文本来进行游戏实体容易导致得到的实体对齐关系准率低、召回率低。
技术实现思路
1、本技术实施例提供了一种针对游戏实体的处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,用于解决背景技术中的技术问题。
2、根据本技术实施例的第一方面,提供了一种针对游戏实体的处理方法,该方法包括:
3、获得各待处理的第一游戏实体的游戏属性,所述游戏属性包括游戏图标和游戏文本;
4、对于每个第一游戏实体,根据第一游戏实体的游戏属性获得第一游戏实体的游戏特征,游戏特征包括与游戏图标对应的第一特征向量和与游戏文本对应的第二特征向量;
5、对各第一游戏实体中两两第一游戏实体的游戏特征进行实体对齐,获得具有实体对齐关系的第一游戏实体,将具有实体对齐关系的第一游戏实体确定为同一款游戏的游戏实体。
6、在一个可能的实现方式中,根据第一游戏实体的游戏属性获得第一游戏实体的游戏特征,包括:
7、将第一游戏实体的游戏图标输入至预先训练的图像特征提取模型,获得图像特征提取模型确定的第一特征向量;
8、将第一游戏实体的游戏文本输入至预先训练的文本特征提取模型,获得文本特征提取模型确定的第二特征向量;
9、其中,图像模型是以至少一对样本游戏实体的游戏图标为样本,以每对样本游戏实体是否具有图像特征对齐关系为样本标签训练而成;
10、文本模型是以具有文本特征对齐关系的至少两个样本游戏实体的游戏文本为正样本,以不具有文本特征对齐关系的至少两个样本游戏实体的游戏文本为负样本训练而成。
11、在一个可能的实现方式中,将具有实体对齐关系的游戏实体确定为同一款游戏的游戏实体,之后还包括:
12、对于每款游戏,根据游戏的各个游戏实体的游戏属性,确定游戏的游戏属性;
13、其中,游戏的游戏图标为游戏的其中一个游戏实体的游戏图标;游戏的游戏文本是以游戏的所有游戏实体的游戏文本进行文本融合获得的。
14、在一个可能的实现方式中,对于每款游戏,根据该款游戏的各个第一游戏实体的游戏属性,确定该款游戏的游戏属性,之后还包括:
15、获得待处理的第二游戏实体,根据第二游戏实体的游戏属性获得第二游戏实体的游戏特征;
16、根据每款游戏的游戏属性,获得每款游戏的游戏特征;
17、对第二游戏实体的游戏特征和每款游戏的游戏特征进行实体对齐,若确定所有游戏中存在与第二游戏实体具有实体对齐关系的一款目标游戏,则将第二游戏实体作为该款目标游戏的游戏实体。
18、在一个可能的实现方式中,根据第二游戏实体的游戏特征和每款游戏的游戏特征进行实体对齐,之后还包括:
19、若确定所有游戏中不存在与第二游戏实体具有实体对齐关系的目标游戏,则确定第二游戏实体为一款新游戏,将第二游戏实体作为新游戏的游戏实体。
20、在一个可能的实现方式中,对各个第一游戏实体中两两第一游戏实体的游戏特征进行实体对齐,获得具有实体对齐关系的第一游戏实体,包括:
21、根据各第一游戏实体的第一特征向量对各第一游戏实体进行聚类,得到至少一个第一聚类簇以及每个第一聚类簇的簇中心;根据各第一游戏实体的第二特征向量对各第一游戏实体进行聚类,得到至少一个第二聚类簇以及每个第二聚类簇的簇中心;
22、对于每个第一游戏实体,根据第一游戏实体和每个第一聚类簇的簇中心之间的第一距离,从至少一个第一聚类簇中确定至少一个第一候选聚类簇,根据第一游戏实体和每个第二聚类簇的簇中心之间的第二距离,从至少一个第二聚类簇中确定至少一个第二候选聚类簇;
23、将第一游戏实体的图像特征和第一候选聚类簇中的每个游戏实体的图像特征进行对齐,得到第一候选聚类簇中与第一游戏实体具有图像特征对齐关系的游戏实体;将第一游戏实体的文本特征和第二候选聚类簇中的每个游戏实体的文本特征进行对齐,得到第二候选聚类簇中与第一游戏实体具有文本特征对齐关系的游戏实体;
24、对于每个第一游戏实体,从与第一游戏实体存在图像特征对齐关系的游戏实体和与第一游戏实体存在文本对齐关系的游戏实体中确定与第一游戏实体存在实体对齐关系的游戏实体。
25、在一个可能的实现方式中,将第一游戏实体的图像特征和第一候选聚类簇中的每个游戏实体的图像特征进行对齐,得到第一候选聚类簇中与第一游戏实体具有图像特征对齐关系的游戏实体,包括:
26、确定第一游戏实体的第一特征向量与第一候选聚类簇中每个游戏实体的第一特征向量之间的第一相似度,将第一候选聚类簇中第一相似度大于第一预设相似度的游戏实体作为与第一游戏实体具有图像特征对齐关系的游戏实体;
27、将第一游戏实体的文本特征和第二候选聚类簇中的每个游戏实体的文本特征进行对齐,得到第二候选聚类簇中与第一游戏实体具有文本特征对齐关系的游戏实体,包括:
28、确定第一游戏实体的第二特征向量与第二候选聚类簇中每个游戏实体的第二特征向量之间的第二相似度,将第二候选聚类簇中第二相似度大于第二预设相似度的游戏实体作为与第一游戏实体具有文本特征对齐关系的游戏实体。
29、在一个可能的实现方式中,游戏属性还包括游戏开发商;
30、从与第一游戏实体存在图像特征对齐关系的游戏实体和与第一游戏实体存在文本对齐关系的游戏实体中确定与第一游戏实体存在实体对齐关系的游戏实体,包括:
31、确定与第一游戏实体存在图像特征对齐关系的游戏实体和与第一游戏实体存在文本对齐关系的游戏实体中相同的游戏实体,作为参考游戏实体;
32、对于参考游戏实体,若确定参考游戏实体的游戏开发商和第一游戏实体的游戏开发商相同,则确定参考游戏实体为与第一游戏实体存在实体对齐关系的游戏实体。
33、在一个可能的实现方式中,游戏属性还包括实体标识;
34、将具有实体对齐关系的游戏实体确定为同一款游戏的游戏实体,之后还包括:
35、对于每款游戏,确定游戏对应的各游戏实体在当前时段的优先级;
36、获取当前时段优先级最高的游戏实体的实体标识;
37、根据当前时段优先级最高的游戏实体的实体标识生成游戏在当前时段的唯一标识。
38、根据本技术实施例的第二方面,提供了一种针对游戏实体的处理装置,该装置包括:
39、获取模块,用于获得各待处理的第一游戏实体的游戏属性,游戏属性包括游戏图标和游戏文本;
40、游戏特征获得模块,用于对于每个第一游戏实体,根据第一游戏实体的游戏属性获得第一游戏实体的游戏特征,游戏特征包括与游戏图标对应的第一特征向量和与游戏文本对应的第二特征向量;
41、对齐模块,用于对各第一游戏实体中两两第一游戏实体的游戏特征进行实体对齐,获得具有实体对齐关系的第一游戏实体,将具有实体对齐关系的第一游戏实体确定为同一款游戏的游戏实体。
42、在一个可能的实现方式中,获取模块包括:
43、第一特征向量获取子模块,用于将第一游戏实体的游戏图标输入至预先训练的图像特征提取模型,获得图像特征提取模型确定的第一特征向量;
44、第二特征向量获取子模块,用于将第一游戏实体的游戏文本输入至预先训练的文本特征提取模型,获得文本特征提取模型确定的第二特征向量;
45、其中,图像模型是以至少一对样本游戏实体的游戏图标为样本,以每对样本游戏实体是否具有图像特征对齐关系为样本标签训练而成;
46、文本模型是以具有文本特征对齐关系的至少两个样本游戏实体的游戏文本为正样本,以不具有文本特征对齐关系的至少两个样本游戏实体的游戏文本为负样本训练而成。
47、在一个可能的实现方式中,该装置还包括:
48、游戏属性确定模块,用于对于每款游戏,根据游戏的各个游戏实体的游戏属性,确定游戏的游戏属性;
49、其中,游戏的游戏图标为游戏的其中一个游戏实体的游戏图标;游戏的游戏文本是以游戏的所有游戏实体的游戏文本进行文本融合获得的。
50、在一个可能的实现方式中,游戏特征获得模块还用于获得待处理的第二游戏实体,根据第二游戏实体的游戏属性获得第二游戏实体的游戏特征;根据每款游戏的游戏属性,获得每款游戏的游戏特征;
51、对齐模块还用于对第二游戏实体的游戏特征和每款游戏的游戏特征进行实体对齐,若确定所有游戏中存在与第二游戏实体具有实体对齐关系的一款目标游戏,则将第二游戏实体作为该款目标游戏的游戏实体。
52、在一个可能的实现方式中,对齐模块还用于若确定所有游戏中不存在与第二游戏实体具有实体对齐关系的目标游戏,则确定第二游戏实体为一款新游戏,将第二游戏实体作为新游戏的游戏实体。
53、在一个可能的实现方式中,对齐模块包括:
54、聚类子模块,用于根据各第一游戏实体的第一特征向量对各第一游戏实体进行聚类,得到至少一个第一聚类簇以及每个第一聚类簇的簇中心;根据各第一游戏实体的第二特征向量对各第一游戏实体进行聚类,得到至少一个第二聚类簇以及每个第二聚类簇的簇中心;
55、候选聚类簇确定子模块,用于对于每个第一游戏实体,根据第一游戏实体和每个第一聚类簇的簇中心之间的第一距离,从至少一个第一聚类簇中确定至少一个第一候选聚类簇,根据第一游戏实体和每个第二聚类簇的簇中心之间的第二距离,从至少一个第二聚类簇中确定至少一个第二候选聚类簇;
56、特征对齐子模块,用于将第一游戏实体的图像特征和第一候选聚类簇中的每个游戏实体的图像特征进行对齐,得到第一候选聚类簇中与第一游戏实体具有图像特征对齐关系的游戏实体;将第一游戏实体的文本特征和第二候选聚类簇中的每个游戏实体的文本特征进行对齐,得到第二候选聚类簇中与第一游戏实体具有文本特征对齐关系的游戏实体;
57、实体对齐子模块,用于对于每个第一游戏实体,从与第一游戏实体存在图像特征对齐关系的游戏实体和与第一游戏实体存在文本对齐关系的游戏实体中确定与第一游戏实体存在实体对齐关系的游戏实体。
58、在一个可能的实现方式中,特征对齐子模块包括:
59、第一相似度确定单元,用于确定第一游戏实体的第一特征向量与第一候选聚类簇中每个游戏实体的第一特征向量之间的第一相似度,将第一候选聚类簇中第一相似度大于第一预设相似度的游戏实体作为与第一游戏实体具有图像特征对齐关系的游戏实体;
60、第二相似度确定单元,用于确定第一游戏实体的第二特征向量与第二候选聚类簇中每个游戏实体的第二特征向量之间的第二相似度,将第二候选聚类簇中第二相似度大于第二预设相似度的游戏实体作为与第一游戏实体具有文本特征对齐关系的游戏实体。
61、在一个可能的实现方式中,游戏属性还包括游戏开发商;
62、实体对齐子模块包括:
63、参考游戏实体确定单元,用于确定与第一游戏实体存在图像特征对齐关系的游戏实体和与第一游戏实体存在文本对齐关系的游戏实体中相同的游戏实体,作为参考游戏实体;
64、实体对齐子单元,用于对于参考游戏实体,若确定参考游戏实体的游戏开发商和第一游戏实体的游戏开发商相同,则确定参考游戏实体为与第一游戏实体存在实体对齐关系的游戏实体。
65、在一个可能的实现方式中,游戏属性还包括实体标识;
66、该装置还包括:
67、优先级确定模块,用于对于每款游戏,确定游戏对应的各游戏实体在当前时段的优先级;
68、实体标识获取模块,用于获取当前时段优先级最高的游戏实体的实体标识;
69、唯一标识生成模块,用于根据当前时段优先级最高的游戏实体的实体标识生成游戏在当前时段的唯一标识。
70、根据本技术实施例的第三方面,提供了一种电子设备,该电子设备包括存储器、处理器及存储在存储器上的计算机程序,处理器执行程序时实现如第一方面所提供的方法的步骤。
71、根据本技术实施例的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
72、根据本技术实施例的第五方面,提供了一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中,当计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行实现如第一方面所提供的方法的步骤。
73、本技术实施例提供的技术方案带来的有益效果是:本技术实施例生成每个第一游戏实体的游戏图标对应的第一特征向量和游戏文本对应的第二特征向量,使得在进行实体对齐时,能够降低由于数据格式不同对进行游戏实体对齐产生的影响,且根据所有第一游戏实体中两两游戏实体的游戏图标对应的第一特征向量和游戏文本对应的第二特征向量进行两两游戏实体对齐,能够获得准确、全面的实体对齐关系。