一种基于人群属性-膳食知识图谱的动态化膳食推荐方法

文档序号:32946838发布日期:2023-01-14 11:22阅读:193来源:国知局
一种基于人群属性-膳食知识图谱的动态化膳食推荐方法

1.本发明涉及融合知识图谱的个性化,动态化,可实施性高的推荐与干预技术,尤其是与老龄人群有关的健康生活及其慢性病管理的营养干预与膳食推荐技术。


背景技术:

2.世界卫生组织出具的《关于老龄化与健康的全球报告》一文中指出老年人所面临的慢性疾病大多数都可以通过采取健康生活的方式进行预防或延缓发生。如在老年人群中高发的高血压、冠心病、糖尿病、脑卒中等疾病均可通过改善膳食结构、进行营养干预,达到预防或抑制发病的目的,甚至在一些轻症患者中,营养治疗与药物治疗可以达到同等的治疗效果。不仅如此,对慢性病患者进行营养干预还可以降低医疗成本。基于现有的搜索引擎技术,可以获得一定的膳食指导数据:如高血压患者应低盐,限制高脂肪、高热量食物的摄入,冠心病患者应少糖多酸,可保护血管,而糖尿病患者应多进食高纤维素食物。但上述数据只针对一类特定人群,且仅给出了改善膳食的方向性意见,并没有考虑不同老龄人的个性化需求,给出具体化的食谱推荐。因此如何有针对性,具体化的进行膳食推荐并进行膳食监测与反馈是保证老龄人群健康的关键所在。
3.由于老龄人的个性化特征,自身对于营养知识的匮乏及医生数目的稀少和专业水平的良莠不齐等原因,使得无法对所有老龄人做到全过程的健康干预、膳食监测与指导。因此亟待一种针对老龄人个性化生成全过程膳食监测与指导方案的技术。对此很多人通过膳食自动化推荐的方式根据显示情况改善人们的膳食结构,如cn 114203281 a膳食的推荐方法以及膳食的推荐装置等。但是现有的推荐方法存在如下问题:
4.1.现有的膳食推荐技术无法随病史发展,身体变化而动态改变。不同的老龄人身体与心理状况都不同,膳食情况不可一概而论。而现如今的膳食推荐方法大部分只可对一类种群的老龄人做出粗略的推荐,即使有针对个体的膳食推荐技术,也无法根据个体的身体状况变化,病史发展,当前的生活状况进行动态化的膳食推荐。
5.2.现有的膳食推荐技术可实施性低。现有的膳食推荐并未考虑营养与口味的均衡,只是一味的追求营养上达到标准。这种不考虑个人口味喜好的推荐导致受众无法长期坚持营养食谱。即使少部分食谱考虑到了口味信息,也无法监测使用者口味信息的改变从而动态改变食谱推荐。同时现有的食谱推荐技术几乎不会考虑受众者的经济水平、购菜的便捷性、食谱实施难度等重要约束,上述多种因素导致现有的食谱推荐技术可实施性低。
6.3.现有的膳食推荐技术不具有灵活调节与反馈的能力,缺乏膳食监测环节。现有的膳食干预技术只是机械性的推荐应吃哪类食物,并未构建食谱的反馈环节,从而无法收集使用者对食谱的满意度,口味信息的改变,当前的经济状况和生活环境等重要信息。当发生老龄人的膳食结构改变,身体突发疾病,生活环境变化等突发情况后,食谱推荐并未随之动态改变,以满足新的营养需求。


技术实现要素:

7.为解决上述问题,本发明公开了一种基于人群属性-膳食知识图谱的动态化膳食推荐方法及系统,本发明充分借助知识图谱在知识存储、知识组织和知识表达等方面的强大能力,以人群属性-膳食知识图谱为知识库,构建了个性化、动态化、可实施性高的膳食推荐方案,为老龄人群进行营养干预提供支持,极大的提高了医疗效率,降低了医疗成本,解决了基层医院因医生不足带来的健康生活干预模式难以推进的问题。
8.为实现上述目的,本发明采用的技术方案为:
9.一种基于人群属性-膳食知识图谱的动态化膳食推荐方法,包括信息采集单元、人群属性知识图谱构建单元、膳食知识图谱构建单元、知识图谱合并单元和两阶段食谱推荐单元;
10.所述信息采集单元用于采集使用者的信息;使用者的信息包括个人基本信息、体检信息、病史信息、个人偏好的食物与口味信息;
11.所述人群属性知识图谱构建单元用于构建使用者的人群属性知识图谱,人群属性知识图谱包括使用者的人体相关属性的计算和分类;
12.膳食知识图谱构建单元用于构建膳食知识图谱,膳食知识图谱用于确定食谱的类型和各类型之间的关系;
13.所述知识图谱合并单元用于将膳食知识图谱与使用者的群属性知识图谱合并,得到人群属性-膳食知识图谱;
14.两阶段食谱推荐单元用于对使用者进行食谱推荐;首先根据使用者的经济水平,购菜便利性,食谱实施难度三个方面,进行食谱的初步筛选,然后对初步筛选结果得到最终的食谱推荐结果并推荐为使用者。
15.进一步的改进,还包括更新单元;所述更新单元用于实时更新使用者的信息,使用者对推荐的食谱的反馈信息和膳食消费水平,并根据更新的使用者的信息,使用者对推荐的食谱的反馈信息调整膳食推荐。
16.进一步的改进,所述所述个人基本信息,包括身高、体重、年龄、性别、排便、血压、睡眠情况;所述病史信息及使用者的既往病史,既往病史包括糖尿病、脑卒中等;所述个人偏好的食物与口味信息包括使用者喜欢甜、酸、咸、苦、鲜、清淡、酸辣的口味中的一种,或对每种口味的不同喜欢程度。
17.进一步的改进,所述人体相关属性为体重指数bmi,人群属性知识图谱构建单元利用式1计算体重指数bmi:
[0018][0019]
weight表示使用者的体重,height表示使用者的身高;bmi用于评估患者因超重和肥胖而罹患2型糖尿病和的风险;当使用者超过3天未排便视作便秘;舒张压超过160毫米汞柱,则判定为高血压;使用者对自身睡眠状况做出失眠、易梦、正常三档判断;对于使用者的体检信息和病史信息则利用自然语言处理技术提取出其中的异常值和病情,异常值包括血脂、血压、血糖异常,病情包括既往患有糖尿病、冠心病;然后进行进行知识抽取,将对应信息填入人群属性知识图谱中的用户id、检查指标、疾病、口味、高危人群五个类,各个类间从是否患有某种疾病、是否易得某种疾病、是否具有异常指标、口味的喜好等角度设定四种关
系。
[0020]
进一步的改进,所述膳食知识图谱构建单元,膳食知识图谱的数据中包含本体层和实体层两部分,本体层定义知识图谱中的类和关系、类与类之间的层级关系、每个关系的定义域和值域;实体数据是对应本体层中的具体实例,具体实例从食谱推荐网站爬取而来;
[0021]
本体层包含食谱、功效、疾病、高危人群、营养素、食材、中医体质、口味8个类,以及各个类间从食谱用料、口味、体质关系、食材搭配、食材禁忌、食材功效、适宜人群角度设定的关系。
[0022]
进一步的改进,所述知识图谱合并单元利用膳食知识图谱和人群属性知识图谱相同的实体:疾病,口味,高危人群将使用者的群属性知识图谱和膳食知识图谱合并。
[0023]
进一步的改进,两阶段食谱推荐单元通过如下步骤进行食谱推荐:
[0024]
食谱的初步筛选:利用强约束,进行食谱的初步筛选,强约束包括经济水平,购菜便利性,食谱实施难度;其中经济水平为用户自定义的日饮食消费区间或者一餐消费区间,表示如下:
[0025]mmin
≤m≤m
max
ꢀꢀ
(6)
[0026]
其中m
min
和m
max
分别表示最低消费水平和最高消费水平;
[0027]
使用者指定购买菜品的最远距离,然后有:
[0028]
distance
real
≤distance
max
ꢀꢀ
(7)
[0029]
式中distance
real
和distance
max
分别表示实际购菜距离和期望最大购菜距离;
[0030]
将食谱实施难度进行分级,并且使用者每次指定所需食谱的最大实施难度以及指定食谱的烹饪;
[0031]
从以上三个方面进行进行约束,以缩小搜索空间;
[0032]
食谱推荐阶段:
[0033]
计算使用者的基础热量需求rni0:
[0034]
rni0=bmr
×
pal
ꢀꢀ
(2)
[0035]
式中bmr表示基础代谢率,pal表示体力活动水平
[0036]
根据人群属性知识谱图中对于人群属性的信息将人群分为三类:健康人群、患病人群、高危人群,利用分类结果对期望热量需求和实际营养素供给热量做出如式3和式4的改变:
[0037]
rni=γ
×
rni0ꢀꢀ
(3)
[0038]
rni
protein+fat+carbo
=μ
protein
×
rni+ρ
fat
×
rni+σ
carbo
×
rni
ꢀꢀ
(4)
[0039]
μ
protein

fat

carbo
=1
ꢀꢀ
(5)
[0040]
其中rni表示实际的热量需求,γ为控制比例,当使用者为健康人群时γ取1,当患者为患病人群或高危人群时,γ为根据医生、营养医师或者来自互联网专家经验所给出的比例值;式4中rni
protein+fat+carbo
表示实际供给热量,μ
protein
、ρ
fat
和σ
carbo
分别为蛋白质、脂肪和碳水化合物的比例范围,则μ
protein
×
rni、ρ
fat
×
rni和σ
carbo
×
rni分别为需要蛋白质、脂肪和碳水化合物提供的能量,当使用者为健康人群时,μ
protein
=10%-15%,ρ
fat
=20%-30%,σ
carbo
=55%-65%;当为高危人群或者患病人群时,为根据医生或者专家经验给出的比例范围;
[0041]
则有以下推荐关系:
[0042]
min:f(x)=rni
protein+fat+carbo-rni
ꢀꢀ
(8)
[0043][0044]
f(x)的值越小表示动态优化模型所取得参数越佳,实际供能与期望供能越接近;式9中为约束条件,第一个约束条件表示实际供能的范围在期望范围的正负百分之十的区间,第二至第四个约束条件表示蛋白质、脂肪、碳水化合物的供能范围、第五个约束条件表示蛋白质、脂肪、碳水化合物的供能应均大于0;对于动态优化模型的求解采用标准差分进化算法,挑选出其中的最优解,即:在满足约束条件下实际供给热量rni
protein+fat+carbo
的最优值及对应μ
protein
,ρ
fat
和σ
carbo
的取值,然后自人群属性-膳食知识图谱最佳食谱进行推荐或前a个食谱进行推荐。
[0045]
进一步的改进,所述食谱推荐网站包括下厨房、美食天下,好豆热门。
[0046]
进一步的改进,所述使用者为高龄老人。
[0047]
本发明优点:
[0048]
1.语义丰富且个性化较高的膳食推荐方案。本发明基于语义丰富的人群属性-膳食知识图谱,充分挖掘食谱、食材、疗效、食材搭配以及使用者本身的人口学信息及健康状况之间的语义关系,从而个性化、精准化的推荐食谱,促进了精准医疗的开展。
[0049]
2.可实施性高的膳食推荐方案。本发明解决了已有膳食推荐方案无法兼顾营养与口味的痛点,考虑鲜有方案关注的经济水平,购菜便利性,菜谱实施难度等重要约束,生成了可实施性高的膳食推荐方案,有助于患有慢性疾病或相关疾病高危人群的老龄人更加便捷,长久,易实施的进行营养管理。
[0050]
3.具有灵活调节、反馈能力、膳食监测的膳食推荐方案。通过信息收集的反馈机制,解决了现有食谱推荐方法无法随使用者身体状况、经济水平,生活环境动态变化,难以监测口味信息改变的弊端,构建了一种具有反馈机制,灵活动态调整、实时监测的食谱推荐方案。
附图说明
[0051]
图1为本发明的总体结构示意图;
[0052]
图2为人群属性知识图谱本体中类-关系结构;
[0053]
图3为部分人群属性三元组上下文示例图;
[0054]
图4为膳食知识图谱本体中,具体的类-关系结构;
[0055]
图5为按照三元组的方式进行存储从而构成了膳食知识图谱的示意图;
[0056]
图6为两种知识图谱进行合并的示意图。
具体实施方式
[0057]
实施例
[0058]
如图1所示,本发明共分为五个部分,分别为:信息采集、人群属性知识图谱构建、
膳食知识图谱构建、知识图谱合并和两阶段食谱推荐模型。
[0059]
信息采集部分采集使用者的四部分信息,分别为个人基本信息,包括身高、体重、年龄、性别等人口学信息和排便、血压、睡眠等医学指标;体检信息:本发明支持自动导入电子体检结果或者通过光学字符识别技术导入纸质体检结果;病史信息:本发明支持导入既往的病史信息,尤其重视慢性病信息的获取,例如糖尿病、脑卒中等;个人偏好的食物与口味:本发明需要使用者选择甜、酸、咸、苦、鲜中的一种,同时支持使用者自动录入例如清淡、酸辣等更加个性化的口味。
[0060]
人体相关属性的准确计算和分类是构建人群属性知识图谱的关键所在。首先对基本信息部分进行处理:利用式1计算体重指数(bmi):
[0061][0062]
式中weight表示使用者的体重,height表示使用者的身高。成年人的bmi应满足如表1所示的关系。
[0063]
表1 bmi和体形关系
[0064][0065][0066]
bmi可评估患者因超重和肥胖而罹患2型糖尿病和其他疾病的风险。健康人的排便次数应为每天或隔天一次,但对于饮食少、运动少的高龄老人2-3天视作正常,对于超过3天未排便视作便秘;高龄老人的舒张压不应超过160毫米汞柱,如果超过这个标准,则判定为高血压;对于睡眠指标,需高龄老人对自身睡眠状况做出失眠、易梦、正常三档判断。对于体检信息和病史信息则利用自然语言处理技术提取出其中的异常值和病情,例如血脂、血压、血糖异常,既往患有糖尿病、冠心病等。完成上述信息计算和提取后,进行知识抽取,人群属性知识图谱中具有用户id、检查指标、疾病、口味、高危人群五个类,各个类间从是否患有某种疾病、是否易得某种疾病、是否具有异常指标、口味的喜好等角度设定四种关系。本发明用人工抽取的方式完成上述过程,用三元组的方式存储抽取到的实体和关系,图2为人群属性知识图谱本体中类-关系结构,图3为部分人群属性三元组上下文示例图。
[0067]
多样的食谱数据和食谱内部多层次的交互关系是构建语义丰富的膳食知识图谱的根基。膳食知识图谱数据中包含本体层和实体层两部分,本体层定义了知识图谱中的类和关系、类与类之间的层级关系、每个关系的定义域和值域。实体数据是对应本体中的具体实例,从下厨房、美食天下,好豆热门等食谱推荐网站爬取而来。进行膳食知识图谱中的实体层的实体和关系数据的预处理时,先根据本体确定实体之间有哪些类型,再遍历该类型下的所有实体、从这些实体出发的所有关系、这些关系关联到的所有实体,从而得到《实体,关系,实体》的三元组,然后将这些三元组保存到文件中。
[0068]
膳食知识图谱本体中具有食谱、功效、疾病、高危人群、营养素、食材、中医体质、口味8个类,各个类间从食谱用料、口味、体质关系、食材搭配、食材禁忌、食材功效、适宜人群等角度设定20个关系。膳食知识图谱本体中,具体的类-关系结构如图4所示。经过上文所述的数据爬取工作后,得到了8类实体的数据和20种关系数据,按照三元组的方式进行存储,从而构成了膳食知识图谱,示例如图5所示。
[0069]
将膳食知识图谱和人群属性知识图谱进行合并,充分挖掘食谱和特定人群、特定个体之间的关系是进行精准和个性化食谱推荐的前提。膳食知识图谱和人群属性知识图谱相同的实体有:疾病,口味,高危人群,利用上述三种实体可以将两种知识图谱进行如图6所示的合并,合并后的人群属性-膳食知识图谱带来了更加丰富的语义信息,可以综合考虑人群属性和菜谱两个方面的知识:如现在可从用户id出发,根据其疾病信息,口味喜好,以及为何种高危人群为使用者推荐基本的食谱。
[0070]
不同的老龄人群营养需求不同,同一老龄人群中身体基础状况不同的老龄个体营养需求也不同,因此进行有针对性、科学性的营养需求计算,构建动态食谱推荐模型是充分保障老龄人营养干预的重要举措。中国营养学会,中国疾病预防控制中心营养与健康所、中山大学等多家单位制定并公布了《中国居民膳食营养素参考摄入量》,为避免用户营养不足或营养过剩,合理的引导居民健康饮食提供了一个重要的参考文件。其中rni(推荐摄入量)定义为:可以满足某一特定性别、年龄及生理状况群体中绝大多数个体需要的营养素摄入水平。本技术将此指标作为个体每日摄入营养素的目标值,热量及三大产热营养素的摄入量还需要根据不同年龄段人群的身高和体重及人群属性等信息进行动态调整。依据李凤林,张忠编著的《食品营养学》
[2]
,老年人所需的热量为:
[0071]
rni=bmr
×
pal#(2)
[0072]
式中bmr表示基础代谢率,pal表示体力活动水平。bmr的取值为如表2中所示取值的95%,表中m表示人体重量,单位为kg。
[0073]
表2老年人bmr取值表
[0074][0075]
老年人pal的估算如表3所示。
[0076]
表3老年人pal值
[0077][0078]
[0079]
人体需要热量才能够维持生命活动,蛋白质、碳水化合物和脂肪是为人体功能的三大营养素。当三大营养素满足均衡的比例时,有利于营养干预的开展。一般认为蛋白质应提供总热量的10%-15%,脂肪提供20%-30%,碳水化合物提供55%-65%,将上述三个比例记为蛋白质、脂肪、碳水化合物供能的初始值。三餐按照3:4:3的比例分配,其中1g蛋白质=1g碳水化合物=4kcal热量,1g脂肪=9kcal热量。根据上述人群属性知识谱图中对于人群属性的知识,可将人群分为三类:健康人群、患病人群、高危人群(易患某种病的高危人群)。利用分类结果对期望热量需求和实际营养素供给热量做出如式3和式4的改变:
[0080]
rni=γ
×
rni0#(3)
[0081]
rni
protein+fat+carbo
=μ
protein
×
rni+ρ
fat
×
rni+σ
carbo
×
rni#(4)
[0082]
μ
protein

fat

carbo
=1#(5)
[0083]
式3中rni表示实际的热量需求,式3中rni0为上文计算的基础热量需求,γ控制比例,当使用者为健康人群时γ取1,当患者为患病人群或高危人群时,γ为根据医生、营养医师或者来自互联网专家经验所给出的比例值。式4中rni
protein+fat+carbo
表示实际供给热量,μ
protein
、ρ
fat
和σ
carbo
分别为蛋白质、脂肪和碳水化合物的比例范围,则μ
protein
×
rni、ρ
fat
×
rni和σ
carbo
×
rni分别为需要蛋白质、脂肪和碳水化合物提供的能量,当为健康人群时,取上文所述的初始值分别为:μ
protein
=10%-15%,ρ
fat
=20%-30%,σ
carbo
=55%-65%;当为高危人群或者患病人群时,为根据医生或者专家经验给出的比例范围,式5中表示三者的比例之和为1。为了求解μ
protein
、ρ
fat
和σ
carbo
的具体值,构建了两阶段的动态优化模型,第一阶段利用强约束,包括经济水平,购菜便利性,食谱实施难度三个方面,进行食谱的初步筛选。其中经济水平为用户自定义的日饮食消费区间或者一餐消费区间,表示如下:
[0084]mmin
≤m≤m
max
#(6)
[0085]
其中m
min
和m
max
分别表示最低消费水平和最高消费水平。购菜便利性涉及到优先级的确定,用户需要确定是距离优先或为菜品优先。距离优先亦可称为菜品可替换推荐,是指在最短的距离范围内购买符合要求的菜品即可,菜品优先亦可称为菜品不可替换推荐,是指使用者指定菜品,菜品不能发生改变的情况下选择最近的购买地。在距离优先的方案下,需要用户指定最远距离,在菜品优先的方案下,需要用户指定期望菜品。其中距离优先可用下式表示
[0086]
distance
real
≤distance
max
#(7)
[0087]
式中distance
real
和distance
max
分别表示实际购菜距离和期望最大购菜距离。食谱实施难度因人而异,老龄人的身体状况不同,应选择不同难度的食谱进行烹饪,从而进行精准化的推荐。食谱实施难度涉及分级制度和烹饪方式,分级制度为一星到五星,其中五星为难度最高的烹饪方案,烹饪方式为炒,煮,蒸,炸等四种,具体推荐时需要使用者进行至少一种选择。上述过程为二阶段的第一阶段初筛过程,完成后缩小了模型的搜索空间的同时,也生成了可实施性高的推荐方法。第二阶段对式8进行优化,约束为式9,从而确定最终的推荐方案:
[0088]
min:f(x)=rni
protein+fat+carbo-rni#(8)
[0089][0090]
式8中为需要最小化的函数,函数中rni
protein+fat+carbo
表示由蛋白质、脂肪和碳水化合物三者的实际供能,rni为个体的期望功能,f(x)的值越小表示动态优化模型所取得参数越佳,实际供能与期望供能越接近。式9中为约束条件,第一个约束条件表示实际供能的范围应在期望范围的正负百分之十的区间
[2]
,第二至第四个约束条件表示蛋白质、脂肪、碳水化合物的供能范围、第五个约束条件表示蛋白质、脂肪、碳水化合物的供能应均大于0。对于动态优化模型的求解采用标准差分进化算法
[3]
:标准差分进化算法是一种采用实数编码的并行搜索算法,其初始迭代中主要包括四个操作步骤:初始化种群、变异、交叉和选择,在初始化种群后,算法循环执行变异、交叉和选择操作,直到达到最大进化代数得到最优解。在每一次循环中对当前种群中的每一个个体执行变异操作,得到变异向量:然后将变异向量与目标向量通过交叉操作得到试验向量:最后将试验向量与目标向量按照“贪婪”选择策略,进行一对一比较,选取适应度值较小的个体进入下一代进化操作。具体到模型中是将μ
protein
×
rni、ρ
fat
×
rni和σ
carbo
×
rni三个算子进行初始化,之后循环进行变异、交叉和选择操作,直到循环结束,挑选出其中的最优解:rni
protein+fat+carbo
即在满足约束条件下实际能量供给的最优值,,μ
protein
,ρ
fat
和σ
carbo
的取值即为蛋白质、脂肪、碳水化合物的最佳比例。最后以动态优化模型的输出为约束,在人群属性-膳食知识图谱中的进行挑选,便可得最佳食谱。
[0091]
根据老龄人的身体状况变化,病史发展以及食谱反馈交互环节进行动态化的食谱推荐与膳食监测,同时解决食谱推荐的时间依赖问题。老龄人的身体状况变化和病史发展主要通过信息导入和亲属反馈进行更新,在信息导入中涉及到例如体检信息更新,病历信息更新等方式,在亲属反馈中支持手动录入描述词汇,例如失眠,感冒等词汇。信息录入后,联合知识库中的功效,疾病进行关联匹配,进行膳食推荐的实时更新。在食谱反馈环节涉及评分制度,收集用户对食谱从0分到5分的评价,关联知识库中关于食谱的口味、食材信息,对使用者的口味变化进行实时监测。同时利用使用者在食谱选择时输入的日膳食消费水平或者一餐膳食消费水平,构建了动态发展的膳食推荐模型,解决了食谱中的时间依赖问题,即推荐模型可随着众多因素的变化而动态推荐食谱。
[0092]
尽管本发明的实施方案已公开如上,但并不仅仅限于说明书和实施方案中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里所示出与描述的图例。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1