本发明公开了一种基于聚类与分类相结合的疾病危险因素提取方法。该方法包括以下步骤:根据用户调查问卷,构建用户信息矩阵与标签向量;将用户信息矩阵进行属性分割,获得若干个用户信息矩阵子集与原始用户信息矩阵;对每个用户矩阵进行标准化处理;对标准化用户矩阵进行降维处理,获得降维矩阵;对降维矩阵进行聚类,获得不同类别的聚类人群;对每一类聚类人群构造一棵决策树,并采用集成的思想对所有决策树进行统计,之后依据层次系数大小获得疾病危险因素。相较于目前医学领域中危险因素提取方法中的回归统计方法,本发明通过结合聚类与分类两种方法,不仅能充分利用原始数据,同时降低了由单独一棵决策树得出结论的错误率。
本发明公开了一种基于聚类与分类相结合的疾病危险因素提取方法。该方法包括以下步骤:根据用户调查问卷,构建用户信息矩阵与标签向量;将用户信息矩阵进行属性分割,获得若干个用户信息矩阵子集与原始用户信息矩阵;对每个用户矩阵进行标准化处理;对标准化用户矩阵进行降维处理,获得降维矩阵;对降维矩阵进行聚类,获得不同类别的聚类人群;对每一类聚类人群构造一棵决策树,并采用集成的思想对所有决策树进行统计,之后依据层次系数大小获得疾病危险因素。相较于目前医学领域中危险因素提取方法中的回归统计方法,本发明通过结合聚类与分类两种方法,不仅能充分利用原始数据,同时降低了由单独一棵决策树得出结论的错误率。
商品类型 | 专利 | 申请号 | CN201910484068.4 | IPC分类号 |
IPC(8): G16H10/20G16H50/70
IPC(8): G16H10/20G16H50/70 |
专利类型 | 发明 | 法律状态 | 审中 | 技术领域 | |
交易方式 | 技术转让 | 专利状态 | 申请中 | 专利权人 | |