在给定输入症状的情况下找到最相关症状的架构设计
Posted
技术标签:
【中文标题】在给定输入症状的情况下找到最相关症状的架构设计【英文标题】:Architecture design to find the most relevant symptoms given an input symptom 【发布时间】:2020-10-24 08:37:10 【问题描述】:我的目标是建立一个症状推荐系统
我的 excel 中有 3 列数据。
-
患者编号
症状
疾病检测
对于每个患者 ID,都有一种或多种症状导致疾病检测。我的目标是在给定输入症状的情况下找到最相关的症状。
鉴于数据限制,我想不出办法来制定计划。我的一个想法是将数据转换为一个矩阵,其中所有症状为列,疾病为行。对于每种疾病,如果有症状标记 1,否则为所有其他症状输入 0。这种方法会奏效吗?关于如何设计这个系统的任何想法
【问题讨论】:
【参考方案1】:您可以使用 scikit learn 库构建预测模型,其中分类器由症状和疾病标签组成。然后,您可以分析哪些症状对疾病的影响最大。
【讨论】:
为此,我将我的症状数据转换为矩阵形式对吗? scikit-learn 适用于 numpy 数组或 pandas 数据帧,因此您需要以该格式处理数据。 我必须根据症状对疾病的影响将症状转换为 1 或 0,对吗?只有 2 列文本数据,我永远无法构建模型,对吧? 是的,scikit learn 仅适用于数字,因此您需要将数据转换为此。尽管 scikit 可以为您做到这一点。我想有超过 2 种症状,所以用 0 和 1 编码会错过很多这些症状。两列是什么?症状列表? 没有,有 3 列。患者 ID、症状、疾病检测。如果一种疾病也有 5 个症状,我可以通过将整个症状列数据转换为矩阵的列,为每个症状输入 1,为数据集的其余症状输入 0,对吗?以上是关于在给定输入症状的情况下找到最相关症状的架构设计的主要内容,如果未能解决你的问题,请参考以下文章