从 ICD9 码预测 RxNorm 码的卷积网络有意义吗?

Posted

技术标签:

【中文标题】从 ICD9 码预测 RxNorm 码的卷积网络有意义吗?【英文标题】:Do convolutional networks to predict RxNorm codes from ICD9 codes make sense? 【发布时间】:2017-12-23 15:46:40 【问题描述】:

公司要求我专门使用卷积神经网络来预测根据给出的诊断(ICD9 代码)开出的药物类型(RxNorm 代码)。我会得到一百万个医生开的处方。每个处方都独立于下一个。

所以一个例子是:110, 670, 890, BB2344 前 3 项是 ICD9 码,最后一项是输出,即 RxNorm 码。其中有一百万个。

老实说,这项任务对我来说似乎很荒谬。我对如何构建输入没有任何想法。

诊断没有固有的顺序,也没有时间戳

一种诊断可能使另一种诊断更有可能;但是有很多例子表明它们是独立的。

ICD9 编码系统具有分层结构,因此 110 和 120 的代码(两种感染)都比 110 和 890 的代码更密切相关。(感染和伤口)。

基本上,我的输入“图像”应该是什么样子?或者 CNN 对这个问题根本没有意义?

谢谢!

【问题讨论】:

【参考方案1】:

CNN 需要输入中的空间(或时间)相关性。这里没有这样的东西,所以简短的回答是不,没有意义。一般来说,考虑到数据是多么简单,我实际上希望一些基本的线性模型(在一个热编码数据上)/甚至基本的规则归纳能够很好地工作。

“类 cnn”结构的唯一可能用途是通过图 CNN 来利用图的性质。由于输入中的层次结构可以被认为是“空间”相关性。

【讨论】:

谢谢,我就是这么想的。我只是不确定,因为 ICD9 代码是分层的,所以有一些固有的结构,但这个事实似乎不适用于 CNN。 你可以考虑 Graph CNNs,它基于与“常规”CNNs 类似的想法,并且可以处理图形表示的数据(并且层次结构是一棵树)。

以上是关于从 ICD9 码预测 RxNorm 码的卷积网络有意义吗?的主要内容,如果未能解决你的问题,请参考以下文章

TensorFlow人马图像分类(卷积神经网络)

深度学习基于卷积神经网络的验证码识别

干货基于TensorFlow卷积神经网络的短期股票预测

我们可以制作一个使用多个图像进行预测的卷积网络吗

Paddle Fluid 加速float16卷积神经网络预测

重大进展!Paddle Fluid 加速float16卷积神经网络预测!