使用 python 对图像数据集进行任何癌症诊断的机器学习

Posted

技术标签:

【中文标题】使用 python 对图像数据集进行任何癌症诊断的机器学习【英文标题】:machine learning for any cancer diagnosis on image dataset with python 【发布时间】:2017-09-04 13:54:09 【问题描述】:

块引用

我正在从事这个由大学指定为最终项目的项目。但问题是我没有从互联网上得到任何帮助,所以我想可能在这里问可以解决问题。我读过很多文章,但他们没有代码或指导,我很困惑该怎么做。基本上它是一个带有机器学习的图像处理工作。数据集很容易找到,但问题是python python学习算法和代码

块引用

【问题讨论】:

如果它是你的最终项目并且它是“分配”给你的,你为什么不先把这个问题发给你的主管? 【参考方案1】:

我认为如果这是您的最终项目,您必须自己创建程序,而不是直接从互联网上下载。如果你想要一个好的起点,你可以从谷歌自定义 Tensor Flow 是非常好的。你会想了解它是如何工作的(即机器学习是如何工作的),但作为第一步,网站上有一个很好的数字识别形式的图像处理示例(这也是机器学习的“Hello World”) .

https://www.tensorflow.org/get_started/mnist/beginners

这也很好地介绍了使用神经网络进行机器学习:https://www.youtube.com/watch?v=uXt8qF2Zzfo

关于 Tensor Flow 的注意事项,您可能必须使用 Python 3.5+,因为根据我的经验,在 2.7 上使用它可能会很困难。

【讨论】:

好的,这更清楚了。如果你想使用 svm,scikit 中有一个用于 svm 的模块,如果你想知道如何实现其中的一些代码,请查看这篇文章:link。您还可以在此处找到 scikit 文档:scikit-learn.org/stable/modules/svm.html【参考方案2】:

我的解决方案:-

Lung Image Database Consortium 为肺癌图像提供开放存取数据集。

下载它,然后应用任何机器学习算法来对是否有肿瘤细胞的图像进行分类。

我附上了参考论文的链接。他们应用神经网络对图像进行分类。

编码部分,使用python“OpenCV”进行图像预处理和分割。

当涉及到分类部分时,请使用任何机器学习库(tensorflow、keras、torch、scikit-learn...等等),因为您可以根据需要使用任何性能更好的算法来使用和执行分类。

就是这样..

Link for Reference Journal

【讨论】:

谢谢.. 如何应用机器学习算法对图像进行分类?我可以阅读的任何参考资料 Scikit learn、scikit image、opencv 文档会对你有很大帮助。看看吧。。【参考方案3】:

首先,我需要知道您使用的是什么类型的数据,因为根据您的数据,如果是 MRI 或 PET 扫描或 CT,对于在 python 中使用机器学习进行检测可能会有不同的建议。

但是,我想您的主要数据集由 MR 图像组成,我附上了一篇文章,我发现它很好地概述了不同的方法> 这个项目比较了四种不同的机器学习算法:决策树、多数、最近邻和最佳 Z 分数(我自己设计的算法,是朴素贝叶斯算法的轻微变体)

https://users.soe.ucsc.edu/~karplus/abe/Science_Fair_2012_report.pdf

在这里,我们考虑了乳腺癌和结直肠癌,并且表现最佳的算法(最佳 Z 分数和最近邻)使用了所有特征来对样本进行分类。决策树仅使用 13 个特征对样本进行分类,结果平庸。大多数人没有看任何特征并且做得最差。除决策树外的所有算法都可以快速训练和测试。决策树很慢,因为它必须依次查看每个特征,计算每个可能的切点选择的信息增益。

【讨论】:

以上是关于使用 python 对图像数据集进行任何癌症诊断的机器学习的主要内容,如果未能解决你的问题,请参考以下文章

使用 CNN 进行癌症预测的分类

从 R 中的两个数据框中选择参考日期之后的最近日期

深度学习,提高前列腺癌诊断正确率

动手教你学故障诊断:Python实现Tensorflow+CNN深度学习的轴承故障诊断(西储大学数据集)(含完整代码)

数据分析基于癌症生存数据建立神经网络

癌症语义分割中的图像和掩模归一化