量子机器学习将首次用于癌症治疗!CQC再下一城
Posted 光子盒
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了量子机器学习将首次用于癌症治疗!CQC再下一城相关的知识,希望对你有一定的参考价值。
剑桥量子计算公司(CQC)是一家全球领先的量子软件/算法公司,在量子化学领域发表了大量论文,聘请了许多量子化学人才。CQC开发的EUMEN量子化学平台,通过量子计算来促进药物、特种化学品、农用化学品和功能材料的设计。
2021年CQC终于迎来收获期。1月28日CQC与全球TOP3制药巨头罗氏达成合作,将使用CQC的EUMEN量子化学平台,模拟量子尺度的相互作用,研究治疗阿尔茨海默氏症和其他疾病的新疗法。
2月24日,CQC再下一城,与中美冠科生物(Crown Bioscience)、JSR生命科学公司达成一项合作协议,探索量子技术的应用,推动肿瘤药物发现中的多基因生物标志物的鉴定。
中美冠科生物是一家全球性的新药研发技术平台公司,总部设在美国硅谷,英国和中国均有运营实体,现已发展为全球最强的肿瘤和糖尿病药效检测技术公司。2018年,中美冠科被JSR生命科学公司收购。
该合作伙伴关系将结合冠科生物在该领域的专业知识和15年临床前和转化研究产生的大量数据集,以及CQC在量子算法、量子机器学习和量子计算方面的先进能力。
利用量子机器算法和CQC的软件开发框架在NISQ(含噪中型量子)计算机上执行,早期方法侧重于从遗传数据分析中获得洞察力,鉴定癌症治疗生物标志物并推动下一代生物信息学的发展。
目标是确定一种策略来实现早期量子计算应用,最终解决和探索生命科学中广泛挑战的解决方案。
冠科生物首席执行官Armin Spura评论说:“该协议延续了冠科生物致力于创新和技术应用的承诺,以此来加快药物开发和降低风险,从而产生更强的候选药物,并更快地从临床前阶段过渡到临床阶段。”
CQC首席执行官llyas Khan说:“CQC成立的初衷是开发有助于解决一些最紧迫的社会挑战的技术,特别是在人类生物学等领域,因此我们很高兴与冠科生物公司建立最新的合作伙伴关系,以确定如何将先进的量子机器学习方法应用于关键用例。”
量子机器学习(QML)是量子计算和机器学习的结合。
量子计算是利用叠加、纠缠和干涉等量子特性来完成的。N个经典比特一次表示的数字只有1个,N个量子比特一次表示的数字数目为2的N次方。当N=250时,可以表示的数字数目比宇宙中所有原子的数目还要多。
机器学习(ML)无非是在大量数据的帮助下训练机器(计算机),使计算机从我们的数据中找到某种模式,并将其应用于新的数据集。
我们想象一下,婴儿是如何学会说话的。他/她在不同的情况下听到很多来自我们周围环境的话,并每天学习什么时候应该说什么。这是一个持续一生的过程。我们会第一次遇到许多不同的单词,并找到一个使用这个单词的情况(计算机模式),然后我们可能会在遇到相同的情况时使用该单词。在这种情况下,我们用这些数据训练我们的大脑。
计算机也像婴儿一样,它只知道用0和1的组合作为输入。因此,我们用大量的数据来训练计算机,并用这个模式来处理另一组数据。
现在,我们可以利用机器学习解决许多不同类型的问题。在回归中,我们可以为测试数据集预测一些值;在分类中,我们可以在不同类别的数据之间进行分类。
如下图所示,量子机器学习和经典机器学习的最大区别是前者花费更少的时间完成更多的机器学习任务。
量子机器学习真的优于经典机器学习吗?下面以支持向量机(SVM)为例,将两者进行对比。
什么是支持向量机?假设我们在处理一个二元分类问题。而支持向量机算法的目标是在高维空间中找到一个超平面,该超平面对数据点进行清晰的分类。为了区分这两类数据点,可以选择许多可能的超平面。我们的目标是找到一个具有最大余量的平面,即两类数据点之间的最大距离。最大化边距可以更有把握地对未来的数据点进行分类。
Medium的一篇文章中,作者Deep Dutta使用IBM Qiskit进行了一次实验。
为了简单起见,作者使用一个基本的数据集,即ad-hoc数据集。特征维度设为2,训练集和测试集分别为20和10。抽取1个随机种子,shot=10000。gap=0.3,gap是高维空间中的一个间隙,用来分隔数据。然后绘制数据并标记类。
数据集如下图所示,有两个类分别标记为0和1。这时,我们需要一个高维空间中的超平面来分隔这两个类。
在经典计算机上运行量子支持向量机算法(QSVM),需要一个量子模拟器作为后端,作者将BasicAer的qasm-simulator作为后端,并且有一个reps为2的特征映射,即重复电路(量子电路)的数目为2。然后在量子实例上运行QSVM。
在QSVM被训练之后,就可以为测试数据集预测类了。如下图所示,QSVM完美地(准确率100%)将两个类分类。
最后,比较QSVM和经典SVM的准确率。经典支持向量机算法在Qiskit可以通过scikit-learn SVM实现。核矩阵如下:
运行结果显示,SVM的准确率仅为65%,这里的QML明显优于ML。
当处理SVM问题时,在分类的情况下,找到一个分割的超平面通常只可能在更高的维度。这涉及到计算高维空间中数据点之间的距离。因此,如果维数非常大,那么计算距离就费时费力。
所以我们做的更简单的事情叫做“核技巧”(Kernel trick)。核是一些易于计算的函数:获取我们的数据点并返回一个距离,核可以进行优化,以便最大化数据类之间的距离。
不幸的是,一些核度量很难进行经典计算。这就是量子计算机的用武之地。
如果不能对核进行经典优化,量子机器学习在利用量子计算机的多维计算空间来寻找超平面方面显示出很大的希望。当数据从其输入维度映射到量子计算机的Hilbert空间时,它自然会投射到更高维度的空间。因此,QSVM比SVM表现更好。
[1]https://www.jsrlifesciences.com/press-releases/crownbio-jsr-life-sciences-partner-cambridge-quantum-computing-quantum-machine-learning
[2]https://medium.com/swlh/quantum-machine-learning-the-next-big-thing-95bfc3b4f08f
进入光子盒社群,与我们近距离互动,了解量子领域更多产业、商业、科技动态,领取量子技术产业报告。
现添加社群助手微信Hordcore即可进群 ,与我们一起展望未来!
以上是关于量子机器学习将首次用于癌症治疗!CQC再下一城的主要内容,如果未能解决你的问题,请参考以下文章
Graphcore 联合百度飞桨提交 MLPerf Training 2.0,IPU 性能再下一城
量桨出世!国内首个支持量子机器学习的深度学习平台来了
如何解读「量子计算应对大数据挑战:中国科大首次实现量子机器学习算法」?——是KNN算法吗?
机器学习用于抑郁障碍识别诊断,效果如何?
Serverless 全能选手,再下一城
使用 python 对图像数据集进行任何癌症诊断的机器学习