Meta小课题:K-mer
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Meta小课题:K-mer相关的知识,希望对你有一定的参考价值。
参考技术A号外:
序列组装的算法k-mer
基因就像一本大书(比如《追忆似水年华》),里面的字都是有A,T,C,G组成的。我们测序出来的大于几百bp的小的序列,叫做reads。我们测序的结果中有上百万条的reads,而这些reads的位置我们又不知道(随机打断),我们只能根据他们的 重叠部分 来尽量还原他的原型。
目前测序的过程就像把好上千大书(又是同一本书)随机的撕成一个个的片段,在没有页码的情况下,把这些纸片搅拌混匀。组装就是再把这些片段组合成不同的章节。
一种组装的办法就是拿这些片段直接组装,有重叠的就组在一起:
OLC算法最初成功的用于Sange测序数据的组装,比如Celera Assembler,Phrap,Newbler等均采用该算法进行拼接组装。
按照这个思想,我们很快就发现了问题,下一个点可能有很多的选择,或者没有选择:
我们需要找到Hamiltonian path,我们需要找到包含每个点的,但是只包含一次。下图像不像我们小学之前做过的游戏,遍历每个点,但是每个点只能经过一次。这是俄国一个一个科学家William Hamilton的一个发明。
但是又提出了一个假设,如果有两条或多条的Hamiltonian path呢(reads越短产生的Hamiltonian path越多)?如何才能知道其中的一条是DNA的序列呢?
由于二代测序得到的reads长度较短,包含的信息量较少,因此完成基因组拼接需要较高的覆盖度。OLC算法适用于读长较长的序列组装,通过构成的OLC图寻找Consensus sequence的过程,实际上是 哈密顿通路寻找的问题 。
若采用OLC算法,会增加组装的复杂性以及运算量。而采用DBG算法,通过K-1的overlap关系,构建DBG图,通过寻找 欧拉路径 得到Contig序列,从算法的角度极大的简化了组装的难度。
为什么采用k-mers而不是全长序列组装?简而言之,计算机喜欢k-mer,因为匹配准确快速。
为什么要构建 K -mer↓↓↓↓↓↓↓
How can K-mer estimation help to find genome sizes?
K-mer analysis and genome size estimate
基于de Bruijn图进行组装上一讲已经讲过 宏基因组组装:从what 到how
↓↓↓↓↓两款辅助确定 K -mer大小的软件
jellyfish
KmerGenie
K-mer Distribution
诺娃讲堂 | 基因组学策略(二)揭开组装的神秘面纱上篇
STEP3——基因组组装:Platanus
宏基因组实战5. sourmash基于Kmer比较数据集
课题报告OpenCV 抠图项目实战评价指标
Python 小白的课题报告—OpenCV 抠图项目实战(9)
本系列是 Python 小白的课题作业《基于OpenCV 的图像分割和抠图》。
需要说明的是,本系列并不能算是 OpenCV 的抠图项目教程,只是以此为主题的课题报告。其中包括了一个较为完整的 PyQt 项目。
从学生课题作业报告的角度,还是可以晒出来给大家参考的。
欢迎关注『Python 小白的项目实战 @ youcans』 原创作品
Python 小白的课题报告—OpenCV 抠图项目实战(1)目录摘要
Python 小白的课题报告—OpenCV 抠图项目实战(2)抠图绪论
Python 小白的课题报告—OpenCV 抠图项目实战(3)抠图综述
Python 小白的课题报告—OpenCV 抠图项目实战(4)固定阈值抠图
Python 小白的课题报告—OpenCV 抠图项目实战(5)自适应阈值抠图
Python 小白的课题报告—OpenCV 抠图项目实战(6)色彩范围抠图
Python 小白的课题报告—OpenCV 抠图项目实战(7)边缘检测
Python 小白的课题报告—OpenCV 抠图项目实战(8)图像轮廓
Python 小白的课题报告—OpenCV 抠图项目实战(9)评价指标
Python 小白的课题报告—OpenCV 抠图项目实战(10)PyQt5 使用
第五章 抠图的性能评价
5.1 主观评价指标
对于图像质量评价研究的方法由两种,分别为主观评价方法和客观评价方法。
主观评价方法主要依据的是人体视觉感知神经在特定的观测环境下,参考图像亮度、图像噪声和图像模糊等指标,对被测图像进行主观评价打分。
虽然主观评价方法是人体的直观感受,肯定符合人眼对图像质量的评价,但是主观评价方法也有很多缺陷:
- 首先人体主观评价很容易受到被测人情绪、偏好等个人主观原因的影响;
- 其次测试环境等客观因素也会影响主观评价方法的结果;
- 最后,在数据量特别大的时候,组织人员进行主观评价费时费力,图像质量评价的效率会很低下。
5.2 客观评价指标
为了追求图像质量评价的效率,客观评价方法越来越受到研究者的欢迎。常用的客观评价指标是:SAD, MSE, Gradient error, Connectivity error[1]。
5.2.1 绝对误差和(SAD)
绝对误差和SAD(Sum of Absolute Difference)的定义为:
S
A
D
=
∑
i
∣
α
i
−
α
i
∗
∣
SAD=∑_i |α_i-α_i^*|
SAD=i∑∣αi−αi∗∣
5.2.2均方误差(MSE)
均方误差MSE (Mean Squared Error) 的定义为:
M
S
E
=
1
n
∑
i
(
∇
α
i
−
∇
α
i
∗
)
q
MSE=\\frac1n ∑_i(∇α_i - ∇α_i^*)^q
MSE=n1i∑(∇αi−∇αi∗)q
5.2.3 梯度误差(Gradient error)
梯度误差是预测的
∇
α
i
∇α_i
∇αi和
∇
α
i
∗
∇α_i*
∇αi∗ 的之间的梯度差异:
∑
(
∇
α
i
−
∇
α
i
∗
)
q
∑(∇α_i -∇α_i^*)^q
∑(∇αi−∇αi∗)q
∇ α i ∇α_i ∇αi和 ∇ α i ∗ ∇α_i* ∇αi∗ 表示对应的alpha matte的归一化梯度, 这是通过将matte与具有方差sigma的一阶Gaussian导数滤波器进行卷积计算得到的。
5.2.4 连通性误差(Connectivity error)
连通性误差定义如下:
∑
i
[
φ
(
α
i
,
Ω
)
−
φ
(
α
i
∗
,
Ω
)
]
∑_i [φ(α_i,Ω) - φ(α_i^*,Ω)]
i∑[φ(αi,Ω)−φ(αi∗,Ω)]
连通性误差是对整个预测的alpha matte图和Ground truth的差异的累和。源域(source region) Ω由最大连通域定义,最大连通域是指alpha matte和对应的Ground truth都完全不透明的部分。
5.2.5 平均绝对误差(MAD)
平均绝对误差MAD(Mean Absolute Difference) 的定义为:
M
S
E
=
1
n
∑
i
∣
α
i
−
α
i
∗
∣
MSE = \\frac1n ∑_i|α_i-α_i^*|
MSE=n1i∑∣αi−αi∗∣
MAD和SAD类似,这两个标选择一个即可。
参考文献:
-
Christoph Rhemann, Carsten Rother, Jue Wang, et al. A perceptually motivated online benchmark for image matting. CVPR 2009, 1826–1833.
-
Image Matting 客观评价指标、数据集及主观评价
https://blog.csdn.net/Mao_Jonah/article/details/113646709 -
Matting任务里的Gradient与Connectivity指标
https://www.cnblogs.com/lart/p/10627821.html
【本节完】
版权声明:
本节内容,主要来自:Image Matting 客观评价指标、数据集及主观评价(https://blog.csdn.net/Mao_Jonah/article/details/113646709)
欢迎关注『Python 小白的项目实战 @ youcans』 原创作品
原创作品,转载必须标注原文链接:https://blog.csdn.net/youcans/article/details/122296231
Copyright 2022 youcans, XUPT
Crated:2022-01-09
欢迎关注『Python 小白的项目实战 @ youcans』 原创作品
Python 小白的课题报告—OpenCV 抠图项目实战(1)目录摘要
Python 小白的课题报告—OpenCV 抠图项目实战(2)抠图绪论
Python 小白的课题报告—OpenCV 抠图项目实战(3)抠图综述
Python 小白的课题报告—OpenCV 抠图项目实战(4)固定阈值抠图
Python 小白的课题报告—OpenCV 抠图项目实战(5)自适应阈值抠图
Python 小白的课题报告—OpenCV 抠图项目实战(6)色彩范围抠图
Python 小白的课题报告—OpenCV 抠图项目实战(7)边缘检测
Python 小白的课题报告—OpenCV 抠图项目实战(8)图像轮廓
Python 小白的课题报告—OpenCV 抠图项目实战(9)评价指标
Python 小白的课题报告—OpenCV 抠图项目实战(10)PyQt5 使用
以上是关于Meta小课题:K-mer的主要内容,如果未能解决你的问题,请参考以下文章
基于微信小程序的疫苗预约系统 疫苗小程序毕业设计课题选题 毕设项目作品 毕业设计论文