0%

CRISPR (clustered regularly interspaced short palindromic repeats)-Cas (CRISPR-associated) systems: prokaryotic adaptive immune systems that provide protection against infection by parasitic mobile genetic elements, such as viruses and plasmids.

Read more »

巫师养成中,看看我是否适合做占卜……

  • 建立新型冠状病毒肺炎预警模型,对温州市和浙江省的确诊人数进行了模拟
  • 相关报告已经在2月10日递交
  • 数据最后更新:2020年2月17日
  • 请用电脑打开以下链接,点击右上角右数第二个按钮compare data on hover以方便观看模拟数据
  • 不保证准确性
  • 个人作图水平还在提高中……枯

新版链接(链接地址会更新,所以请从本网页获取最新链接QVQ)

ncov温州市模拟

ncov浙江省模拟

日志

  • 2月9日:确立模型并模拟
  • 2月10日:上交模型报告(10页)
  • 2月16日:矫正参数
    浙江省和温州市的趋势均明显变缓,尤其是浙江省。尽量保守估计,调整参数使预测曲线尽量在“上面贴近”实际曲线
  • 2月17日:上报了一段话……其实就接下来的新增人数来讲,更倾向于这是一个随机数了,模型已经不再适用。

近日,浙江省和温州市的趋势均明显变缓,尤其是浙江省。我们对此进行了参数调整,但采取尽量保守估计的方式,使预测曲线尽量在“上面贴近”实际曲线。
…给出链接
以上是最新的模拟结果,根据保守估计,温州市和浙江省将在2月底达到平稳,并估计上限分别不超过540人和1230人。

  • 2月19日:我的任务已经结束了。浙江省近两日各一例,分别来自温州和嘉兴。个人认为强隔离政策在其中发挥了巨大的作用,以至于可以在模型后期阶段增加人数骤减,这是模型没有考虑到的地方。当然这本身也难以光从数据上做出预测,但是可以在数据发生变化时及时判断这一点的来临。

    强隔离政策是以损失经济为代价的,是否有采取强隔离的必要以及何时开始采取强隔离政策是值得思考的问题。另一方面,强隔离政策其实也有不人性的一面,这一点我是从自己到社区做防疫志愿者的时候体会到的,一些老父老母在医院里需要子女照看送饭,却被强制两天出一次门;一些在此期间工作的人晚上10点后没回到社区就只能在外过夜等等。当然也许这和奋战在一线的人来说都谈不上什么,但是家家都有本难念的经,愿这样的疫情不再发生,愿人类与自然和谐共处。

    接下来浙江省开始复工,强隔离解除,人员流动增加,因此相应政策的跟进和个人的警惕和防范是必不可少的。希望浙江省的疫情能顺利结束。


下面简单地轻松地说一下我的方法……

我主要是用微分方程组进行了建模,然后通过计算机模拟的方法进行模拟和预测,我将我的模型命名为SICRLD模型。以温州市作为浙江省典型代表,对模型进行了训(调)练(参),做了一个温州市(我的家乡太了不起太不容易了,为家乡点赞)预警模型然后直接放到浙江省进行模拟,最后做了一个治愈情况的模(估)拟(计)。

Read more »

基因集富集分析 Gene Set Enrichment Analysis(GSEA)通过关注基因集(即具有共同生物学功能,染色体位置或调节作用的基因组)来解释基因表达数据。

Read more »

Hashing is an important Data Structure which is designed to use a special function called the Hash function which is used to map a given value with a particular key for faster access of elements. The efficiency of mapping depends of the efficiency of the hash function used.

Read more »

种群分层Population stratification(由于系统的血统差异systematic ancestry differences而导致cases与controls之间的等位基因频率差异allele frequency differences)可能导致疾病研究中的虚假关联。
此文介绍了一种方法,可以在全基因组范围内显式检测和校正群体分层。使用主成分分析(PCA)来显式地建模cases与controls之间的祖先差异。 所得的校正特定于候选标记candidate marker在整个祖先群体中的频率变化,从而最大程度地减少了虚假关联minimizing spurious associations,同时使检测真正关联的能力最大化maximizing power to detect true associations。

Read more »

因子分析是主成分分析的推广和发展,将多个变量综合为少数几个因子,以再现原始变量和因子之间的相关关系。原始变量是可观测的显在变量,而潜在变量是不可观测的称为潜在因子。

因子分析和主成分分析的区别:
主成分分析不能作为一个模型来描述,它只是通常的变量变换,而因子分析需要构造因子模型,它希望选取尽可能少的公因子,以便构造一个结构简单的因子模型;
主成分分析是将主成分表示为原始变量的线性组合,而因子分析是将原始变量表示为公因子和特殊因子的线性组合,用假设的公因子来解释相关阵的内部依赖关系。

Read more »

之前主要做了两类的判别,下面进行类的多元总体判别分析。
不同之处主要在于初始组间均值显著性差异与组间方差显著性的分析。

利用判别分析的统计方法建立肝胆疾病的判别函数
(a)检验组间均值显著性差异
(b)分析组间方差显著性差异
(c)建立判别函数
(d)分析判别效果
并应用于“体检数据”中,根据体检资料分析是否有得肝胆疾病的可能性。

Read more »

Keypoints

全基因组关联研究Genome-wide association studies (GWAS) 在人类基因组数据分析中非常成功。微生物全基因组可用性的提高为微生物GWAS提供了机会。
最初的微生物GWAS已成功识别出一系列细菌,病毒和原生动物在强烈选择下的性状变异,例如耐药性。
微生物GWAS存在一些挑战,这些挑战可能会阻碍在适度选择条件下鉴定变体identifying variants。主要挑战是由于选择和复杂的重组模式selection and complex recombination patterns.,导致微生物种群分层population stratification增加。
专门针对微生物GWAS的需求量身定制的新型软件将大大加快该领域的发展。特别是,多基因方法polygenic methods的应用尚未在微生物中进行评估。
令人兴奋的未来研究领域是在同一样本中生成宿主和微生物基因组数据the generation of host and microbial genomics data within the same samples。这将允许对基因组进行基因组分析genome-to-genome analyses,以测试宿主与微生物之间的相互作用。

Read more »

聚类分析

(1)现有16种饮料的热量、咖啡因含量、钠含量和价格的数据,根据这4个变量对16种饮料进行聚类

系统聚类

这里展示的是离差平方和法(WARD)进行系统聚类。它基于方差分析的思想,同类样品之间的离差平方和应当较小,不同类之间的离差平方和应当较大
中样品的离差平方和为

个类的总组内离差平方和为

我们需要当固定时要选择使W达到极小的分类

Read more »