Add a short description here!
Project description
HBA
地中海贫血(以下简称“地贫”)是一种常见的溶血性单基因隐性遗传病,主要是由于珠蛋白基因缺陷导致珠蛋白链合成减少或缺如而引起的 。我国长江以南地区,特别是广西、广东、云南、海南是该病的高发区。同时目前已经发现非常多具有代表性的地贫类型,比如常见的 -α3.7、-α4.2、--SEA、和—THAI 都是比较常见的类型地中海贫血亚型。
导致地贫表型的 α2 珠蛋白融合基因于2013年首次报道[1],α2 珠蛋白融合基因是在配子生成过程中,α2 珠蛋白基因与 Ψα1(α-珠蛋白假基因)发生了片段重组[1],改变了α2 珠蛋白基因的 3′UTR,并引起了多聚腺苷酸信号突变,从而产生广泛的 α2 珠蛋白基因转录本,引起α+-地贫。
结合相关研究报道,α2 珠蛋白基因和Ψα1发生片段重组后会在HBA2基因下游3’段引入一段Ψα1的序列,而引入的片段和HBA2基因的原3’端片段存在几个碱基序列的差异。
HBA2基因的781-835 TCCCCTCCTT GCACCGGCCC TTCCTGGTCT TTGAATAAAG TCTGAGTGGG CAGCA HBA2和Ψα1重组后的融合基因对应序列 TCCCCTCCCT GCCCCAGCAC TTCCTGATCT TTGAATGAAG TCCGAGTAGG CAGCA
所以在本发明中,我们通过分析这几个特定的差异位点,来对HBA2是否发生融合基因进行准确的检测。
使用方法:
python HBA2_fusion.py -bam $sample.bam -ref Hg19.fa -out $sample.output.tsv
- cfg HBA2_fusion.cfg 见本项目仓库,因位点固定无需进行额外调整/配置
- bam 待检测的bam文件,需为bam格式。
- ref 参考基因组,需为fa格式。
- out 输出文件,记录样本分析结果。
- genome 参考基因组版本,默认Hg19,支持(Hg19 和 GRCh38)
- cut 位点深度阈值,默认为10,只有深度支持达到阈值的位点才会纳入最终分析。
结果格式说明
sample | c.789 | c.793 | c.796 | c.799 | c.807 | c.817 | c.823 | HBA2-Fusion |
---|---|---|---|---|---|---|---|---|
pos_sample/200413_I085_V300039393_L4_C243-21.final.bam | 0.302 | 0.311 | 0.29 | 0.28 | 0.266 | 0.194 | 0.142 | True|0.255 |
第一列为分析的Bam文件名称; 第2~8列,为影响HBA分析的位点频率; 第九列,是样本最终的HBA2融合基因的判定结果,和融合基因频率。
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Hashes for HBA_Fusion-1.0.0.0-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 25523dcc3efa08a0da35356d79cbfa64fde20377293e6202c8055269366a8696 |
|
MD5 | d9ab14b1c1da3b90631fc87490124e71 |
|
BLAKE2b-256 | f93b8c888c9845917dd72e688bd63f032b574c69d5e1a54ab9b412390b9027f7 |