当前位置: 首页 > news >正文

GWAS_LD

局部LDblock 绘图

1. 查看显著位点附近基因情况

链接pvalue显著位点文件
 ln -s ~/yiyaoran/GWAS/my_GWAS_J/P3.GWAS/01.tassel/mlm_output.manht_figure.sigSite.out .
#也可以自己筛选awk '$2 == 9 && $4 <= 0.000028481' mlm_output.manht_input>368_GWAS.snp
snp两端延伸50000bp作为绘图窗口, 注意chr名称问题
awk '$3 ~ /[0-9]/{print $2"\t"$3-1"\t"$3}' 368_GWAS.snp | \
awk '{if($1<10){print "Chr0" $0 }else{print "Chr" $0 }}' > ./GWAS.snp.bed#准备gene_length文件  注意染色体名称
cp  ~/yiyaoran/01.ref/chrsize.txt .
awk 'NR > 1 {printf "Chr%02d\t%d\n", $1, $2}' chrsize.txt > new_chrsize.txt
#"Chr%02d\t%d\n":
#Chr 是固定的前缀。
#%02d 表示将第一个字段($1)格式化为两位数字,不足两位时前面补零(例如 1 变成 01)。
#\t 是制表符,用于分隔列。
#%d 表示第二个字段($2)。
#\n 是换行符。#bedtools slop 用于扩展或收缩 BED 文件中的每个区间。
bedtools slop -b 50000 -i GWAS.snp.bed -g new_chrsize.txt > GWAS.snp.50000.bed#bedtools merge 用于合并重叠或相邻的区间
bedtools merge -i GWAS.snp.50000.bed > GWAS.snp.merge.bed
准备基因位置信息文件gff3或gtf文件
 awk '$3=="gene"' Zea_mays.Zm-B73-REFERENCE-NAM-5.0.60.gtf >gene.gtf
提取窗口内基因信息以及与显著snp最近的基因

注意bed文件的染色体名称和gtf文件的染色体名称是否一致

#修改染色体名称chr09为9
awk '{gsub(/^Chr/, ""); gsub(/^0+/, ""); print}' GWAS.snp.merge.bed > GWAS.snp.merge.fixed.bed
#提取窗口内的基因信息:
bedtools intersect -wo -a GWAS.snp.merge.bed -b gene.gtf > GWAS.snp.merge.gene
#bedtools intersect:用于找出两个文件中重叠的区间。
#-wo:输出重叠的区间,并在输出中包含重叠的长度(overlap size)#修改染色体名称
awk '{gsub(/^Chr/, ""); gsub(/^0+/, ""); print}' GWAS.snp.bed >GWAS.snp.fixed.bed
#找出与显著 SNP 最近的基因:
bedtools closest -a GWAS.snp.fixed.bed -b gene.sorted.gtf -d >GWAS.snp.gene
#bedtools closest:用于找出每个区间最近的非重叠区间。
#-d:在输出中包含最近区间的距离。

2.显著位点附近区域进行LD block 计算及热图绘图

相关文章:

  • 基于单片机的按摩器控制系统设计
  • 【Envi遥感图像处理】016:如何下载NOAA AVHRR GIMMS 全球数据集?
  • PHP 8 中的 Swow:高性能纯协程网络通信引擎
  • 大学英语四级选词填空阅读题和段落匹配解析
  • 使用Service发布前后端应用程序
  • Linux——firewalld防火墙
  • Android开发四大组件和生命周期及setFlags
  • 最长子序列长度(LIS)--个数遍历的二分+贪心优化
  • React Article模块
  • 【后端开发】Spring日志
  • 得物官网sign签名逆向分析
  • HashMap 初步理解 put 操作流程 HashMap 的线程安全问题
  • JVM笔记【一】java和Tomcat类加载机制
  • Visio导出清晰图片步骤
  • 工业级向量检索核心技术:IVF-PQ原理与全流程解析
  • Promise 使用介绍
  • 当HTTP遇到SQL注入:Java开发者的攻防实战手册
  • UE学习记录part19
  • cesium中postProcessStages全面解析
  • 哔哩哔哩工具箱:BiliTools v1.3.2
  • 第一集|《蛮好的人生》蛮好,《悬镜》挺玄
  • 4月LPR保持不变:1年期3.1%,5年期以上3.6%
  • 马上评|机器人马拉松,也是具身智能产业的加速跑
  • 希音、Temu告知美国消费者4月25日起涨价:关税变化导致运营成本上升
  • 美方将对中国制造船只征收“港口费”,外交部:损人害己
  • 一镇一链、一园一策,上海闵行发布重点产业区镇协同产业地图