原文出處
https://www.bioinfo.info/?/question/6112
在做芯片分析時,得到了 差異基因 的list,但是讀入GPL6244的註釋文件發現gene symbol不是單獨的壹列,而是隱藏在gene_assignment這壹列中間。怎麽才能註釋得到gene symbol結果?
回復1:這個妳可以把 gene_assignment這壹列取出來,然後使用 // 分割, 取分割以後的第1列即可。R裏面limma包有個函數好像叫? strsplit2() ,妳可以試試。
回復2:
library(tidyverse)
symbol<-str_split_fixed(annotation_file$gene_assignment,pattern = "//",3)[,2]