Jump to content
Chuckytah

Bioinformática - Classificador taxonomico

Recommended Posts

Chuckytah

Olá a todos.

Eu estou a fazer um projecto de bioinformática e eu tenho um grande ficheiro excel, com uma grande quantidade de sequências anotadas (com os cinco maiores hits semelhantes para cada (foi ja feito o blast, para ver a semelhança)) que foram obtidas a partir de amostras de raizes de uma árvore. (tenho também o ficheiro de contigs. fasta)

Uma vez que há sequências de todos os grupos taxonómicos (plantas, animais, fungos, protistas, bactérias) eu gostaria de encontrar alguma aplicação que possa discriminar/separar as sequências de cada grupo taxonómico.

Há websites que fazem +- isto como este: http://metagenomics.anl.gov/metagenomics.cgi?page=Home . mas de pessoas especialistas que falei disseram que teria de criar uma scrip para ligar o nome da espécie a um taxonomy-ID do NCBI  e em seguida contar usando sort quantos hits eu possuo para cada sequência para saber qual a mais semelhante e depois separar.

peço desculpa se isto é especifico demais para estar aqui, lol.

de um modo super simplista, eu tenho uma enorme tabela que na 1º coluna tenho uma sequencia de ACTG e nas 5 seguintes colunas tenho as 5 principais especies mais semelhantes, ou seja, que essa sequência pode pertencer, no fundo o que me interessa é a primeira logo, pois é a mais semelhante, e depois quero separar por grupo taxonómico, isto é, é de uma planta agrupo numa tabela só de plantas, etc...

lol tentei fazer-me explicar ^^

espero k m ajudem a solucionar o problema ^^ pk eu sou mais do lado bio xD ;)


*^^*<3@Chuckytuh@<3*^^*

Share this post


Link to post
Share on other sites
jpaulino

Dá lá um exemplo da estrutura do ficheiro de excel e do output pretendido.

Share this post


Link to post
Share on other sites
Chuckytah

Dá lá um exemplo da estrutura do ficheiro de excel e do output pretendido.

o que eu tenho é algo do género:

cod. seq. organismo 1 (+parecido) organismo 2 organismo 3 organismo 4 organismo 5 (- parecido)

rt_xxx1 Avena sativa … … … …

rt_xxx2 Matricaria chamomilla … … … …

rt_xxx3 Agaricus bisporus … … … …

e o output pretendido era:

plantas:

rt_xxx1 Avena sativa

rt_xxx2 Matricaria chamomilla

fungos:

rt_xx3 Agaricus bisporus

ou seja, teria de pegar na 2º coluna e fazer um "search" com alguma base de dados, que me "lesse" os nomes cientificos e depois associasse aos respectivos dominios taxonomicos.


*^^*<3@Chuckytuh@<3*^^*

Share this post


Link to post
Share on other sites
jpaulino

Mas como distingues plantas de fungos (por exemplo) ? Não tens uma coluna de categoria?

Pelo que vejo uma Pivot Table resolve o assunto

Share this post


Link to post
Share on other sites
Chuckytah

essa é a parte chata, lol não distingo, tenho de "pegar" nome cientifico um a um, "bater" numa base de dados até encontrar igual, e na base de dados é que terá a categoria... s é k m fiz entender. lol


*^^*<3@Chuckytuh@<3*^^*

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now

×
×
  • Create New...

Important Information

By using this site you accept our Terms of Use and Privacy Policy. We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.