A partir das informações geradas no Projeto Brasileiro do Genoma Café (PBGC) foram identificadas, por meio de análise in silico, seqüências potencialmente envolvidas na resistência a Hemileia vastatrix Berk. et Br. presentes nos cafeeiros. Foram usadas diferentes estratégias para minerar as seqüências de interesse. Inicialmente, palavras-chave que correspondem a termos relacionados aos mecanismos de resistência de plantas a patógenos foram obtidas da literatura e utilizadas como "iscas" para mineração dos dados. Com o auxílio de ferramentas disponíveis na plataforma de bioinformática do PBGC, criaram-se projetos englobando as ESTs (Expressed Sequence Tags) relacionadas a cada uma destas palavras. Outra estratégia utilizada foi a busca por similaridades entre algumas seqüências envolvidas com a resistência do cafeeiro a doenças já publicadas com as seqüências do PBGC, por meio do algoritmo BLAST. Utilizou-se, também, o "Electronic Northern", uma ferramenta desenvolvida pelo Laboratório de Genômica e Expressão (LGE). A mineração, usando as três estratégias, identificou 8.968 seqüências do PBGC. O envolvimento ou ligação destas seqüências com genes de resistência à ferrugem do cafeeiro será confirmado, em trabalhos futuros, utilizando marcadores moleculares e técnicas de genômica funcional.
In silico analyses using information generated by the Projeto Brasileiro do Genoma Café (PBGC) permitted the identification of sequences potentially involved with coffee tree resistance to leaf rust. These analyses aimed the generation of knowledge concerning the coffee tree resistance factors to Hemileia vastatrix Berk. et Br. Three different strategies for the identification of the sequences related to the resistance were used. Initially, key-words correspondent to plants resistance mechanism to pathogens were obtained and used as "baits" for data mining. Projects including the ESTs (Expressed Sequence Tags) related to each one of these words were created with the help of the available tools at the PBGC bioinformatics platform. The search for similarities between some published sequences and sequences from the PBGC, by using the BLAST algorithm was another used strategy. It was also used the Electronic Northern, a tool developed by the Laboratório de Genômica e Expressão (LGE). Eighty nine hundreds and sixty eight sequences of the PBGC were identified by data mining. The relationship or linkage of these sequences with coffee leaf rust resistance genes will be further confirmed by molecular markers and functional genomics techniques.