A espécie Coffea arabica é a mais importante, economicamente, do gênero Coffea. Essa espécie é autógama e apresenta base genética estreita. Assim, o sucesso dos programas de melhoramento para essa cultura é desafiador. Nesse sentido, métodos seletivos robustos e precisos são necessários para maximizar os ganhos com seleção, mantendo a variabilidade genética presente nas populações. O uso de marcadores moleculares, por permitir o acesso à informação do DNA dos indivíduos, e da seleção baseada em dados fenotípicos por meio de procedimentos de modelos mistos (REML/BLUP), por permitirem a estimação de parâmetros genéticos de forma acurada mesmo em situação de experimentos desbalanceados, têm se mostrado vantajosos. Finalmente, os métodos de seleção genômica ampla (GWS), que buscam conhecer as associações entre os dados genotípicos e os fenotípicos, tem se mostrado acurado e promissor para diversas espécies vegetais, inclusive para espécies perenes. O objetivo do trabalho foi identificar marcadores SNP e validá-los em estudos de diversidade genética; estimar os parâmetros genéticos e os ganhos com a seleção utilizando a metodologia de modelos mistos (REML/BLUP); aplicar o princípio da GWS e avaliar sua eficiência em população de C. arabica. A população em estudo, inicialmente, foi composta por 72 genótipos nos quais os marcadores SNP foram identificados e validados. A seleção fenotípica, por meio do procedimento REML/BLUP, foi realizada em 228 genótipos de cafeeiros. A GWS foi realizada em população composta por 195 genótipos, genotipados com 21.211 e fenotipados para 18 características agronômicas. Um total de 40.000 sondas específicas foram construídas, sendo identificados 91.517 marcadores SNP em 72 indivíduos de C. arabica. Após análises de qualidade, 11.187 SNP foram selecionados e validados em análises de diversidade e estrutura genética dexv populações. Os marcadores foram eficientes na avaliação da diversidade e estrutura genética de C. arabica. Com base nos dados fenotípicos por meio de análises de modelos mistos foi possível estimar os parâmetros genéticos da população avaliada e obter ganhos expressivos com seleção. Os resultados da GWS demonstram o potencial dessa metodologia seletiva para o melhoramento de C. arabica, por predizer com acurácia os valores genéticos genômicos dos indivíduos e possibilitar a redução no tempo necessário para completar o ciclo de seleção, proporcionando ganhos significativos em eficiência seletiva.
The Coffea arabica species is the most important, economically, of the Coffea genus. This species is autogamous and has a narrow genetic base. Thus, the success of breeding programs for this crop is challenging. In this sense, robust and accurate selective methods are necessary to maximize the gains with selection, keeping the genetic variability present in the populations. The use of molecular markers, by allowing access to the DNA information of the individuals, and selection based on phenotypic data through mixed model procedures (REML/BLUP), because they allow the estimation of genetic parameters accurately even in situations of unbalanced experiments, have proved to be advantageous. Finally, genome wide selection (GWS), which seek to know the associations between genotypic and phenotypic data, have been shown to be accurate and promising for several plant species, including for perennial species. The objective of this study was to identify SNP markers and to validate them in studies of genetic diversity; to estimate genetic parameters and selection gains using the mixed model methodology (REML/BLUP); apply the GWS principle and evaluate its efficiency in C. arabica population. The population was initially consisted of 72 genotypes in which the SNP markers were identified and validated. Phenotypic selection, using the REML/BLUP procedure, was performed on 228 coffee genotypes. Finally, GWS was performed in a population consisted of 195 genotypes, genotyped with 21,211 and phenotyped for 18 agronomic traits. A total of 40,000 specific probes were constructed, with 91,517 SNP markers identified in 72 C. arabica individuals. After quality analyzes, 11,187 SNPs were selected and validated in analyzes of population structure and genetic diversity of coffee progenies derived from Catuaí and Híbrido de Timor. The markers were efficientxvii in evaluating the diversity and structure genetic of C. arabica. Based on the phenotypic data through analyzes of mixed models, it was possible to estimate the genetic parameters of the evaluated population and obtain expressive gains with selection. Finally, GWS results demonstrate the potential of this selective methodology for the improvement of C. arabica by accurately predicting the genomic genetic values of the individuals and enabling the reduction in the time required to complete the selection cycle, providing significant gains in selective efficiency.