background image for sidebar

Software popular y/o útil en la filogeografía

Software para microsatélites están más abajo...

SIMCOAL

From the people that brought you Arlequin, a flexible coalescent simulator for Windows 2000/XP and Linux. SIMCOAL2 adds recombination and more types of markers over the original, but if you don't need those features, I strongly recommend the original SIMCOAL version 1. Whereas IM assumes a model (full or subset) and estimates parameters, with a coalescent simulator you are free to make up historical models as complex as you please and compare each to your data.

dnaSP

dnaSP: the industry standard for population genetic analysis of DNA sequences. For Windows OS.
Version 5 released June 11, 2009.

STEM

Species Tree Estimation using Maximum likelihood, aka STEM, searches for the most likely species tree from a set of gene trees under a coalescent model. Concatenation-free, multi-locus phylogenetic methods are especially (but not uniquely) useful at phylogeographic scales of analysis.

IM (Isolation with Migration model analysis using MCMC)

IM and IMa: Assuming two recently separated populations/species, estimates effective pop. sizes (including the common ancestor's), asymmetric migration rates, divergence time, and relative sizes of the two founding populations. IMa allows for a likelihood ratio test of nested versions of the full 6-parameter model. For Windows/DOS or Unix (Darwin or Linux). Updated May 6, 2009.

If you are serious about IM, join the Google Group Isolation with Migration.

On 16 June 2009 Jody Hey released a coalescent simulation program designed to complement IM style analyses, called SIMDIV.
SIMCOAL2 (see above) may actually be more flexible, but SIMDIV will be parameterized similiarly to IM, which may help with comparison of results.

FigTree

FigTree: more software from Andrew Rambaut, available in Windows, Mac, and Linux flavors. This software has fewer features than TreeEdit, but makes way better graphics, and is more reliable.

ClustalX

ClustalX: The paradigmatic alignment software.

ClustalX Help: A very detailed user's guide to ClustalX. Versions available for all platforms.

MEGA

MEGA version 4, for Windows.

PAUP* - SADLY, IT IS NOT FREE

We will bring copies of this software. For more information check the PAUP* FAQ. And download but do not bother printing the PAUP* commands reference version 2, as PDF. A new version of PAUP* should be released any time now...

Also look at these suggestions from Swofford for running a good first set of analyses using PAUP*.

And be sure to see Brian O'Meara's PAUP* instructions: the best on-line resource for using PAUP*, especially for running batch files.

PaupUP is free software to convert the DOS (not Windows™ OS) version of PAUP* into a point-and-click menu and window driven version. See Screenshot. 80% of PAUP*'s commands are available via the menus, the other 20% are still accessible via the command line. The software also incorporates features of Modeltest and TreeView.

Selecting model of DNA sequence evolution

To select for your phylogenetic dataset an appropriate standard model of DNA sequence evolution, try one of the 4 options below:
Takes output of likelihood scores from PhyML:
1) jModeltest (uses AIC, AICc, BIC, DT, hLRT and dLRT criteria).
2) phymltest command (implements AIC) in the R-package, ape.
Takes output of likelihood scores from PAUP*:
3) DT_ModSel (implements BIC using decision theory framework)/
4) The old Modeltest [criteria include AIC, AICc, BIC and hLRT ].

MrBayes

MrBayes, download the latest version.

Tracer, a very useful program for visualizing and evaluating the quality of Bayesian MCMC analyses.

Java

For some of the software programs one needs to be sure that Java is installed on the computer. We will need at least Java Virtual Machine version 1.4.2.
You can automatically get Java here, or check which version of Java you have by clicking here. You can also check by typing at the Command Prompt (Símbolo del Sistema) java -version.

2 programs for divergence time estimation

multidivtime, Bayesian MCMC analysis of divergence time without assuming a 'molecular clock.'

BEAST, another Bayesian analysis of divergence time without assuming a 'molecular clock.'

Software para análisis de microsatélites

Aquí hay una lista de los programas que usaremos durante el curso para análisis de microsatélites con una breve descripción del propósito de cada grupo de programas.
NOTA. La mejor forma de aprender a usar cada uno de los programas es leyendo los manuales de instrucciones. Esto es un poco tedioso, pero indispensable. Durante el curso aprenderemos lo más básico de cada programa, sin embargo, nuestra experiencia indica que ¡nada reemplaza leer un manual de instrucciones por uno mismo!

Programas para analizar la calidad de datos microsatélites

Los microsatélites, como todos los marcadores moleculares no son perfectos. Antes de analizar los datos, debemos estar seguros de la calidad de datos que estamos produciendo. Esto incluye, estar seguros que no tenemos problemas de amplificación durante la reacción de PCR o problemas de "allele drop-out" o "stuttering," cual es la frecuencia de alelos nulos y como todos estos problemas potenciales desvían nuestros datos del equilibrio Hardy-Weinberg. Esta fase es supremamente importante y entre mas control tengamos de ella, menos dolores de cabeza vamos a tener posteriormente durante la fase de análisis. El programa mas útil para este propósito es:

Microchecker.

Pedant.

Programas para convertir bases de datos a distintos formatos

Desafortunadamente, no existe un formato único para el análisis de datos de microsatélites. De esta manera, tenemos que convertir la matriz de datos originales (generalmente en Excel) a diferentes formatos, según los programas que estemos interesados en utilizar. Si lo hacemos a mano, esto puede implicar días o semanas. ¡Afortunadamente, existen varios programas que nos ayudan a convertir nuestra base de datos original a varios formatos en segundos! Esta es la lista de los programas que consideramos son los más útiles para este propósito:

Convert.

Microsatellite tool kit.

Create.

Programas para análisis de datos poblacionales

Usualmente nosotros colectamos poblaciones claramente definidas porque están geográficamente separadas de otros. Así finalmente nosotros agrupamos los individuos colectados en “poblaciones” o “demos”. Una vez definidas estos grupos a priori, nuestro análisis de datos tiene dos fases. La primera fase es generar una estadística descriptiva que nos indique el número de alelos por cada loci y por población, si hay equilibrio Hardy-Weinberg en los loci utilizados para el análisis y en las poblaciones y si hay equilibrio de ligamiento en los loci utilizados y en las poblaciones. La segunda fase generalmente implica determinar la cantidad de diversidad genética que presentan nuestros datos y el nivel de estructura genética que existe entre las poblaciones colectadas utilizando los estadísticos F de Wright, AMOVAS (Análisis Molecular de Varianza) y/o análisis de aislamiento por distancia. Los programas que utilizaremos con mayor énfasis durante el curso son los siguientes:

Arlequín.

GenAlEx (Este programa tiene el manual en español o en ingles).

Genepop.

También se puede usar en directamente en la web para no ocupar memoria en la computadora, lo cual es muy útil! Utilizando la siguiente pagina web.

También existen otros programas muy útiles para el análisis de poblaciones, pero que usaremos muy tangencialmente durante el curso y son los siguientes:

Fstat.

Genetix (¡Esta en francés pero es muy fácil de seguir!).

PowerMarker.

Programas para el asignamiento de individuos a poblacionales basado en estadística Bayesiana

Muchas veces, lo que nosotros creemos que son poblaciones definidas, normalmente no lo son porque hay mucha o poca migración entre ellas o en otros casos, estamos colectando a escalas geográficas que nos dificulta definir "a ojo" cuando comienza una población y cuando termina otra. Existen varios análisis basados en estadística Bayesiana que nos ayudan a determinar cual es el nivel de estructura genética en nuestros individuos colectados SIN una definición a priori de las poblaciones que colectamos. Los programas que mas utilizaremos durante el curso para este tipo de análisis son los siguientes:

Structure.

BAPS.

Primero hay que instalar el programa R para luego instalar Geneland (Este programa utiliza información geográfica explicita de cada individuo para el análisis).

Aislamiento por distancia

Estos programas nos ayudan a determinar si hay aislamiento por distancia entre individuos utilizando información geográfica explicita para el análisis.

SpaGeDi. También sirve para este propósito GenAlEx.

Coalescencia

Estos programas ayudan a calcular parámetros poblacionales como el tamaño poblacional, la tasa de crecimiento poblacional y la tasa de migración utilizando como base la probabilidad sobre todas las posibles genealogías de genes de los datos. Existen varios programas, pero el que discutiremos durante el curso es el siguiente:

Migrate.

Tamaño efectivo poblacional

Este grupo de programas nos ayudan a determinar el tamaño efectivo poblacional utilizando varios métodos y/o cuellos de botella recientes en las poblaciones.

Ne estimator.

Bottleneck.

Bases de datos para análisis

Durante el curso, vamos a analizar datos propios o usando bases de datos públicas. En el curso vamos a usar esta bases de datos de microsatélites en humanos.

Software adicional que podría ser interesante para l@s estudiantes

BioEdit

BioEdit: A free alternative to Sequencher. Windows OS only. Runs Clustal, translates DNA to amino acid sequence, calculates reverse complement, and reads raw chromatograms.

Mesquite

Mesquite: Includes modules for coalescent simulations, as well as manipulating & visualizing alignments. Calculates the reverse & complement of a DNA sequence, which the new MacClade does not. Sólo para Mac?

BayesPhylogenies

BayesPhylogenies: a powerful alternative to MrBayes by Pagel & Meade. BayesPhylogenies implements "mixture models": the user decides how many partitions to implement and the software estimates in what proportion each partition applies to each site. Remarkable!

SEQ-GEN

seq-gen, version 1.3: for simulating the evolution of DNA sequences on a given tree. Also by Andrew Rambaut.

TreeEdit

TreeEdit: Mac OS 9 and OS X only. This software has more features than TreeView.

Nested Clade (Phylogeographic) Analysis

If you want to run NCPA, be sure to inform yourself of the controversies. See the Referencias page.
The official network-building software for NCPA is TCS, which uses parsimony to infer a haplotype network, and uses frequency information to assign ancestral haplotypes. To use the network in NCPA, you would need GeoDis. These programs and the latest NCPA inference key should be available on David Posada's webpage.
Network 4.510 is a much easier program to use, and provides nice graphics. Networks are inferred by median-joining and other algorithms.

MORE USEFUL PAGES

Genetics Software Forum: Questions and answers for users of various evolutionary genetic software packages.


This page will be growing constantly, because there are always new software packages...