Bioinformatics Toolbox
Lea, analice y visualice datos genómicos y proteómicos
¿Tiene preguntas? Comuníquese con ventas.
¿Tiene preguntas? Comuníquese con ventas.
Bioinformatics Toolbox™ proporciona algoritmos y apps para secuenciación de próxima generación (NGS), análisis de microarrays, espectrometría de masas y ontología genética. Las funciones de esta toolbox permiten leer datos genómicos y proteómicos en formatos de archivo estándar como SAM, FASTA, CEL y CDF, así como en bases de datos online tales como Gene Expression Omnibus y GenBank® del NCBI. Puede explorar y visualizar estos datos con navegadores de secuencias, mapas de calor espaciales y clustergramas. La toolbox también proporciona técnicas estadísticas para detectar picos, imputar valores a datos ausentes y seleccionar características.
Puede combinar las funciones de la toolbox para utilizar flujos de trabajo bioinformáticos habituales. Es posible usar datos ChIP-Seq para identificar factores de transcripción, analizar datos RNA-Seq para identificar genes expresados diferencialmente, identificar variaciones en el número de copias y SNP en datos de microarrays, y clasificar perfiles de proteínas usando datos de espectrometría de masas.
Obtenga más información sobre la biología computacional.
Bioinformatics Toolbox proporciona algoritmos y técnicas de visualización para el análisis de secuenciación de próxima generación. Esta toolbox permite analizar genomas completos mientras se realizan cálculos en el nivel de resolución de par base. Puede utilizar el navegador NGS para visualizar e investigar alineamientos de lecturas cortas utilizando lecturas cortas de extremo único o de extremo emparejado. También se pueden crear rutinas de análisis personalizadas, como se muestra en los siguientes ejemplos.
Los conjuntos de datos utilizados en el análisis de secuenciación de próxima generación suelen ser demasiado grandes para caber en la memoria física. Bioinformatics Toolbox proporciona contenedores de datos especializados que permiten analizar genomas completos.
El objeto BioIndexedFile
permite acceder al contenido de archivos de texto que incluyen entradas de tamaño no uniforme, tales como secuencias, anotaciones y referencias cruzadas al conjunto de datos. Puede generar estos objetos a partir de tablas, archivos planos o formatos específicos de aplicaciones, tales como SAM, FASTA y FASTQ.
La clase BioMap
almacena información de secuencias de lecturas cortas, incluidos encabezados de secuencia, secuencias de lectura, puntuaciones de calidad y datos sobre alineamiento y asignación a una única secuencia de referencia. Puede utilizar métodos y propiedades de objetos para explorar, acceder, filtrar y manipular los datos contenidos en un objeto BioMap .
Puede utilizar varios métodos para normalizar los datos de microarrays, tales como regresión local, media global, desviación media absoluta (DMA) y normalización cuantil. Es posible aplicar estos métodos a todo el chip de microarrays o a regiones o bloques específicos. Las funciones de filtrado e imputación permiten limpiar los datos sin procesar antes de ejecutar rutinas de análisis y visualización.
Bioinformatics Toolbox permite realizar ajustes de fondo y calcular los valores de expresión génica (conjunto de sondas) a partir de datos de nivel de sonda de microarray Affymetrix® utilizando los procedimientos de promedio de multiarray robusto (RMA) y promedio de multiarray robusto de GC (GCRMA). Es posible aplicar la segmentación binaria circular a los datos de CGH de arrays y estimar la tasa de descubrimiento falso de diversas hipótesis que prueban datos de expresión génica en un experimento de microarrays. También se pueden normalizar conjuntos con rangos invariantes en intensidades de sonda para varios archivos CEL de Affymetrix o valores de expresión génica de dos condiciones experimentales diferentes.
Las rutinas especializadas para visualizar datos de microarrays incluyen gráficas de volcán, gráficas de cajas, gráficas logarítmicas, gráficas I-R y mapas de calor espaciales del microarray. También puede visualizar ideogramas con patrones de bandas G.
Con las rutinas de Statistics and Machine Learning Toolbox™, puede clasificar los resultados, realizar clustering jerárquico y de K-means y representar los datos del microarray en visualizaciones estadísticas, tales como clustergramas 2D con un orden óptimo de hojas, mapas de calor, gráficas de componentes principales y árboles de clasificación.
Bioinformatics Toolbox proporciona un conjunto de funciones para el análisis de datos de espectrometría de masas. Estas funciones permiten preprocesar, clasificar e identificar marcadores a partir de datos SELDI, MALDI, LC/MS y GC/MS. Las funciones de preprocesamiento incluyen corrección de línea de referencia, suavizado, calibración y remuestreo. Puede alinear datos de espectro sin procesar utilizando el eje M/Z y realizar el alineamiento de tiempo de retención en datos LC/MS y GC/MS. Se pueden representar simultáneamente diversos espectros de forma gráfica.
Es posible suavizar, alinear y normalizar espectros y, después, usar herramientas de clasificación y aprendizaje estadístico para crear clasificadores e identificar biomarcadores potenciales.
Bioinformatics Toolbox permite aplicar la teoría gráfica básica a matrices dispersas. Puede crear, ver y manipular gráficas tales como mapas de interacción, gráficas jerárquicas y vías celulares. Es posible determinar y ver las vías más cortas en gráficas, probar ciclos en gráficas dirigidas y encontrar isomorfismo entre dos gráficas.
Bioinformatics Toolbox proporciona funciones que se basan en los algoritmos de clasificación y aprendizaje estadístico de Statistics and Machine Learning Toolbox, tales como:
Bioinformatics Toolbox permite acceder a la base de datos Gene Ontology desde MATLAB®, analizar archivos anotados de ontología génica y obtener subconjuntos de ontología, tales como ancestros, descendientes o parientes.
Bioinformatics Toolbox proporciona herramientas de visualización y análisis de secuencias para datos de secuencias genómicas y proteómicas. Puede realizar diversos análisis, incluidos varios alineamientos de secuencias, además de crear, visualizar y manipular interactivamente árboles filogenéticos.
La toolbox proporciona funciones, objetos y métodos para el análisis de secuencias, tales como secuencia en pares, perfil de secuencias y alineamiento de varias secuencias. Por ejemplo:
La toolbox permite manipular y analizar las secuencias para obtener una comprensión más profunda de sus datos. Puede hacer lo siguiente:
Esta toolbox permite visualizar secuencias y alineamientos. Puede ver mapas lineales o circulares de secuencias anotadas con las funcionalidades de GenBank. Es posible visualizar diagramas de estructura secundaria de una secuencia de ARN. Los visores interactivos permiten explorar y modificar alineamientos de dos o más secuencias.
Esta toolbox permite crear y editar árboles filogenéticos. Se pueden calcular distancias en pares entre secuencias de nucleótidos o aminoácidos alineadas o no alineadas utilizando una amplia gama de métricas de similitud, tales como Jukes-Cantor, distancia p, puntuación de alineamiento o un método de distancia definido por el usuario. Los árboles filogenéticos se crean utilizando el enlace jerárquico con diversas técnicas, incluidas la unión de vecinos, el enlace único y completo, y el promedio aritmético de grupos de pares no ponderados (UPGMA).
La toolbox soporta la ponderación y el cambio de raíz de árboles, el cálculo de subárboles y el cálculo de la forma canónica de los árboles. El visor de árboles filogenéticos permite podar, reordenar y renombrar ramas, explorar distancias y leer o escribir archivos con formato Newick. También se pueden utilizar las herramientas de anotación de MATLAB para crear árboles con calidad de presentación.
La toolbox proporciona técnicas de análisis de secuencias de proteínas, incluidas rutinas para calcular las propiedades de una secuencia peptídica tales como composición atómica, punto isoeléctrico y peso molecular. Puede determinar la composición de aminoácidos de las secuencias de proteínas, escindir una proteína con una enzima y crear gráficas backbone y gráficas de Ramachandran de datos PDB. Se puede utilizar la herramienta de secuencias para ver las propiedades de una secuencia de aminoácidos, o bien se puede utilizar el visor de moléculas para visualizar y manipular estructuras moleculares en 3D.
Puede acceder a formatos de archivo estándar de datos biológicos, bases de datos online y sitios web. Bioinformatics Toolbox permite:
MATLAB proporciona herramientas que permiten convertir su programa de análisis de datos en una aplicación de software personalizada. Entre ellas se incluyen herramientas de desarrollo para crear interfaces de usuario, un entorno de desarrollo integrado visual y un generador de perfiles. Los productos de despliegue de aplicaciones de MATLAB permiten integrar los algoritmos de MATLAB con aplicaciones C, C++ y Java™ disponibles, desplegar los algoritmos desarrollados y las interfaces personalizadas como aplicaciones independientes, convertir algoritmos de MATLAB en componentes de Microsoft® .NET o COM a los que se puede acceder desde cualquier aplicación basada en COM y crear complementos de Microsoft Excel®.
Puede integrar MATLAB con herramientas de bioinformática de uso habitual, como BioPerl, servicios web basados en SOAP y complementos COM.