Información

Generación de coordenadas cartesianas de cada átomo en la cadena de proteínas a partir de las coordenadas internas usando python o algún software

Generación de coordenadas cartesianas de cada átomo en la cadena de proteínas a partir de las coordenadas internas usando python o algún software


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Estoy tratando de calcular las coordenadas cartesianas de los átomos de la columna vertebral y los átomos de la cadena lateral (solo C beta) para un conjunto dado de coordenadas internas (longitudes de enlace, ángulos de enlace y ángulos diedros) .He escrito un código para la columna vertebral solo (es decir) para construir coordenadas cartesianas de cada átomo en la columna vertebral a partir de las respectivas coordenadas internas (sin cadenas laterales). Sin embargo, supe que esto se puede hacer en un software (tal vez en PyMol o VMD). Soy completamente un principiante en este campo de la bioquímica / bioinformática / biofísica. ¿Es realmente posible hacer esto en software como PYMOL / VMD? Estaré muy feliz si puedo hacer esto en Python. Quiero generar coordenadas cartesianas de un tetrapéptido dado para todos los ángulos posibles de Ramachandran (dentro de la región permitida)


Introducción

Este tutorial está diseñado para proporcionar una introducción a las simulaciones de dinámica molecular con Amber. Está diseñado alrededor de AMBER Tools v14 y asume que no ha usado Linux o Amber antes. Está diseñado para nuevos usuarios que desean aprender a ejecutar simulaciones de dinámica molecular. Sin embargo, se asume que tiene una máquina con AmberTools v15, VMD y xmgrace instalados correctamente.

AMBER son las siglas de Assisted Model Building and Energy Refinement. Se refiere no solo a los programas de dinámica molecular, sino también a un conjunto de campos de fuerza que describen la función de energía potencial y los parámetros de las interacciones de biomoléculas.

Para ejecutar una simulación de dinámica molecular en ámbar, las interacciones de cada molécula se describen mediante un campo de fuerza molecular. El campo de fuerza tiene parámetros específicos definidos para cada molécula.

lijadora es el motor MD básico de Amber. pmemd es la implementación de alto rendimiento del motor MD que contiene un subconjunto de características de lijadora. pmemd también se puede ejecutar con aceleración desde unidades de procesamiento de gráficos (GPU).

  1. parm7: el archivo que describe el parámetro y la topología de las moléculas en el sistema
  2. rst7: el archivo que describe las coordenadas moleculares iniciales del sistema
  3. mdin: el archivo que describe la configuración del motor Amber MD

Organización del directorio

El siguiente tutorial utilizará la organización de directorios que se prepara a continuación. Esta organización específica no es necesaria, pero se recomienda. Se utilizará el comando "mkdir" que crea una nueva carpeta en la que se pueden guardar los archivos. Para navegar en un directorio, use el comando "cd" seguido del nombre del directorio. Para cambiar al directorio del siguiente nivel, use el comando "cd ..".

Dentro del entorno Bash Shell:

Los ocho directorios deben crearse ahora y esto se puede confirmar visualmente con el comando "ls".


Optimización de la estructura de la proteína basada en la secuencia mediante el uso de un algoritmo de recocido simulado mejorado en un modelo de grano grueso

La comprensión de la estructura de las proteínas es vital para determinar la función biológica. Presentamos un algoritmo mejorado de recocido simulado (ESA) para investigar la estructura tridimensional (3D) de proteínas en un modelo de grano grueso. Dentro del algoritmo, ajustamos las ecuaciones de exploración para lograr una buena intensidad de búsqueda. Con ese fin, nuestro algoritmo utilizó (i) un operador de perturbación multivariable para la diversificación de la solución, (ii) una función de signo para mejorar la aleatoriedad de la solución y (iii) tomar la operación restante realizada en un número de punto flotante para abordar los solución de rango. Al monitorear el valor energético a lo largo de la simulación, se puede encontrar el estado óptimo de energía. El algoritmo de la ESA se probó en secuencias de proteínas artificiales y reales con diferentes longitudes. Los resultados muestran que nuestro algoritmo supera al algoritmo de recocido simulado convencional y puede competir con los algoritmos informados anteriormente. Especialmente, nuestro algoritmo puede obtener conformaciones plegables con características estructurales específicas. Un análisis más detallado muestra que la simulación de la trayectoria de búsqueda de la energía más baja puede exhibir un comportamiento termodinámico de plegamiento de proteínas.

Esta es una vista previa del contenido de la suscripción, acceda a través de su institución.


Opciones del cuadro de diálogo

Bola y palo Al seleccionar esta opción, se habilita la representación de bola y palo (esfera y cilindro) de los átomos y enlaces, respectivamente. Esto también habilita las siguientes cuatro opciones:

Mostrar átomos Marcar / desmarcar esta casilla habilitará / deshabilitará la salida de esferas para átomos.

Escalar los átomos por sus tamaños relativos

Enlaces de color basados ​​en sus átomos de enlace

Al seleccionar esta opción, se habilita la representación de la columna vertebral de la proteína (muestra los carbonos alfa de la proteína). Esto también habilita las siguientes dos opciones.

Mostrar átomos Marcar / desmarcar esta casilla habilitará / deshabilitará la salida de esferas para átomos.

Escalar los átomos por sus tamaños relativos

Al seleccionar esta opción, se habilita la representación de cinta de la proteína (muestra la interpretación de cinta de los carbonos alfa de la proteína).

Esto también habilita las siguientes seis opciones.

Mostrar como hebras Si marca esta casilla, se mostrará la proteína representada por las hebras de las cintas, si deja esta casilla sin marcar, se mostrará la proteína representada por una cinta sólida.

NOTA: Elegir la opción Mostrar como hebras requiere mucha mano de obra para el programa, ya que utiliza una gran cantidad de cilindros pequeños para aproximar las hebras, lo que puede ralentizar significativamente el programa. Si establece el Número de polígonos de subdivisión en un número menor, reducirá el número de cilindros que se necesitan para producir las hebras y acelerará enormemente el importador.

Normal de vértice suave (solo disponible si Mostrar como hebras está desmarcado)

Espesor de hebra (solo disponible si se marca Mostrar como hebras)

Número de polígonos de subdivisión

El número de polígonos de subdivisión establece el número de polígonos que se utilizarán para aproximar la cinta entre dos puntos de la curva spline. Cada punto de la curva spline corresponde a un carbono alfa, por lo tanto, si tiene 20 carbonos alfa y establece el número de polígonos de subdivisión en 10, el importador dibujará la cinta usando 20 * 10 = 200 polígonos. Cuanto mayor sea el número de polígonos de subdivisión, más suave se volverá la cinta. Si bien es posible cualquier número entero positivo, los valores entre 5 y 15 producen los mejores efectos y los más cercanos a 15 producen hélice y giros más suaves.

NOTA: Elegir la opción Mostrar como hebras requiere mucha mano de obra para el programa, ya que utiliza una gran cantidad de cilindros pequeños para aproximar las hebras, lo que puede ralentizar significativamente el programa. Si establece el Número de polígonos de subdivisión en un número menor, reducirá el número de cilindros que se necesitan para producir las hebras y acelerará enormemente el importador.

Multiplicador de ancho de hélice / hoja

  1. CPK (Corey, Pauling, Kultun): este esquema colorea los átomos según su tipo elemental. Une todos los valores predeterminados a un color gris.
  2. Modelo: este esquema establece cada modelo en el archivo PDB con un color diferente. Los enlaces están coloreados como los átomos.
  3. Cadena: este esquema colorea cada átomos y se unen dentro de una cadena del mismo color. Esta opción actúa como Monocromo para archivos MOL.
  4. Monocromo: este esquema colorea todo del mismo color.
  5. Amino / Shapely: este esquema colorea los átomos y los enlaces según el tipo de grupo amino / nucleósido. Esta opción actúa como Monocromo para archivos MOL.

Nivel de detalle de átomo / enlace

Este menú desplegable ofrece una lista de opciones de detalle de esfera / cilindro que pueden acelerar (configuración más baja) o suavizar (configuración más alta) las esferas y cilindros dibujados en la pantalla o cuando se reexportan a otro formato de archivo.

Por ejemplo, "Predeterminado (s = 12x12, c = 6)" establece las subdivisiones geométricas internas de las esferas en 12x12 y las subdivisiones de los cilindros en 6. La selección de números más altos creará esferas y cilindros más suaves. Una vez finalizado el proceso de importación, puede ajustar las subdivisiones seleccionando el elemento de menú "Editar / Preferencias / Subdivisiones geométricas globales" y luego cambiando los parámetros de subdivisión de Cilindro y Esfera. Debido a que el importador de PDB crea cilindros y esferas paramétricos (se crea una representación de polígono sobre la marcha solo durante el tiempo de visualización), se volverán a generar sobre la marcha con las nuevas subdivisiones cuando dichos parámetros se cambien solo durante la exportación o durante la reducción de polígonos. los cilindros y esferas paramétricos se convierten en una representación poligonal.


Discusión

Como lo ilustra la validación del ciclo termodinámico cerrado, pmx generó con éxito estructuras y topologías híbridas para diferentes campos de fuerza. Esta prueba también demuestra que las estructuras y topologías se crean de forma coherente en las direcciones A2B y B2A, es decir, A se describe de forma idéntica en las topologías A2B y B2A y lo mismo se aplica a B. Es la coherencia interna la que permite la cancelación del maniquí. efectos durante las transiciones en el sistema simple en una configuración de caja doble, lo que posteriormente conduce a un ciclo termodinámico cerrado.

Las comprobaciones de validación realizadas no proporcionan información sobre la precisión de los cálculos alquímicos en términos de concordancia con las mediciones experimentales. Sin embargo, los resultados de los ciclos termodinámicos cerrados dan una estimación aproximada de una incertidumbre estadística que podría esperarse para un cierto tipo de mutación en un campo de fuerza de interés. Por ejemplo, el cambio de carga que implica mutaciones exhibe fluctuaciones más grandes, que pueden atribuirse en parte a los artefactos de tamaño finito relacionados con el tratamiento de interacciones electrostáticas. 34

En el paso de validación, la glicina que implicaba mutaciones se descartó intencionalmente debido a las características específicas del residuo de glicina. Durante una transición alquímica de la glicina, la cadena lateral de un nuevo aminoácido puede aparecer en una región de alta energía de la trama de Ramachandran. A su vez, esto produciría una pobre convergencia del cálculo de energía libre, lo que no es instructivo para el propósito actual de la validación del método. Otro problema relacionado con la glicina es que en la implementación actual de Gromacs 17 no es posible la transformación de la corrección CMAP. Por lo tanto, para una glicina que implique una mutación en un campo de fuerza de la familia Charmm, CMAP debe desactivarse. Aunque en este estudio no se presentan mutaciones en glicina, se incluyen en las bibliotecas de mutaciones pmx. Sin embargo, se recomienda realizar pruebas cuidadosas en casos específicos para tales mutaciones.

La prolina que involucra mutaciones no está respaldada actualmente, ya que existen varias dificultades relacionadas con la transformación alquímica de la prolina que requerirían una investigación adicional. Primero, la creación / rotura de la unión requerida evitaría el uso de las restricciones en todas las uniones. Si no se utilizan restricciones, la creación de un enlace puede parecer que converge lentamente en términos de energía libre. Otra advertencia radica en atrapar la prolina en una forma estereoisomérica rara vez poblada al crear un enlace. Una solución aproximada a la mutación de prolina podría ser dejar todos los enlaces intactos y apagar los ángulos y diedros que unen N y Cα átomos a través del anillo de pirrolidina. Sin embargo, todas estas opciones requieren una mayor investigación.

pmx permite la generación de bibliotecas de mutaciones específicas del campo de fuerza a través de las utilidades de generate_hybrid_residue.py. La herramienta fue diseñada para ser compatible con las familias de campos de fuerza Amber, Charmm y OPLS. Por lo tanto, la incorporación de un nuevo campo de fuerza relacionado es sencilla. Sin embargo, debido a las características específicas de cada campo de fuerza, es posible que se requieran modificaciones adicionales al software para agregar otros campos de fuerza. Por ejemplo, las definiciones de los parámetros vinculados en la familia de campos de fuerza GROMOS 35 dentro del marco de Gromacs difieren de los otros campos de fuerza. Por lo tanto, la creación de un puerto GROMOS naturalmente se volvería más complicado. Otra aplicación útil del marco de generación de bibliotecas sería la creación de una base de datos de mutaciones que involucre aminoácidos no estándar. Esto permitiría la evaluación computacional de los efectos de la modificación postraduccional en términos de energías libres. Aunque la generación de nuevas bibliotecas de mutaciones es posible, requiere un uso avanzado de pmx. Para la estructura híbrida y la generación de topología utilizando los campos de fuerza proporcionados (Tabla 1), el usuario simplemente debe seguir los pasos descritos en el ejemplo práctico de la sección Resultados.

Los objetivos para el futuro desarrollo de pmx incluyen la generación de bibliotecas de mutaciones de aminoácidos no estándar antes mencionada. Otra dirección implica la actualización de la mutación de la base nucleica al nuevo marco pmx de una implementación anterior. 15 Una perspectiva más técnica es garantizar la compatibilidad de pmx con Python 3.0 y versiones superiores.


Conclusiones

Este estudio predijo la estructura 3D de la proteína de la bomba de eflujo de múltiples fármacos Rv1258c que es importante para modelar las interacciones proteína-fármaco. Las estructuras 3D de Rv1258c y la plantilla homóloga 1pw4 también se utilizaron más en estudios de simulación dinámica molecular dentro de una bicapa lipídica POPE / POPG y mostraron un comportamiento cinético similar basado en la dinámica. La extracción de un grupo que representaba una conformación metaestable de Rv1258c permitió la identificación de un sitio de unión putativo dentro de una hendidura de unión cuando el canal de proteínas tiene una conformación abierta. Identificamos 246 ligandos putativos mediante estudios de acoplamiento y también validamos los residuos Ser26, Ser45, Glu243, Trp32 como socios de interacción cruciales responsables de la mayor afinidad. Se comprará una selección de los mejores compuestos para validarlos. in vitro como moduladores potenciales del tratamiento antimicobacteriano. Las implicaciones de este estudio proporcionarán alternativas a la piperina y el verapamilo para el tratamiento de la tuberculosis para mejorar la susceptibilidad de la bacteria a varios antimicrobianos mediante la inhibición de la bomba de eflujo Rv1258c.


Física versus acoplamiento basado en el conocimiento

Resolver las ecuaciones de movimiento para dos proteínas en una orientación relativa arbitraria, utilizando campos de fuerza de resolución atómica, no las acopla en la configuración correcta. La razón es la extrema complejidad del paisaje energético del sistema & # x02014 su tramo en el espacio multidimensional de sus coordenadas y la multiplicidad de los mínimos energéticos (24,42) & # x02014 todo ello agravado por la naturaleza aproximada del paisaje, con barras de error que son a menudo más grandes que la profundidad relativa de las cuencas de energía.

Aún así, si uno está interesado solo en la ubicación del mínimo global de la energía libre, correspondiente a la estructura nativa del complejo, sin tener en cuenta las vías de enlace, existen protocolos de muestreo no físicos que buscan de manera eficiente el paisaje y brindan la solución. . Estos protocolos tratan el problema como una optimización global y encuentran el mínimo global a través de varias técnicas de programación no lineal, incluida la más trivial (y efectiva) de búsqueda sistemática (7). La principal razón de su éxito, dada la complejidad del paisaje, es que el mínimo global es significativamente diferente de los mínimos locales. No solo es más profundo, como se supone que es por definición, sino más profundo por un margen significativo (43), y tiene una serie de otras características distintivas, como el tamaño y la robustez (28,42). Por lo tanto, las inevitables aproximaciones comunes de los paisajes energéticos, aunque distorsionan la jerarquía de mínimos locales, no son lo suficientemente aproximadas para eliminar la diferencia entre los mínimos globales y locales (o al menos para eliminar el mínimo global real de los principales candidatos). Aunque tales protocolos de minimización no son físicos, debido a que el paisaje representa energía basada en la física (incluso en su forma más simple de complementariedad estérica, que no es otra que el mínimo de energía de van der Waals), tales enfoques todavía pasan por físicos (a menudo entre no físicos, y físicos que saben biología). Aún así, en muchos de estos enfoques, el único concepto físico es la complementariedad estérica trivial, y el resto son técnicas tomadas de la informática y otras disciplinas de la ingeniería (reconocimiento de patrones, optimización, aprendizaje automático, etc.). Tales enfoques han sido dominantes en el campo del acoplamiento de proteínas desde sus inicios.

Sin embargo, toda la noción de física sale por la ventana junto con los enfoques de acoplamiento recientes basados ​​únicamente en la similitud con los complejos / plantillas existentes determinados experimentalmente. Si dos pares similares de proteínas generalmente se unen de manera similar, y uno de ellos está cocristalizado, para el otro par puede que no sea necesario muestrear el paisaje intermolecular extremadamente complejo & # x02014 uno puede simplemente llegar directamente al mínimo global presunto (el correcto estructura del complejo) asumiendo similitud con el complejo determinado experimentalmente.

El modelado estructural por similitud (modelado comparativo) de proteínas individuales ha existido durante mucho tiempo, desde el establecimiento de la correlación entre la secuencia y la similitud de estructura en los años 80 (44). Tal similitud sugirió que si la secuencia de la proteína A, cuya estructura se va a modelar, es similar a la secuencia de la proteína A & # x02032, cuya estructura se conoce, se puede poner la proteína A en el mismo pliegue que la proteína A & # x02032. Eso proporcionó una mejora dramática en términos de confiabilidad de la predicción sobre el proverbial & # x02018problema de plegamiento de proteínas & # x02019 donde se supone que la estructura de la proteína debe modelarse basándose solo en la secuencia de aminoácidos. La predicción de la resolución atómica de la estructura de la proteína se redujo al reempaquetado de las cadenas laterales y al ajuste de la columna vertebral (a menudo involucrando bucles flexibles) & # x02014 una tarea difícil, pero bastante manejable, incomparable con la máxima complejidad de la predicción de estructura de secuencia sola. El aspecto crítico de tal enfoque es la disponibilidad de las plantillas determinadas experimentalmente (en gran parte por cristalografía de rayos X). Se puede fechar el surgimiento del modelo comparativo con la expansión del AP que en ese momento se había vuelto lo suficientemente grande como para proporcionar un conjunto significativo de plantillas. Actualmente, con el rápido crecimiento de PDB, el modelado basado en plantillas de proteínas individuales es un enfoque dominante para la predicción de estructuras de proteínas (45). El modelado de los procesos físicos relacionados con el plegado sigue siendo un gran desafío, y bien puede seguir siéndolo en el futuro. Sin embargo, la expansión en curso de PDB posiblemente seguirá simplificando aún más el atajo de predicción no física a la estructura de equilibrio, dado el alcance estructural limitado del universo de proteínas (46), que provoca la reducción del conjunto de proteínas con el nuevo pliegue ( 45).

En el acoplamiento proteína-proteína, la similitud entre proteínas en complejos se puede evaluar mediante la comparación / alineación de secuencias (47 & # x0201349), secuencias y estructuras (enhebrado) (50 & # x0201352), o simplemente las estructuras (52 & # x0201358) porque el Se supone que las estructuras de la proteína que se va a acoplar se conocen por la propia definición de acople. Sin embargo, el campo de acoplamiento de proteínas, a diferencia de la predicción de proteínas individuales, no se ha aprovechado en gran medida del modelo basado en plantillas. Una razón es que el acoplamiento proteína-proteína es más joven y, por lo tanto, menos avanzado (la comunidad de acoplamiento de proteínas también es significativamente más pequeña que la del modelado de proteínas individuales, según el número de participantes en las evaluaciones de predicción de toda la comunidad (& # x0223c200 en CASP vs. & # x0223c40 en CAPRI) y objetivos de predicción (45,59).

Otra razón ha sido el relativo éxito del acoplamiento tradicional sin plantilla (ab initio), en contraposición al modelado ab initio de las proteínas individuales. El acoplamiento de cuerpo rígido (seis grados de libertad) es una aproximación útil y significativa para muchos complejos, mientras que cualquier aproximación práctica en el plegamiento de proteínas implica el espacio de búsqueda conformacional de una dimensionalidad mucho mayor.

Aún así, la razón principal del dominio casi completo del acoplamiento ab initio posiblemente ha sido la presunta falta de plantillas proteína-proteína. Los complejos proteína-proteína son generalmente más difíciles de cristalizar que las proteínas individuales, lo que limita el número de moldes. Además, las proteínas participan potencialmente en múltiples interacciones proteína-proteína, lo que hace que el número de objetivos de predicción proteína-proteína sea mayor que el de las proteínas individuales. Los esfuerzos a gran escala para determinar las estructuras de las proteínas, como la Protein Structure Initiative (60), que estableció una línea de determinación de estructuras de alto rendimiento, proporcionaron una cantidad sustancial de información estructural (y una parte significativa de los objetivos de predicción para la evaluación de la comunidad). de predicción de estructura CASP (45)). Sin embargo, ha sido mucho menos instrumental en el suministro de las estructuras de los complejos proteína-proteína (incluida la falta de objetivos para la evaluación comunitaria de las interacciones previstas CAPRI (59)), presumiblemente debido a la relativa dificultad de cristalizar los complejos proteicos.

Por lo tanto, la noción general en el campo del acoplamiento de proteínas ha sido que, aunque el acoplamiento comparativo puede ser más confiable y preciso que el acoplamiento libre tradicional, similar al modelado comparativo para el modelado de proteínas individuales, la falta de plantillas relega el uso práctico de este acercamiento a algún tiempo futuro. Eso fue hasta que se verificó la presunción de falta de plantillas en el AP existente. El estudio sistemático (61) mostró que, sorprendentemente, las plantillas de acoplamiento están fácilmente disponibles para los complejos que representan casi todas las interacciones proteína-proteína conocidas, siempre que los propios componentes tengan una estructura conocida o puedan construirse por homología.

El estudio se basa en 126.897 interacciones de proteínas que involucran pares de proteínas en 771 especies. Los modelos de complejos basados ​​en alineación de estructuras fueron generados por TM-align (62). La similitud estructural de dos complejos se evaluó mediante las puntuaciones mínimas de TM (la más pequeña de las puntuaciones de TM del receptor y del ligando (62)). La figura & # x000a03 muestra cómo la interacción RMSD (47), una medida de la similitud del modo de unión, se correlaciona con la puntuación mínima de TM, una medida de la similitud estructural entre los complejos, en una comparación por pares de todos a todos de 989 complejos cocristalizados. La transición de fase se produce cerca de la puntuación mínima de TM & # x000a0 = 0,4, con modos de enlace en su mayor parte similares arriba y mayormente diferentes abajo.

Similitud estructural de los modos de unión versus similitud estructural de las proteínas que interactúan. La similitud estructural de los modos de unión se describe mediante la interacción RMSD (47). La similitud estructural de las proteínas que interactúan se describe mediante la puntuación mínima de TM & # x02014, la más baja de las puntuaciones de TM de proteína de dos componentes (62). La transición brusca a RMSD de interacción pequeña se produce en el valor de 0,4 de similitud estructural. Para ver esta figura en color, conéctese en línea.

Para evaluar su valor predictivo, en la forma en que la predicción ocurriría en un escenario de caso real, el enfoque se probó en estructuras proteína-proteína más nuevas en PDB lanzadas en 2009 & # x020132011, utilizando estructuras de plantilla más antiguas publicadas antes de 2009. Fig. & # X000a04 muestra la distribución de la interfaz RMSD (calculada entre la interfaz nativa del ligando en la radiografía y las posiciones predichas después de superponer receptores), con un 36% de los complejos modelados cerca de la estructura nativa del complejo (interfaz RMSD & # x0003c5 & # x000a0 y # x000c5).

Evaluación comparativa del acoplamiento basado en plantillas. La distribución de las precisiones de los complejos predichas se muestra en relación con la estructura cocristalizada. La evaluación comparativa de los complejos PDB lanzada en 2009 & # x020132011 se basó en estructuras de plantilla de 2008 y anteriores. En el 36% de los & # x000a0complexes, la estructura predicha es cercana a la nativa (interfaz RMSD & # x0003c5 & # x000c5). Para ver esta figura en color, conéctese en línea.

Para determinar en qué medida se puede utilizar el acoplamiento basado en plantillas para modelar interacciones proteicas conocidas en genomas completos, se construyeron modelos de homología de proteínas individuales y se buscaron plantillas de sus complejos en PDB. Sorprendentemente, se encontraron moldes estructurales para casi todos (99%) los complejos en los que la estructura de ambos componentes se conoce experimentalmente o podría construirse por homología (Fig. & # X000a05). Como se muestra en la Fig. & # X000a04, se estima que más de un tercio de ellos son correctos. Por lo tanto, cuando no se encontró una plantilla para el complejo, no hubo plantillas para construir modelos para uno o ambos de sus componentes. Por lo tanto, la cobertura debería mejorar a medida que se determina la estructura de más proteínas individuales.

Cobertura estructural de interacciones proteicas para cinco genomas con el mayor número de interacciones conocidas. Los complejos con estructura de rayos X están en rojo, los complejos con una plantilla de secuencia están en verde y los complejos para los que se conoce la estructura de los monómeros están en azul & # x02014 se encuentran plantillas estructurales para & # x0223c100% de dichos complejos. Se estima que & # x0003e1 / 3 de estas plantillas son correctas (Fig. & # x000a04). Para ver esta figura en color, conéctese en línea.


Rosetta 3.8

Nuevo XML de RosettaScripts

El XML que soporta RosettaScripts se ha refactorizado por completo. Rosetta ahora valida los archivos XML de entrada con un "esquema XML" y puede determinar mejor al comienzo de una ejecución si todas las opciones XML son legales y funcionales. El lector XML ahora puede identificar errores de manera mucho más específica y ofrece mensajes de error más útiles.

Ahora también puede obtener ayuda de la línea de comandos para clases habilitadas para XML con el indicador -info, p. Ej. -info PackRotamersMover y un script rosetta de plantilla formateado en blanco ejecutando la aplicación rosetta_script sin dar la opción -parser: protocol.

Una consecuencia de esta refactorización es que los scripts XML anteriores a Rosetta3.8 ya no son XML legales; ofrecemos una herramienta para convertir el estilo antiguo, pseudo-XML al formato actual en tools / xsd_xrw / rewrite_rosetta_script.py (esto está en la carpeta de nivel superior de herramientas, no la carpeta de código principal). La gran mayoría de las clases tienen documentación completa cuando encuentras una que no la tiene, ¡quéjate a (doc feedbacks email) y háznoslo saber!

Un nuevo distribuidor de trabajos, JD3, está listo para su uso. Esto es en su mayoría invisible para los usuarios finales, pero permitirá que se creen protocolos más complejos en lugar de instrucciones de varios pasos y aplicaciones. Esperamos poder disfrutar de fantásticas aplicaciones habilitadas para JD3 en futuras versiones.

Soporte para más PDB

Aunque la mayoría de las mejoras se realizaron en Rosetta3.7, continuamos mejorando la fracción de PDB sin modificar que Rosetta puede manejar. (No se preocupe, siempre hemos podido manejar bien las proteínas canónicas, pero estamos haciendo un trabajo cada vez mejor con cosas extrañas como el fluoróforo GFP, ligandos concatenados químicamente, glicanos, ARN, etc.).

Compilaciones Cxx11

Rosetta activó las funciones de Cxx11 en su C ++. Esto desaprueba la compatibilidad de muchos compiladores más antiguos. Consulte https://www.rosettacommons.org/docs/latest/build_documentation/Cxx11Support para obtener más información.

Denominación ejecutable

Hemos ajustado el sistema de compilación de modo que los ejecutables compilados se denominen de forma un poco más simple. Los nombres tripartitos (rosetta_scripts.default.linuxgccrelease) funcionarán como antes, pero ahora los nombres de dos partes rosetta_scripts.linuxgccrelease) siempre apuntarán hacia la compilación predeterminada, en lugar de la compilación más reciente.

Beta_nov15

¡Tenemos una nueva función de puntuación! Aún no tiene su nombre oficial, pero está publicado. Puede probarlo con -beta_nov15 en la línea de comando y & ltScoreFunction name = "beta_nov15" weights = "beta_nov15" & gt en RosettaScripts mientras tanto. Tenga en cuenta que la marca de línea de comandos -beta_nov15 es necesaria para cualquier uso de la nueva función de puntuación, ya que ciertos objetos relacionados con la puntuación deben inicializarse de manera diferente (lo que significa que actualmente no es posible puntuar con talaris2014 y beta_nov15 en la misma sesión de Rosetta).

Nuevos potenciales de Ramachandran

El código de puntuación Ramachandran de Rosetta se ha refactorizado en gran medida. El software ahora admite los potenciales de Ramachandran para aminoácidos arbitrarios. Estos se cargan de forma perezosa, por lo que no contribuyen a la huella de memoria de Rosetta a menos que sean necesarios. El código de Ramachandran refactorizado ahora es parte del término de puntuación rama_prepro en la función de puntuación beta_nov15. La puntuación de Ramachandran también permite ahora diferentes potenciales de Ramachandran para las posiciones que preceden a los residuos de prolina y para las posiciones que no preceden a los residuos de prolina.

Funciones nuevas o actualizadas

Herramientas de RosettaScripts

Diverso

  • Transformar el motor en el acoplamiento de ligandos (corrección de errores)
  • JD2 MPIWorkPartitionJobDistributor (la mejor opción de MPI para ejecuciones de MPI pequeñas) divide los trabajos de una manera que es más eficiente para ejecuciones reiniciadas
  • Cambios en el almacenamiento en caché del formato binario de la biblioteca Dunbrack. Como consecuencia, no instale Rosetta 3.8 sobre una instalación existente, querrá que esta biblioteca se reconstruya en la primera ejecución.
  • Entrada y salida mmCIF
  • Corrección de errores para archivos de restricciones que afectan la numeración de residuos numerados PDB de la cadena A
  • Impresión de registros HELIX y SHEET en PDB (-out :: file :: output_secondary_structure)
  • Impresión de registros LINK a PDBS (-out :: file :: write_pdb_link_records)
  • Corrección de errores para resfiles con acoplamiento de ligandos
  • Relájese: corrección de errores en -constrain_relax_to_native_coords
  • Desinfectantes de código y herramientas de análisis estático en línea (nos ayuda a escribir un código mejor y más a prueba de errores, debería ser inviable para el usuario final)
  • Se actualizó la versión de backend de SQLite a 3.16.2 desde 3.7.4
  • correcciones de errores para varios compiladores no específicamente compatibles (gcc 5.4 gcc 6.2.0, clang 3.9.0 e ICC 14.0)

Químicas no proteicas

  • La aplicación simple_cycpep_predict ha tenido varias correcciones de errores y ahora admite muestreo cuasi-simétrico para péptidos con simetrías cN o cN / m.
  • CycpepSymmetryFilter Filtros basados ​​en si un péptido tiene una simetría cíclica deseada (c2, c3, c4, etc.) o cíclica espejo (c2 / m, c4 / m, c6 / m, etc.).
  • Corrección de errores de PeptideCyclizeMover
  • Glicanos:
    • Actualizaciones de GlycanRelax y nuevos métodos para manejar la conectividad de glicanos ramificados (GlycanTreeSet) - úselo con PyRosetta: pose.glycan_tree_set ()

    Instalación desde la fuente y de la interfaz Rosetta [editar | editar fuente]

    Phenix se puede instalar desde un binario instalador. A pesar de esta designación, tiene los archivos fuente para volver a compilarlos. Sin embargo, normalmente no es necesario volver a compilar y requiere especificar la opción --source en el comando ./install.

    phenix.rosetta_refine (y phenix.mr_rosetta) requiere una instalación de Rosetta que funcione. La forma más sencilla es descargar uno de los paquetes semanales de Rosetta binary + source (que se encuentra en este enlace). El archivo tar solo tiene que ser binarios descomprimidos y las bibliotecas están precompiladas. Su .bashrc debe modificarse para tener, por ejemplo,

    (o similar para .cshrc) y

    debe ejecutarse, el último paso lleva horas cuando se realiza por primera vez. (Según los documentos, esto solo es necesario para rosetta_refine).


    Ver el vídeo: Geom creation using cartesian coordinates (Diciembre 2022).