Información

¿Cuántas proteínas de la AP tienen función desconocida?

¿Cuántas proteínas de la AP tienen función desconocida?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Me preguntaba cuántos de los archivos del Protein Data Bank (PDB) tienen una función desconocida. El único documento que puedo encontrar en una búsqueda en Internet es este de 2012, que supongo que podría estar desactualizado. Agradecería sugerencias sobre cómo encontrar esta información por mí mismo.


El artículo citado en la pregunta indica que los autores buscaron en la AP con el término "función desconocida". No hay nada especial en esto: simplemente escriba en el campo de búsqueda estándar y presione 'Ir'. Yo mismo realicé una búsqueda de este tipo:

http://www.rcsb.org/pdb/results/results.do?tabtoshow=Current&qrid=91CA3A5F

Lo que devolvió 4384 estructuras de aprox. 149.600 en el banco de datos.

Por supuesto, es evidente desde la primera página de los resultados que la cantidad de proteínas únicas es menor que esto porque un solo estudio puede examinar diferentes formas de la misma proteína.

Admito que me sorprendió descubrir que la gente había gastado tiempo y dinero determinando la estructura de tantas proteínas de función desconocida, pero parece que existe al menos una iniciativa general para determinar las estructuras de proteínas bacterianas de funciones desconocidas debido a su roles como patógenos potenciales. La idea parecería ser que, incluso si se desconoce su mecanismo de patogenicidad, podrían ser atacados sobre la base de su estructura.


Proteínas del virus del Ébola

En el centro del virus, una nucleocápside compuesta por varios tipos de proteínas protege el genoma. La nucleoproteína del ébola envuelve el ARN, creando un complejo helicoidal. Sin embargo, la interacción entre las subunidades de nucleoproteínas no es tan rígida como en otros virus como el virus del mosaico del tabaco, por lo que el virus del ébola a menudo muestra una estructura ondulada. Una vez dentro de las células, la proteína "L" grande, que es una ARN polimerasa dependiente de ARN, crea muchas copias nuevas del genoma del ARN.

Al igual que con las otras proteínas del ébola, las proteínas de la nucleocápside contienen varios dominios conectados de manera flexible, por lo que los investigadores las han estudiado en partes. La porción de la nucleoproteína que se une al ARN se ha estudiado mediante microscopía crioelectrónica (entrada PDB 5z9w) y se ha utilizado la cristalografía de rayos X para estudiar otras partes de la proteína (entrada PDB 4qb0). También se han estudiado varias otras proteínas de la nucleocápside, que ayudan con la formación de la estructura (entradas de la AP 3vne, 3fke y 2i8b).

Proteínas de luz de luna

Explorando la estructura

Glicoproteína y anticuerpos del Ébola (entrada 3csy de la PDB)

Los investigadores están buscando formas de combatir la infección por el ébola, tanto con medicamentos como con vacunas. La glicoproteína es el principal objetivo de las vacunas, ya que se encuentra en la superficie del virus y es accesible a los anticuerpos. La estructura que se muestra aquí, entrada PDB 3csy, incluye anticuerpos neutralizantes (en rojo y naranja) de una persona que sobrevivió a la infección por el virus. Los anticuerpos se unen a la parte inferior de la glicoproteína, a una porción de la proteína que no suele estar enmascarada por los carbohidratos y que es esencial para el proceso de fusión. Con suerte, las vacunas podrán provocar este tipo de anticuerpos en los pacientes, protegiéndolos de las infecciones. Para explorar esta estructura con más detalle, haga clic en la imagen para ver un JSmol interactivo.

Temas para mayor discusión

  1. Se cree que la entrada 3csy es la glicoproteína del ébola antes de que se una a la superficie celular. Puede consultar la entrada 2ebo para ver una parte de la glicoproteína después de que se fusiona con la célula.

Recursos relacionados con el PDB-101

Referencias

  1. 5z9w: Y. Sugita, H. Matsunami, Y. Kawaoka, T. Noda y M. Wolf (2018) Estructura crio-EM del complejo nucleoproteína-ARN del virus del Ébola a una resolución de 3,6 angstrom. Nature 563, 137-140.
  2. 4qb0: P. J. Dziubanska, U. Derewenda, J. F. Ellena, D. A. Engle y Z. S. Derewenda (2014) La estructura del dominio C-terminal de la nucleoproteína del ebolavirus de Zaire. Acta Crystallographica Sección D 70, 2420-2429.
  3. T. F. Booth, M. J. Rabb y D. R. Beniac (2013) ¿Cómo se doblan los filamentos de filovirus sin romperse? Tendencias en microbiología 21, 583-593.
  4. 4ldb, 4ldd: Z. A. Bornholdt, T. Noda, D. M. Abelson, P. Halfmann, M. R. Wood, Y. Kawaoka y E. O. Saphire (2013) El reordenamiento estructural del virus del ébola VP40 genera múltiples funciones en el ciclo de vida del virus. Cell 154, 763-774.
  5. 3csy: J. E. Lee, M. L. Fusco, A. J. Hessell, W. B. Oswald, D. R. Burton y E. O Saphire (2008) Estructura de la glicoproteína del virus del ébola unida a un anticuerpo de un superviviente humano. Nature 454, 177-182.
  6. 3vne: A. P. P. Zhang, Z. A. Bornholdt, T. Liu, D. M. Abelson, D. E. Lee, S. Li, V. L. Woods y E. O. Saphire (2012) El antagonista del interferón del virus del ébola VP24 se une directamente a STAT1 y tiene un pliegue piramidal novedoso. PLoS Pathogens 8: e1002550.
  7. 3fke: D. W. Leung, N. D. Ginder, D. B. Fulton, J. Nix, C. F. Basler, R. B. Honzatko y G. K. Amarasinghe (2009) Estructura del dominio inhibidor del interferón del ébola VP35. Actas de la Academia Nacional de Ciencias de EE. UU. 106, 411-416.
  8. 2i8b: B. Hartlieb, T. Muziol, W. Weissenhorn y S. Becker (2007) La estructura cristalina del dominio C-terminal del virus del ébola VP30 revela un papel en la transcripción y la asociación de nucleocápsidas. Actas de la Academia Nacional de Ciencias de EE. UU. 104, 624-629.
  9. 1h2c: FX Gomis-Ruth, A. Dessen, J. Timmins, A. Bracher, L. Kolesnikowa, S. Becker, HD Klenk y W. Weissenhorn (2003) La proteína de matriz VP40 del virus del ébola se octameriza en estructuras similares a poros con propiedades de unión de ARN específicas. Estructura 11, 423-433.

Octubre de 2014, David Goodsell

Acerca de PDB-101

PDB-101 ayuda a profesores, estudiantes y al público en general a explorar el mundo 3D de proteínas y ácidos nucleicos. Conocer sus diversas formas y funciones ayuda a comprender todos los aspectos de la biomedicina y la agricultura, desde la síntesis de proteínas hasta la salud y la enfermedad hasta la energía biológica.

¿Por qué PDB-101? Investigadores de todo el mundo hacen que estas estructuras 3D estén disponibles gratuitamente en el archivo Protein Data Bank (PDB). PDB-101 crea materiales introductorios para ayudar a los principiantes a iniciarse en la materia ("101", como en un curso de nivel de entrada), así como recursos para el aprendizaje extendido.


Proteínas similares a las GFP

Los investigadores han utilizado estas proteínas fluorescentes de muchas formas ingeniosas. Por ejemplo, para estudiar las interacciones de las proteínas, pueden dividir la GFP en dos partes y unir una a cada proteína. Luego, si las dos proteínas se acercan entre sí en la célula, la GFP se ensamblará y se encenderá. La entrada 4kf5 del PDB muestra un ejemplo de una GFP dividida, en este caso, utilizada como método para ayudar a la cristalización de proteínas para la determinación de la estructura. Dos segmentos de hebra beta de GFP se fusionan con una proteína de interés (en este caso, sfCherry, de color rojo aquí), y se crea una versión de GFP que carece de estas dos hebras (de color verde). Cuando las dos proteínas diseñadas se mezclan e interactúan entre sí, las dos porciones de GFP se ensamblan en una proteína funcionalmente fluorescente, con la carga de sfCherry. Para explorar este complejo de ingeniería con más detalle, haga clic en la imagen para ver un JSmol interactivo.

Temas para mayor discusión

  1. Las estructuras para varias proteínas fusionadas con GFP están disponibles en el archivo de PDB, por ejemplo, la entrada 4anj de PDB tiene GFP fusionada con miosina.
  2. Asegúrese de buscar en Internet imágenes de micrografías de células con proteínas marcadas con GFP; para obtener imágenes particularmente hermosas, intente buscar "arco cerebral" o "citoesqueleto de micrografía de fluorescencia".

Recursos relacionados con el PDB-101

Referencias

  1. D. M. Chudakov, M. V. Matz, S. Lukyanov y K. A. Lukyanov (2010) Proteínas fluorescentes y sus aplicaciones en la obtención de imágenes de células y tejidos vivos. Revisiones fisiológicas 90, 1103-1163.
  2. 4kf5: H. B. Nguyen, L. W. Hung, T. O. Yeates, T. C. Terwilliger y G. S. Waldo (2013) Proteína verde fluorescente dividida como socio de unión modular para la cristalización de proteínas. Acta Crystallographica Sección D 69, 2513-2523.
  3. 4ar7: D. Von Stetten, M. Noirclerc-Savoye, J. Goedhart, T. W. J. J. Gadella y A. Royant (2012) Estructura de una proteína fluorescente de Aequorea victoria que lleva la mutación del monómero obligado A206K. Acta Cristalográfico Sección F 68, 878.
  4. 2y0g: A. Royant & M. Noirclerc-Savoye (2011) Papel estabilizador del ácido glutámico 222 en la estructura de la proteína fluorescente verde mejorada. Revista de biología estructural 174, 385-390.
  5. 3m24: O. M. Subach, V. N. Malashkevich, W. D. Zencheck, K. S. Morozova, K. D. Piatkevich, S. C. Almo y V. V. Verkhusha (2010) Caracterización estructural de cromóforos azules y rojos que contienen acilimina en proteínas fluorescentes mTagBFP y TagRFP. Química y Biología 17, 333-341
  6. 2q57: G. D. Malo, L. J. Pouwels, M. Wang, A. Weichsel, W. R. Montfort, M. A. Rizzo, D. W. Piston y R. M. Wachter (2007) Estructura de rayos X de Cerulean GFP: un cromóforo a base de triptófano útil para la obtención de imágenes de fluorescencia durante toda la vida. Biochemistry 46, 9865-9873.
  7. 2h5o, 2h5q: X. Shu, N. C. Shaner, C. A. Yarbrough, R. Y. Tsien y S. J. Remington (2006) Nuevos cromóforos y cargas enterradas controlan el color en mFruits. Biochemistry 45, 9639-9647.
  8. 1huy: O. Griesbeck, G. S. Baird, R E., Campbell, D. A. Zacharias y R. Y. Tsien (2001) Reducción de la sensibilidad ambiental de la proteína fluorescente amarilla. Revista de química biológica 276, 29188-29194.
  9. 1g7k: D. Yarbrough, R. M. Wachter, K. Kallio, M. V. Matz y S. J. Remington (2001) Refina la estructura cristalina de DsRed, una proteína roja fluorescente de coral, a una resolución de 2.0-A. PNAS USA 98, 462-467.

Acerca de PDB-101

PDB-101 ayuda a profesores, estudiantes y al público en general a explorar el mundo 3D de proteínas y ácidos nucleicos. Conocer sus diversas formas y funciones ayuda a comprender todos los aspectos de la biomedicina y la agricultura, desde la síntesis de proteínas hasta la salud y la enfermedad hasta la energía biológica.

¿Por qué PDB-101? Investigadores de todo el mundo hacen que estas estructuras 3D estén disponibles gratuitamente en el archivo Protein Data Bank (PDB). PDB-101 crea materiales introductorios para ayudar a los principiantes a iniciarse en la materia ("101", como en un curso de nivel de entrada), así como recursos para el aprendizaje extendido.


Los investigadores describen una proteína previamente desconocida en biología

Modelo de bola y palo de parte de la aconitasa de cerdo activada centrada en el grupo (4Fe4S) unido a cisteína-385, -448, -451, después de PDB 7ACN. Crédito: wikimedia commons

Investigadores de la Universidad de Georgia han descubierto una nueva forma en que el hierro se almacena en los microorganismos, un hallazgo que proporciona nuevos conocimientos sobre la naturaleza fundamental de cómo funcionan los sistemas biológicos. La investigación fue publicada recientemente en la revista Comunicaciones de la naturaleza.

El hierro, un metal que necesitan todos los organismos vivos, generalmente se almacena con oxígeno dentro de una célula en un complejo dentro de una proteína grande conocida como ferritina. Los investigadores han descubierto ahora un nuevo tipo de proteína, conocida como IssA, que almacena hierro con azufre, en lugar de oxígeno, en forma de un polímero de hierro-azufre conocido como tioferrato.

"Este polímero de hierro-azufre se ha fabricado previamente en un tubo de ensayo, pero esta es la primera vez que se identifica el tioferrato en un sistema biológico", dijo Michael W. Adams, autor principal y profesor de investigación distinguido en el departamento de bioquímica y molecular. biología. Además, este único tipo de proteína, IssA, se autoensambla en complejos o nanopartículas extremadamente grandes que pueden tener más de 20 veces el tamaño de la ferritina. Las nanopartículas IssA son tan grandes que se pueden ver dentro de células enteras usando un microscopio. . "

Los investigadores también descubrieron que esta nueva proteína juega un papel no solo en el almacenamiento de hierro, sino también en el ensamblaje de proteínas que contienen grupos de hierro y azufre.

"Este trabajo proporciona nuevos conocimientos sobre cómo los microorganismos pueden almacenar hierro y también azufre, y cómo las proteínas individuales pueden autoensamblarse en nanopartículas", dijo Adams. "También ofrece una nueva perspectiva sobre cómo se sintetizan los cúmulos de hierro y azufre en los sistemas biológicos".

"Las proteínas que contienen grupos de hierro y azufre son ubicuas en biología, donde los grupos se utilizan para catalizar reacciones químicas o para transportar electrones, por ejemplo, durante la respiración", agregó. "Al hacer esta investigación, estábamos interesados ​​en dilucidar la función y la biosíntesis de los cúmulos de hierro y azufre".

En el laboratorio, el equipo cultivó microorganismos a gran escala, los purificó y luego pudo caracterizar una variedad de proteínas y enzimas de hierro y azufre.

"A partir de nuestros análisis genéticos del organismo, sabíamos que IssA era una proteína importante en la célula, y durante nuestros análisis bioquímicos notamos IssA debido a su tamaño extremadamente grande. Su gran abundancia y gran tamaño hicieron que fuera bastante fácil de purificar", dijo. dijo. “Con la proteína purificada pudimos aplicar varias técnicas analíticas, espectroscópicas y microscópicas y eso nos llevó a concluir que IssA era una nanopartícula y contenía tioferrato, un polímero de hierro-azufre no visto previamente en biología. Con la proteína IssA pura también pudimos generar anticuerpos, y esto nos permitió visualizar IssA en células completas del microorganismo como un gran complejo dentro de la célula ".

Si bien la investigación de esta naturaleza proporciona un conocimiento fundamental sobre cómo funcionan los sistemas biológicos, la investigación podría algún día usarse para diseñar nanopartículas para aplicaciones médicas o de otro tipo.

"Las nanopartículas se utilizan en muchas aplicaciones médicas y electrónicas, aunque normalmente están hechas de componentes inorgánicos", dijo. "La ingeniería de nanopartículas de proteínas podría ser posible si pudiéramos comprender las propiedades de IssA que le permiten ensamblarse en estructuras similares a nanopartículas. También es posible que las nanopartículas construidas sobre la proteína IssA pero que contienen otros materiales inorgánicos puedan tener aplicaciones".


PDB50

PDB50 marcará un hito importante en la historia de la biología estructural. En 1971, la comunidad de biología estructural estableció el único archivo mundial para datos de estructura macromolecular y mdash the Protein Data Bank (PDB). Desde sus inicios, el PDB ha adoptado una cultura de acceso abierto, lo que ha llevado a su uso generalizado por parte de la comunidad de investigadores. Los datos de PDB son utilizados por cientos de recursos de datos y millones de usuarios que exploran la biología, la energía y la biomedicina fundamentales.

La biología estructural y la bioinformática estructural han tenido un impacto enorme en nuestra comprensión del mecanismo y función de las macromoléculas biológicas. El PDB actúa como custodio de todos estos datos, lo que representa un repositorio de la gran mayoría de los logros e hitos de la comunidad de biología estructural. El archivo está gestionado por el consorcio Worldwide Protein Data Bank (wwPDB) de sitios asociados en Asia, Europa y América.

Esta celebración del 50 aniversario de la fundación del Protein Data Bank como el primer recurso de datos digitales de acceso abierto en biología incluirá presentaciones de oradores de todo el mundo que han logrado enormes avances en biología estructural y bioinformática. Se anima especialmente a los estudiantes y becarios postdoctorales a asistir y serán elegibles para premios de carteles.

Se anima a los científicos de carrera en etapa temprana y tardía a enviar un resumen para presentación de póster durante el simposio.

Las sesiones en línea se llevarán a cabo entre las 11 a.m. y las 4:30 p.m. EDT todos los días.

El evento se grabará y estará disponible para los participantes registrados después de la reunión.

Fechas importantes

Altavoces

Eddy Arnold

  • Rutgers, Universidad Estatal de Nueva Jersey
  • Uso de estructuras de transcriptasa inversa del VIH-1 para guiar el descubrimiento de fármacos contra el sida

Helen M. Berman

  • Rutgers, Universidad Estatal de Nueva Jersey
  • Universidad del Sur de California
  • La evolución del banco de datos de proteínas como recurso comunitario

Thomas L. Blundell

  • Universidad de Cambridge
  • Una historia personal de cinco décadas de biología estructural y el AP: de la estructura de rayos X del hexámero de insulina 2-zinc en 1970 a las estructuras Cryo-EM de ADN-PK a partir de la reparación del ADN en 2020

Alexandre M. J. J. Bonvin

  • Universidad de Utrecht
  • Resolución de rompecabezas 3D mediante modelado integrativo utilizando estructuras PDB

Stephen K. Burley

  • Rutgers, Universidad Estatal de Nueva Jersey
  • Universidad de California, San Diego
  • Impacto de los biólogos estructurales y cincuenta años de operaciones del Protein Data Bank en el descubrimiento y desarrollo de fármacos

Wah Chiu

Johann Deisenhofer

  • Centro médico de la Universidad de Texas Southwestern
  • 50 años de PDB y mdash de una idea loca a un tesoro

Juli Feigon

  • Universidad de California, Los Angeles
  • Biología estructural de la telomerasa

Angela M. Gronenborn

  • Universidad de Pittsburgh
  • BioNMR y mdash integrados que se las arreglan con un poco de ayuda de mis amigos

Jennifer L. Martin

  • Universidad de Wollongong
  • Ciencia, cristalografía, reflexiones: un viaje con el AP a lo largo de 35 años

Stephen L. Mayo

  • Instituto de Tecnología de California
  • Conjugados de moléculas pequeñas de anticuerpos con sinergia de unión a la diana diseñada computacionalmente

Zihe Rao

  • Universidad ShanghaiTech
  • Universidad de Tsinghua
  • Información estructural sobre el complejo de transcripción y replicación (RTC) del SARS-CoV-2

Hao Wu

  • Escuela Médica de Harvard
  • Hospital Infantil de Boston
  • Inflamasomas tacular & quotSpeck & quot: estructuras de complejos supramoleculares en la inmunidad innata

Organizadores

  • Celia Schiffer, Facultad de Medicina de la Universidad de Massachusetts
  • Helen M. Berman, Rutgers, Universidad Estatal de Nueva Jersey RCSB PDB
  • Stephen K. Burley, Rutgers, Universidad Estatal de Nueva Jersey RCSB PDB
  • Jeffrey C. Hoch, Universidad de Connecticut BMRB
  • Gerard J. Kleywegt, Instituto Europeo de Bioinformática PDBe
  • Genji Kurisu, Universidad de Osaka PDBj
  • John L. Markley, Universidad de Wisconsin y ndashMadison BMRB
  • Sameer Velankar, Instituto Europeo de Bioinformática PDBe
  • Christine Zardecki, Rutgers, Universidad Estatal de Nueva Jersey RCSB PDB

Reconocimiento: Ilustración de David S. Goodsell, The Scripps Research Institute. doi: 10.2210 / rcsb_pdb / goodsell-gallery-003

Esta ilustración muestra una sección transversal de la sangre, con suero sanguíneo en la mitad superior y un glóbulo rojo en la mitad inferior. En el suero, busque anticuerpos en forma de Y, moléculas de fibrinógeno largas y delgadas (en rojo claro) y muchas proteínas pequeñas de albúmina. Los grandes objetos con forma de ovni son lipoproteínas de baja densidad y la proteína de seis brazos es el complemento C1. El glóbulo rojo está lleno de hemoglobina, en rojo. La membrana celular, de color púrpura, está reforzada en la superficie interna por largas cadenas de espectrina conectadas en un extremo a un pequeño segmento de filamento de actina.

Revistas


¿Cuántas proteínas de la AP tienen función desconocida? - biología

Los principales tipos y funciones de las proteínas se enumeran en la Tabla 1.

Tabla 1. Tipos de proteínas y funciones
Escribe Ejemplos de Funciones
Enzimas digestivas Amilasa, lipasa, pepsina, tripsina Ayuda en la digestión de los alimentos catabolizando los nutrientes en unidades monoméricas.
Transporte Hemoglobina, albúmina Transportan sustancias en la sangre o la linfa por todo el cuerpo.
Estructural Actina, tubulina, queratina Construye diferentes estructuras, como el citoesqueleto.
Hormonas Insulina, tiroxina Coordinar la actividad de diferentes sistemas corporales.
Defensa Inmunoglobulinas Protege el cuerpo de patógenos extraños.
Contractible Actina, miosina Efecto contracción muscular
Almacenamiento Proteínas de almacenamiento de leguminosas, clara de huevo (albúmina) Proporcionar nutrición en el desarrollo temprano del embrión y la plántula.

Dos tipos de proteínas especiales y comunes son las enzimas y las hormonas. Enzimas, que son producidos por células vivas, son catalizadores en reacciones bioquímicas (como la digestión) y generalmente son proteínas complejas o conjugadas. Cada enzima es específica del sustrato (un reactivo que se une a una enzima) sobre el que actúa. La enzima puede ayudar en las reacciones de descomposición, reordenamiento o síntesis. Las enzimas que descomponen sus sustratos se denominan enzimas catabólicas, las enzimas que forman moléculas más complejas a partir de sus sustratos se denominan enzimas anabólicas y las enzimas que afectan la velocidad de reacción se denominan enzimas catalíticas. Cabe señalar que todas las enzimas aumentan la velocidad de reacción y, por lo tanto, se consideran catalizadores orgánicos. Un ejemplo de enzima es la amilasa salival, que hidroliza su sustrato amilosa, un componente del almidón.

Hormonas son moléculas de señalización química, generalmente pequeñas proteínas o esteroides, secretadas por células endocrinas que actúan para controlar o regular procesos fisiológicos específicos, incluidos el crecimiento, el desarrollo, el metabolismo y la reproducción. Por ejemplo, la insulina es una hormona proteica que ayuda a regular el nivel de glucosa en sangre.

Las proteínas tienen diferentes formas y pesos moleculares, algunas proteínas tienen forma globular, mientras que otras son de naturaleza fibrosa. Por ejemplo, la hemoglobina es una proteína globular, pero el colágeno, que se encuentra en nuestra piel, es una proteína fibrosa. La forma de la proteína es fundamental para su función, y esta forma se mantiene mediante muchos tipos diferentes de enlaces químicos. Los cambios en la temperatura, el pH y la exposición a sustancias químicas pueden provocar cambios permanentes en la forma de la proteína, lo que lleva a la pérdida de función, lo que se conoce como desnaturalización. Las diferentes disposiciones de los mismos 20 tipos de aminoácidos comprenden todas las proteínas. Recientemente se descubrieron dos nuevos aminoácidos raros (selenocisteína y pirrolisina), y es posible que se agreguen nuevos descubrimientos a la lista.

En resumen: función de las proteínas

Las proteínas son una clase de macromoléculas que realizan una amplia gama de funciones para la célula. Ayudan en el metabolismo proporcionando apoyo estructural y actuando como enzimas, portadores u hormonas. Los componentes básicos de las proteínas (monómeros) son los aminoácidos. Cada aminoácido tiene un carbono central que está unido a un grupo amino, un grupo carboxilo, un átomo de hidrógeno y un grupo R o cadena lateral. Hay 20 aminoácidos que ocurren comúnmente, cada uno de los cuales difiere en el grupo R. Cada aminoácido está unido a sus vecinos por un enlace peptídico. Una cadena larga de aminoácidos se conoce como polipéptido.

Las proteínas se organizan en cuatro niveles: primario, secundario, terciario y (opcional) cuaternario. La estructura primaria es la secuencia única de aminoácidos. El plegamiento local del polipéptido para formar estructuras como el α hélice y β-La hoja plegada constituye la estructura secundaria. La estructura tridimensional general es la estructura terciaria. Cuando dos o más polipéptidos se combinan para formar la estructura proteica completa, la configuración se conoce como estructura cuaternaria de una proteína. La forma y función de las proteínas están íntimamente ligadas. Cualquier cambio en la forma causado por cambios en la temperatura o el pH puede provocar la desnaturalización de las proteínas y una pérdida de función.


Resumen del autor

La secuenciación del genoma ha llevado al descubrimiento de muchos productos genéticos nuevos, proteínas. Estos descubrimientos tienen un enorme potencial para enfoques totalmente nuevos para el diagnóstico y tratamiento de enfermedades. Para realizar este potencial, un paso importante es comprender la función de las miles de proteínas cuya función se desconoce actualmente. Una de estas proteínas de función desconocida es la DJ-1 humana, una proteína que parece desempeñar un papel protector contra el Parkinson y otras enfermedades neurodegenerativas. Aquí presentamos un enfoque computacional para la clasificación por función de DJ-1 y sus familiares. Se analizan ocho miembros de la familia DJ-1, todos con una estructura tridimensional similar. Tres clases funcionales probables diferentes surgen de este análisis en seis de los miembros de la familia, todos con un simple cálculo.

Citación: Wei Y, Ringe D, Wilson MA, Ondrechen MJ (2007) Identificación de subclases funcionales en las proteínas de la superfamilia DJ-1. PLoS Comput Biol 3 (1): e15. https://doi.org/10.1371/journal.pcbi.0030010

Editor: Luhua Lai, Universidad de Pekín, China

Recibió: 11 de septiembre de 2006 Aceptado: 7 de diciembre de 2006 Publicado: 26 de enero de 2007

Derechos de autor: © 2007 Wei y col. Este es un artículo de acceso abierto distribuido bajo los términos de la Licencia de Atribución Creative Commons, que permite el uso, distribución y reproducción sin restricciones en cualquier medio, siempre que se acredite el autor y la fuente originales.

Fondos: Se agradece el apoyo de la subvención MCB-0517292 de la Fundación Nacional de Ciencias de EE. UU.

Conflicto de intereses: Los autores han declarado que no existen intereses en competencia.

Abreviaturas: PDB, Protein Data Bank TEMÁTICAS, curvas de titulación microscópicas teóricas


Clasificación de proteínas basada en secuencias

El primer obstáculo para cualquier proceso de anotación funcional es definir 'función'. Si la proteína es una enzima, puede resultar útil simplemente utilizar el esquema de numeración CE (véase el recuadro 1). Sin embargo, en general, el problema es multidimensional: una proteína puede tener una función molecular, una función celular y ser parte de un complejo o vía funcional (estas son las distinciones utilizadas en la Ontología de genes (GO ver Cuadro 1) [6 ]). Además, ciertos aspectos de la función molecular pueden ilustrarse mediante múltiples niveles descriptivos (por ejemplo, la categoría de "enzima" burda frente a una asignación de "proteasa" más específica). Incluso la definición más detallada no revelaría el papel celular de la proteína (apoptosis, metabolismo, coagulación sanguínea, etc.).

La mayoría de los métodos de predicción de funciones, basados ​​tanto en la secuencia como en la estructura, se basan en inferir relaciones entre proteínas que permiten la transferencia de anotaciones funcionales y especificidades de unión de una a otra. Un desafío notable aquí es descifrar la conexión entre las similitudes detectadas (estructurales o en secuencia) y el nivel real de relación funcional. La función se asocia a menudo con dominios, y otro problema es la identificación de dominios funcionales solo a partir de la secuencia. La precisión de los métodos actuales para predecir los límites de los dominios aún no es completamente satisfactoria. Varios métodos proporcionan predicciones fiables si se dispone de una plantilla estructural para la proteína, pero cuando este no es el caso, uno se queda con el problema de si la anotación experimental utilizada para la inferencia se refiere al mismo dominio para el que la secuencia similitud / motivo se establece [7].

La función de una proteína también se puede inferir de su relación evolutiva con proteínas de función conocida, siempre que la relación se inspeccione adecuadamente. Las proteínas ortólogas en diferentes especies a menudo comparten la función, pero la paralogía (es decir, la divergencia después de la duplicación del gen original) no garantiza una función común. Se puede intentar distinguir entre ortología y paralogía sobre la base de patrones de similitud de secuencia observados, analizando el patrón de conservación específico de los residuos responsables de la función en la familia, o sobre la base de la estructura de la proteína (determinada experimentalmente o modelada). En todos los casos, esto requiere la agrupación de proteínas en familias evolutivas, lo que puede lograrse utilizando herramientas de detección de similitudes como BLAST [8] o herramientas de creación de perfiles basadas en alineaciones de secuencias múltiples, por ejemplo, PSI-BLAST [9]. Varios recursos disponibles proporcionan asignaciones de familias precompiladas para proteínas a escala genómica, basadas únicamente en su secuencia. Los recursos se pueden subdividir en aquellos que consideran secuencias de longitud completa y aquellos basados ​​en dominios o motivos que se asignan a ciertas subsecuencias. En ambos casos, el grado de granularidad de la clasificación es importante, ya que está relacionado con el nivel de características funcionales que se espera que comparta un grupo de proteínas.

Un recurso que clasifica proteínas de longitud completa es PIRSF [10], en el que se aplica un conjunto de reglas para definir agrupaciones primarias y seleccionadas que también se basan en relaciones textuales (nombres de proteínas, literatura) y entre padres e hijos. Estos grupos (llamados superfamilias) se dividen además en aquellos con similitud completa (es decir, arquitectura de dominio común) y aquellos que comparten un dominio ancestral. PIRSF cubre más de dos tercios del espacio de secuencias de proteínas.

El estudio de proteínas a nivel de dominio permite una inferencia funcional más precisa [11] y es útil para predecir la función de nuevas combinaciones de dominios que posiblemente den lugar a nuevas funciones de proteínas [12]. En este tipo de recurso, una familia de dominios se representa como una alineación de secuencia múltiple, que se materializa en un perfil de firma familiar estadística (por ejemplo, CDD [13] y PROSITE [14]) o un modelo de Markov de perfil oculto (para ejemplo, Pfam [15] y SMART [16]), denominados colectivamente aquí perfiles. Pfam, un prototipo de tales colecciones, contiene actualmente más de 9.000 perfiles familiares y cubre aproximadamente el 70-74% de las secuencias UniProt, capturando aproximadamente la mitad de sus aminoácidos [17]. Aproximadamente el 40-45% de las familias Pfam están asociadas con estructuras conocidas, mientras que el 20-25% actualmente no están caracterizadas. Otros recursos, por ejemplo CDD, utilizan perfiles definidos externamente para proporcionar asignaciones rápidas a las consultas de secuencia, utilizando un motor similar a BLAST para acelerar las búsquedas.

Los métodos y recursos basados ​​en perfiles difieren significativamente en su nivel de automatización, su grado de curación manual y el nivel de independencia de los recursos complementarios utilizados en la clasificación. La combinación de estos recursos proporciona una cobertura más completa, como refleja InterPro [18], un repositorio de familias de proteínas que integra firmas de más de 10 recursos miembros, que actualmente cubren casi el 75% de las secuencias UniProt. InterPro también incluye Gene3d [19] y SUPERFAMILY [20], que proporcionan perfiles de secuencia correspondientes a la clasificación estructural de pliegues por CATH [21] y SCOP [22], respectivamente. Un recurso que explota la multiplicidad de secuencias genómicas esencialmente completas es COG (Clusters of Orthologous Groups), una clasificación evolutiva que utiliza principios de genómica comparativa, como perfiles filéticos [23] (ver Cuadro 1), para identificar la presencia de ortólogos y grupos ellos en consecuencia.

Una deficiencia notable de los métodos descritos anteriormente es que requieren la definición de un umbral de similitud para separar familias entre sí. Un enfoque alternativo para definir clústeres es la construcción de una representación de árbol que pueda proporcionar una vista jerárquica. Los recursos de esta categoría incluyen ProtoNet [24], CluSTr [25] y SYSTERS [26]. Se basan en similitudes de secuencia detectadas mediante una comparación de secuencia de todos contra todos, de modo que se puede inspeccionar cualquier nivel de granularidad evolutiva, desde subfamilias estrechamente relacionadas hasta relaciones más distantes.

Los enfoques que no se basan únicamente en la anotación supervisada de perfiles familiares incluyen ProDom [27], que recopila perfiles de dominios putativos utilizando dominios de secuencia conocidos como secuencias de consulta para búsquedas iterativas de PSI-BLAST [9]. EVEREST [28] es un método no supervisado completamente automático que identifica regiones conservadas recurrentes sobre la base de similitudes de secuencias locales y búsquedas de perfiles iterativas.

La precisión de los métodos basados ​​en secuencias se ve afectada por el tipo y la cantidad de información sobre la familia de proteínas específica pero, en general, parecen ser razonablemente precisos. Se ha demostrado que su tasa de éxito es superior al 70% cuando se prueban en un conjunto de datos limitado (todas las estructuras resueltas por el Midwest Center for Structural Genomics durante los primeros cinco años de la Protein Structure Initiative) [29].


Referencias

Kim, S. C. y col. Sustrato y diversidad funcional de la acetilación de lisina revelada por un estudio proteómico. Mol. Celda 23, 607–618 (2006). El primer estudio proteómico que informa sobre la existencia generalizada de acetilación en células humanas (HeLa) y de ratón.

Choudhary, C. y col. La acetilación de lisina se dirige a los complejos de proteínas y co-regula las principales funciones celulares. Ciencias 325, 834–840 (2009). Una pantalla proteómica de alta resolución a gran escala que identificó más de 3500 sitios Lys acetilados en células humanas.

Choudhary, C., Weinert, B. T., Nishida, Y., Verdin, E. & amp Mann, M. El panorama creciente de la acetilación de lisina vincula el metabolismo y la señalización celular. Nat. Rev. Mol. Cell Biol. 15, 536–550 (2014).

Verdin, E. & amp Ott, M. 50 años de acetilación de proteínas: desde la regulación genética hasta la epigenética, el metabolismo y más. Nat. Rev. Mol. Cell Biol. 16, 258–264 (2015).

Bannister, A. J. & amp Kouzarides, T. Regulación de la cromatina por modificaciones de histonas. Cell Res. 21, 381–395 (2011).

Glozak, M. A. & amp Seto, E. Histone desacetilasas y cáncer. Oncogén 26, 5420–5432 (2007).

Zhao, D., Li, F. L., Cheng, Z. L. & amp Lei, Q. Y. Impacto de la acetilación en el metabolismo tumoral. Mol. Celda. Oncol. 1, e963452 (2014).

Falkenberg, K. J. & amp Johnstone, R. W. Histone desacetilasas y sus inhibidores en cáncer, enfermedades neurológicas y trastornos inmunológicos. Nat. Rev. Drug Discov. 13, 673–691 (2014).

Haynes, S. R. y col. El bromodominio: una secuencia conservada que se encuentra en humanos, Drosophila y proteínas de levadura. Ácidos nucleicos Res. 20, 2603 (1992). El primer informe del motivo BRD, que especula que constituye un dominio de interacción proteína-proteína.

Li, Y. et al. El dominio AF9 YEATS une la acetilación de histonas con la metilación de H3K79 mediada por DOT1L. Celda 159, 558–571 (2014).

Li, Y. et al. Acoplamiento molecular de crotonilación de histonas y transcripción activa por dominio AF9 YEATS. Mol. Celda 62, 181–193 (2016).

Andrews, F. H. y col. El dominio Taf14 YEATS es un lector de crotonilación de histonas. Nat. Chem. Biol. 12, 396–398 (2016).

Kim, M. S. y col. Un borrador de mapa del proteoma humano. Naturaleza 509, 575–581 (2014).

Wilhelm, M. y col. Borrador basado en espectrometría de masas del proteoma humano. Naturaleza 509, 582–584 (2014).

Muller, S., Filippakopoulos, P. & amp Knapp, S. Bromodomains como dianas terapéuticas. Experto Rev. Mol. Medicina. 13, e29 (2011).

Belkina, A. C. & amp Denis, G. V. Correguladores del dominio BET en la obesidad, la inflamación y el cáncer. Nat. Rev.Cáncer 12, 465–477 (2012).

Shi, J. & amp Vakoc, C. R. Los mecanismos detrás de la actividad terapéutica de la inhibición del bromodominio BET. Mol. Celda 54, 728–736 (2014).

Wang, C. Y. y Filippakopoulos, P. Superando las probabilidades: APUESTA en la enfermedad. Trends Biochem. Sci. 40, 468–479 (2015).

Filippakopoulos, P. & Knapp, S. Targeting bromodomains: epigenetic readers of lysine acetylation. Nat. Rev. Drug Discov. 13, 337–356 (2014).

Basheer, F. & Huntly, B. J. BET bromodomain inhibitors in leukemia. Exp. Hematol. 43, 718–731 (2015).

Theodoulou, N. H., Tomkinson, N. C., Prinjha, R. K. & Humphreys, P. G. Progress in the development of non-BET bromodomain chemical probes. ChemMedChem 11, 477–487 (2016).

Filippakopoulos, P. et al. Histone recognition and large-scale structural analysis of the human bromodomain family. Celda 149, 214–231 (2012). This study reported the first large-scale structural analysis of the human BRD family.

Alsarraj, J. et al. BRD4 short isoform interacts with RRP1B, SIPA1 and components of the LINC complex at the inner face of the nuclear membrane. Más uno 8, e80746 (2013).

Dhalluin, C. et al. Structure and ligand of a histone acetyltransferase bromodomain. Naturaleza 399, 491–496 (1999). The first report of the solution structure of a BRD (from PCAF), which established that it interacts directly with acetylated Lys residues.

Jacobson, R. H., Ladurner, A. G., King, D. S. & Tjian, R. Structure and function of a human TAFII250 double bromodomain module. Ciencias 288, 1422–1425 (2000). The first crystal structure of a tandem BRD module from TAF1, which established the rationale for the simultaneous engagement of multiple acetylated histone peptides.

Owen, D. J. et al. The structural basis for the recognition of acetylated histone H4 by the bromodomain of histone acetyltransferase Gcn5p. EMBO J. 19, 6141–6149 (2000). The first high-resolution crystal structure of the yeast Gcn5 BRD bound to an acetylated H4 peptide.

Mujtaba, S. et al. Structural basis of lysine-acetylated HIV-1 Tat recognition by PCAF bromodomain. Mol. Celda 9, 575–586 (2002).

Mujtaba, S. et al. Mecanismo estructural del bromodominio del coactivador CBP en la activación transcripcional de p53. Mol. Celda 13, 251–263 (2004).

Gamsjaeger, R. et al. Structural basis and specificity of acetylated transcription factor GATA1 recognition by BET family bromodomain protein Brd3. Mol. Celda. Biol. 31, 2632–2640 (2011). This study demonstrated that BRD3 recognizes acetylated Lys residues in the transcription factor GATA1, which participates in the regulation of haematopoietic lineages.

Schroder, S. et al. Two-pronged binding with bromodomain-containing protein 4 liberates positive transcription elongation factor b from inactive ribonucleoprotein complexes. J. Biol. Chem. 287, 1090–1099 (2012).

Shi, J. et al. Disrupting the interaction of BRD4 with diacetylated Twist suppresses tumorigenesis in basal-like breast cancer. Célula cancerosa 25, 210–225 (2014). This study demonstrated that BRD4 recognizes acetylated Lys residues on the transcription factor TWIST, which affects TWIST-controlled gene expression programmes.

Zou, Z. et al. Brd4 maintains constitutively active NF-κB in cancer cells by binding to acetylated RelA. Oncogén 33, 2395–2404 (2014).

Tsai, W. W. et al. TRIM24 links a non-canonical histone signature to breast cancer. Naturaleza 468, 927–932 (2010). This study demonstrated that the PHD–BRD cassette of TRIM24 combinatorially recognizes H3K23ac and unmodified H3K4.

Li, H. y col. Molecular basis for site-specific read-out of histone H3K4me3 by the BPTF PHD finger of NURF. Naturaleza 442, 91–95 (2006).

Ruthenburg, A. J. et al. Recognition of a mononucleosomal histone modification pattern by BPTF via multivalent interactions. Celda 145, 692–706 (2011). This study demonstrated that BPTF multivalently recognizes Kac histone marks on the tails of different histones within the same nucleosome.

Xi, Q. et al. A poised chromatin platform for TGF-β access to master regulators. Celda 147, 1511–1524 (2011).

Moriniere, J. et al. Cooperative binding of two acetylation marks on a histone tail by a single bromodomain. Naturaleza 461, 664–668 (2009). The first report to show that a single BRD can recognize two Kac histone marks simultaneously.

Chen, Y. et al. Lysine propionylation and butyrylation are novel post-translational modifications in histones. Mol. Celda. Proteómica 6, 812–819 (2007).

Tan, M. et al. Identification of 67 histone marks and histone lysine crotonylation as a new type of histone modification. Celda 146, 1016–1028 (2011).

Sabari, B. R. et al. Intracellular crotonyl-CoA stimulates transcription through p300-catalyzed histone crotonylation. Mol. Celda 58, 203–215 (2015).

Goudarzi, A. et al. Dynamic competing histone H4 K5K8 acetylation and butyrylation are hallmarks of highly active gene promoters. Mol. Celda 62, 169–180 (2016). This study demonstrated that histone butyrylation regulates the binding of BRDT to histones.

Rousseaux, S. & Khochbin, S. Histone acylation beyond acetylation: terra incognita in chromatin biology. Cell J. 17, 1–6 (2015).

Flynn, E. M. et al. A subset of human bromodomains recognizes butyryllysine and crotonyllysine histone peptide modifications. Estructura 23, 1801–1814 (2015).

Singhal, N. et al. Chromatin-remodeling components of the BAF complex facilitate reprogramming. Celda 141, 943–955 (2010).

Singh, M., Popowicz, G. M., Krajewski, M. & Holak, T. A. Structural ramification for acetyl-lysine recognition by the bromodomain of human BRG1 protein, a central ATPase of the SWI/SNF remodeling complex. Chembiochem 8, 1308–1316 (2007).

Reyes, J. C. et al. Altered control of cellular proliferation in the absence of mammalian Brahma (SNF2α). EMBO J. 17, 6979–6991 (1998).

Bultman, S. et al. A Brg1 null mutation in the mouse reveals functional differences among mammalian SWI/SNF complexes. Mol. Celda 6, 1287–1295 (2000).

Huang, X., Gao, X., Diaz-Trelles, R., Ruiz-Lozano, P. & Wang, Z. Coronary development is regulated by ATP-dependent SWI/SNF chromatin remodeling component BAF180. Dev. Biol. 319, 258–266 (2008).

Burrows, A. E., Smogorzewska, A. & Elledge, S. J. Polybromo-associated BRG1-associated factor components BRD7 and BAF180 are critical regulators of p53 required for induction of replicative senescence. Proc. Natl Acad. Sci. Estados Unidos 107, 14280–14285 (2010).

Brownlee, P. M., Chambers, A. L., Cloney, R., Bianchi, A. & Downs, J. A. BAF180 promotes cohesion and prevents genome instability and aneuploidy. Rep. Celular 6, 973–981 (2014).

Kaeser, M. D. et al. BRD7, a novel PBAF-specific SWI/SNF subunit, is required for target gene activation and repression in embryonic stem cells. J. Biol. Chem. 283, 32254–32263 (2008).

Chiu, Y. H., Lee, J. Y. & Cantley, L. C. BRD7, a tumor suppressor, interacts with p85α and regulates PI3K activity. Mol. Celda 54, 193–202 (2014). This study showed that BRD7 functions as a tumour suppressor through the regulation of PI3K activity.

Park, S. W. et al. BRD7 regulates XBP1s' activity and glucose homeostasis through its interaction with the regulatory subunits of PI3K. Cell Metab. 20, 73–84 (2014).

Kadoch, C. et al. Proteomic and bioinformatic analysis of mammalian SWI/SNF complexes identifies extensive roles in human malignancy. Nat. Gineta. 45, 592–601 (2013). This proteomic and bioinformatic study identified new components of the mammalian SWI–SNF complex and mutations in them that are found in human cancers.

Fairbridge, N. A. et al. Cecr2 mutations causing exencephaly trigger misregulation of mesenchymal/ectodermal transcription factors. Birth Defects Res. A Clin. Mol. Teratol. 88, 619–625 (2010).

Banting, G. S. et al. CECR2, a protein involved in neurulation, forms a novel chromatin remodeling complex with SNF2L. Tararear. Mol. Gineta. 14, 513–524 (2005).

Bowser, R., Giambrone, A. & Davies, P. FAC1, a novel gene identified with the monoclonal antibody Alz50, is developmentally regulated in human brain. Dev. Neurosci. 17, 20–37 (1995).

Tallant, C. et al. Molecular basis of histone tail recognition by human TIP5 PHD finger and bromodomain of the chromatin remodeling complex NoRC. Estructura 23, 80–92 (2015).

Collins, N. et al. An ACF1−ISWI chromatin-remodeling complex is required for DNA replication through heterochromatin. Nat. Gineta. 32, 627–632 (2002).

Xiao, A. et al. WSTF regulates the H2A.X DNA damage response via a novel tyrosine kinase activity. Naturaleza 457, 57–62 (2009).

Zhou, Y. et al. Reversible acetylation of the chromatin remodelling complex NoRC is required for non-coding RNA-dependent silencing. Nat. Cell Biol. 11, 1010–1016 (2009).

Jones, M. H., Hamana, N., Nezu, J. & Shimane, M. A novel family of bromodomain genes. Genómica 63, 40–45 (2000).

Huang, H., Rambaldi, I., Daniels, E. & Featherstone, M. Expression of the WDR9 gene and protein products during mouse development. Dev. Dyn. 227, 608–614 (2003).

Philipps, D. L. et al. The dual bromodomain and WD repeat-containing mouse protein BRWD1 is required for normal spermiogenesis and the oocyte−embryo transition. Dev. Biol. 317, 72–82 (2008).

Pattabiraman, S. et al. Mouse BRWD1 is critical for spermatid postmeiotic transcription and female meiotic chromosome stability. J. Cell Biol. 208, 53–69 (2015).

Muller, P., Kuttenkeuler, D., Gesellchen, V., Zeidler, M. P. & Boutros, M. Identification of JAK/STAT signalling components by genome-wide RNA interference. Naturaleza 436, 871–875 (2005).

Dancy, B. M. & Cole, P. A. Protein lysine acetylation by p300/CBP. Chem. Rvdo. 115, 2419–2452 (2015).

Yao, T. P. et al. Gene dosage-dependent embryonic development and proliferation defects in mice lacking the transcriptional integrator p300. Celda 93, 361–372 (1998).

Tanaka, Y. et al. Extensive brain hemorrhage and embryonic lethality in a mouse null mutant of CREB-binding protein. Mech. Dev. 95, 133–145 (2000).

Kasper, L. H. et al. Conditional knockout mice reveal distinct functions for the global transcriptional coactivators CBP and p300 in T-cell development. Mol. Celda. Biol. 26, 789–809 (2006).

Nagy, Z. & Tora, L. Distinct GCN5/PCAF-containing complexes function as co-activators and are involved in transcription factor and global histone acetylation. Oncogén 26, 5341–5357 (2007).

Krebs, A. R., Karmodiya, K., Lindahl-Allen, M., Struhl, K. & Tora, L. SAGA and ATAC histone acetyl transferase complexes regulate distinct sets of genes and ATAC defines a class of p300-independent enhancers. Mol. Celda 44, 410–423 (2011).

Maurice, T. et al. Altered memory capacities and response to stress in p300/CBP-associated factor (PCAF) histone acetylase knockout mice. Neuropsicofarmacología 33, 1584–1602 (2008).

Xu, W. y col. Pérdida de Gcn5l2 leads to increased apoptosis and mesodermal defects during mouse development. Nat. Gineta. 26, 229–232 (2000).

Bu, P., Evrard, Y. A., Lozano, G. & Dent, S. Y. Loss of Gcn5 acetyltransferase activity leads to neural tube closure defects and exencephaly in mouse embryos. Mol. Celda. Biol. 27, 3405–3416 (2007).

Doyon, Y., Selleck, W., Lane, W. S., Tan, S. & Cote, J. Structural and functional conservation of the NuA4 histone acetyltransferase complex from yeast to humans. Mol. Celda. Biol. 24, 1884–1896 (2004).

Altaf, M. et al. NuA4-dependent acetylation of nucleosomal histones H4 and H2A directly stimulates incorporation of H2A.Z by the SWR1 complex. J. Biol. Chem. 285, 15966–15977 (2010).

Obri, A. et al. ANP32E is a histone chaperone that removes H2A.Z from chromatin. Naturaleza 505, 648–653 (2014).

Yang, X. J. MOZ and MORF acetyltransferases: molecular interaction, animal development and human disease. Biochim. Biophys. Acta 1853, 1818–1826 (2015).

Klein, B. J. et al. Bivalent interaction of the PZP domain of BRPF1 with the nucleosome impacts chromatin dynamics and acetylation. Ácidos nucleicos Res. 44, 472–484 (2016).

You, L., Chen, L., Penney, J., Miao, D. & Yang, X. J. Expression atlas of the multivalent epigenetic regulator Brpf1 and its requirement for survival of mouse embryos. Epigenetics 9, 860–872 (2014).

Mishima, Y. et al. The Hbo1−Brd1/Brpf2 complex is responsible for global acetylation of H3K14 and required for fetal liver erythropoiesis. Sangre 118, 2443–2453 (2011).

Feng, Y. et al. BRPF3−HBO1 regulates replication origin activation and histone H3K14 acetylation. EMBO J. 35, 176–192 (2016).

Gregory, G. D. et al. Mammalian ASH1L is a histone methyltransferase that occupies the transcribed region of active genes. Mol. Celda. Biol. 27, 8466–8479 (2007).

Tanaka, Y. et al. Dual function of histone H3 lysine 36 methyltransferase ASH1 in regulation of Hox gene expression. Más uno 6, e28171 (2011).

Rao, R. C. & Dou, Y. Hijacked in cancer: the KMT2 (MLL) family of methyltransferases. Nat. Rev.Cáncer 15, 334–346 (2015).

Milne, T. A. et al. MLL targets SET domain methyltransferase activity to Hox gene promoters. Mol. Celda 10, 1107–1117 (2002).

Filippakopoulos, P. et al. Selective inhibition of BET bromodomains. Naturaleza 468, 1067–1073 (2010). This study reports the first potent and selective thienodiazepine compound that targets BET family BRDs in a NUT midline carcinoma model.

Nicodeme, E. et al. Suppression of inflammation by a synthetic histone mimic. Naturaleza 468, 1119–1123 (2010). This study reports the first benzodiazepine compound that targets the BET family of BRDs and its use as an anti-inflammatory agent.

Wang, F. et al. Brd2 disruption in mice causes severe obesity without type 2 diabetes. Biochem. J. 425, 71–83 (2010).

Shang, E., Wang, X., Wen, D., Greenberg, D. A. & Wolgemuth, D. J. Double bromodomain-containing gene Brd2 is essential for embryonic development in mouse. Dev. Dyn. 238, 908–917 (2009).

Houzelstein, D. et al. Growth and early postimplantation defects in mice deficient for the bromodomain-containing protein Brd4. Mol. Celda. Biol. 22, 3794–3802 (2002).

Lamonica, J. M. et al. Bromodomain protein Brd3 associates with acetylated GATA1 to promote its chromatin occupancy at erythroid target genes. Proc. Natl Acad. Sci. Estados Unidos 108, E159–E168 (2011).

Stonestrom, A. J. et al. Functions of BET proteins in erythroid gene expression. Sangre 125, 2825–2834 (2015).

Jang, M. K. et al. The bromodomain protein Brd4 is a positive regulatory component of P-TEFb and stimulates RNA polymerase II-dependent transcription. Mol. Celda 19, 523–534 (2005).

Yang, Z. et al. Recruitment of P-TEFb for stimulation of transcriptional elongation by the bromodomain protein Brd4. Mol. Celda 19, 535–545 (2005).

Gaucher, J. et al. Bromodomain-dependent stage-specific male genome programming by Brdt. EMBO J. 31, 3809–3820 (2012).

Shang, E., Nickerson, H. D., Wen, D., Wang, X. & Wolgemuth, D. J. The first bromodomain of Brdt, a testis-specific member of the BET sub-family of double-bromodomain-containing proteins, is essential for male germ cell differentiation. Desarrollo 134, 3507–3515 (2007).

Matzuk, M. M. et al. Small-molecule inhibition of BRDT for male contraception. Celda 150, 673–684 (2012).

Buchmann, A. M., Skaar, J. R. & DeCaprio, J. A. Activation of a DNA damage checkpoint response in a TAF1-defective cell line. Mol. Celda. Biol. 24, 5332–5339 (2004).

Kimura, J. et al. A functional genome-wide RNAi screen identifies TAF1 as a regulator for apoptosis in response to genotoxic stress. Ácidos nucleicos Res. 36, 5250–5259 (2008).

Sdelci, S. et al. Mapping the chemical chromatin reactivation landscape identifies BRD4−TAF1 cross-talk. Nat. Chem. Biol. 12, 504–510 (2016).

Wang, P. J. & Page, D. C. Functional substitution for TAFII250 by a retroposed homolog that is expressed in human spermatogenesis. Tararear. Mol. Gineta. 11, 2341–2346 (2002).

Gong, F. et al. Screen identifies bromodomain protein ZMYND8 in chromatin recognition of transcription-associated DNA damage that promotes homologous recombination. Genes Dev. 29, 197–211 (2015).

Shen, H. et al. Suppression of enhancer overactivation by a RACK7-histone demethylase complex. Celda 165, 331–342 (2016).

Wen, H. et al. ZMYND11 links histone H3.3K36me3 to transcription elongation and tumour suppression. Naturaleza 508, 263–268 (2014).

Guo, R. et al. BS69/ZMYND11 reads and connects histone H3.3 lysine 36 trimethylation-decorated chromatin to regulated pre-mRNA processing. Mol. Celda 56, 298–310 (2014).

Zou, J. X., Revenko, A. S., Li, L. B., Gemo, A. T. & Chen, H. W. ANCCA, an estrogen-regulated AAA+ ATPase coactivator for ERα, is required for coregulator occupancy and chromatin modification. Proc. Natl Acad. Sci. Estados Unidos 104, 18067–18072 (2007).

Ciro, M. et al. ATAD2 is a novel cofactor for MYC, overexpressed and amplified in aggressive tumors. Cancer Res. 69, 8491–8498 (2009).

Revenko, A. S., Kalashnikova, E. V., Gemo, A. T., Zou, J. X. & Chen, H. W. Chromatin loading of E2F−MLL complex by cancer-associated coregulator ANCCA via reading a specific histone mark. Mol. Celda. Biol. 30, 5260–5272 (2010).

Leachman, N. T., Brellier, F., Ferralli, J., Chiquet-Ehrismann, R. & Tucker, R. P. ATAD2B is a phylogenetically conserved nuclear protein expressed during neuronal differentiation and tumorigenesis. Dev. Growth Differ. 52, 747–755 (2010).

Morozumi, Y. et al. Atad2 is a generalist facilitator of chromatin dynamics in embryonic stem cells. J. Mol. Celda. Biol. 8, 349–362 (2016).

Malovannaya, A. et al. Analysis of the human endogenous coregulator complexome. Celda 145, 787–799 (2011). A large-scale affinity purification–mass spectrometry study that charts endogenous human co-regulator complexes.

Cammas, F. et al. Cell differentiation induces TIF1β association with centromeric heterochromatin via an HP1 interaction. J. Cell Sci. 115, 3439–3448 (2002).

Ivanov, A. V. et al. PHD domain-mediated E3 ligase activity directs intramolecular sumoylation of an adjacent bromodomain required for gene silencing. Mol. Celda 28, 823–837 (2007).

Zeng, L. et al. Structural insights into human KAP1 PHD finger-bromodomain and its role in gene silencing. Nat. Struct. Mol. Biol. 15, 626–633 (2008).

Tubbs, A. T. et al. KAP-1 promotes resection of broken DNA ends not protected by γ-H2AX and 53BP1 in G1-phase lymphocytes. Mol. Celda. Biol. 34, 2811–2821 (2014).

Dupont, S. et al. FAM/USP9x, a deubiquitinating enzyme essential for TGFβ signaling, controls Smad4 monoubiquitination. Celda 136, 123–135 (2009).

Agricola, E., Randall, R. A., Gaarenstroom, T., Dupont, S. & Hill, C. S. Recruitment of TIF1γ to chromatin via its PHD finger-bromodomain activates its ubiquitin ligase and transcriptional repressor activities. Mol. Celda 43, 85–96 (2011).

Kim, J. & Kaartinen, V. Generation of mice with a conditional allele for Trim33. Génesis 46, 329–333 (2008).

Khetchoumian, K. et al. TIF1δ, a novel HP1-interacting member of the transcriptional intermediary factor 1 (TIF1) family expressed by elongating spermatids. J. Biol. Chem. 279, 48329–48341 (2004).

Bloch, D. B. et al. Sp110 localizes to the PML−Sp100 nuclear body and may function as a nuclear hormone receptor transcriptional coactivator. Mol. Celda. Biol. 20, 6138–6146 (2000).

Wasylyk, C., Schlumberger, S. E., Criqui-Filipe, P. & Wasylyk, B. Sp100 interacts with ETS-1 and stimulates its transcriptional activity. Mol. Celda. Biol. 22, 2687–2702 (2002).

Yordy, J. S. et al. SP100 expression modulates ETS1 transcriptional activity and inhibits cell invasion. Oncogén 23, 6654–6665 (2004).

Podcheko, A. et al. Identification of a WD40 repeat-containing isoform of PHIP as a novel regulator of β-cell growth and survival. Mol. Celda. Biol. 27, 6484–6496 (2007).

Huether, R. et al. The landscape of somatic mutations in epigenetic regulators across 1,000 paediatric cancer genomes. Nat. Comun. 5, 3630 (2014). This large-scale study provided important insights into the mutational landscape of BRD-containing proteins across 1,000 paediatric cancer genomes.

Forbes, S. A. et al. COSMIC: exploring the world's knowledge of somatic mutations in human cancer. Ácidos nucleicos Res. 43, D805–D811 (2015).

Cleary, S. P. et al. Identification of driver genes in hepatocellular carcinoma by exome sequencing. Hepatology 58, 1693–1702 (2013).

Cancer Genome Atlas Research Network. Comprehensive genomic characterization of squamous cell lung cancers. Naturaleza 489, 519–525 (2012).

Liu, J. y col. Genome and transcriptome sequencing of lung cancers reveal diverse mutational and splicing events. Genome Res. 22, 2315–2327 (2012).

Cancer Genome Atlas Research Network. Comprehensive molecular profiling of lung adenocarcinoma. Naturaleza 511, 543–550 (2014).

Liu, L. et al. Identification of hallmarks of lung adenocarcinoma prognosis using whole genome sequencing. Oncotarget 6, 38016–38028 (2015).

Peifer, M. et al. Integrative genome analyses identify key somatic driver mutations of small-cell lung cancer. Nat. Gineta. 44, 1104–1110 (2012).

Grunwald, C. et al. Expression of multiple epigenetically regulated cancer/germline genes in nonsmall cell lung cancer. En t. J. Cancer 118, 2522–2528 (2006).

Zheng, C. X. et al. Whole-exome sequencing to identify novel somatic mutations in squamous cell lung cancers. En t. J. Oncol. 43, 755–764 (2013).

Ho, A. S. et al. The mutational landscape of adenoid cystic carcinoma. Nat. Gineta. 45, 791–798 (2013).

Lourdusamy, A., Rahman, R. & Grundy, R. G. Expression alterations define unique molecular characteristics of spinal ependymomas. Oncotarget 6, 19780–19791 (2015).

Odejide, O. et al. A targeted mutational landscape of angioimmunoblastic T-cell lymphoma. Sangre 123, 1293–1296 (2014).

Petrini, I. et al. A specific missense mutation in GTF2I occurs at high frequency in thymic epithelial tumors. Nat. Gineta. 46, 844–849 (2014).

Ojesina, A. I. et al. Landscape of genomic alterations in cervical carcinomas. Naturaleza 506, 371–375 (2014).

Shang, P., Meng, F., Liu, Y. & Chen, X. Overexpression of ANCCA/ATAD2 in endometrial carcinoma and its correlation with tumor progression and poor prognosis. Tumor Biol. 36, 4479–4485 (2015).

Okosun, J. et al. Integrated genomic analysis identifies recurrent mutations and evolution patterns driving the initiation and progression of follicular lymphoma. Nat. Gineta. 46, 176–181 (2014).

Song, Y. et al. Identification of genomic alterations in oesophageal squamous cell cancer. Naturaleza 509, 91–95 (2014).

Gao, Y. B. et al. Genetic landscape of esophageal squamous cell carcinoma. Nat. Gineta. 46, 1097–1102 (2014).

Zhang, L. y col. Genomic analyses reveal mutational signatures and frequently altered genes in esophageal squamous cell carcinoma. Soy. J. Hum. Gineta. 96, 597–611 (2015).

Oh, H. R., An, C. H., Yoo, N. J. & Lee, S. H. Somatic mutations of amino acid metabolism-related genes in gastric and colorectal cancers and their regional heterogeneity — a short report. Celda. Oncol. (Dordr.) 37, 455–461 (2014).

Zhang, L. H. et al. TRIM24 promotes glioma progression and enhances chemoresistance through activation of the PI3K/Akt signaling pathway. Oncogén 34, 600–610 (2015).

Chen, Y. et al. TRIM66 overexpresssion contributes to osteosarcoma carcinogenesis and indicates poor survival outcome. Oncotarget 6, 23708–23719 (2015).

Kuroyanagi, J. et al. Zinc finger MYND-type containing 8 promotes tumour angiogenesis via induction of vascular endothelial growth factor-A expression. FEBS Lett. 588, 3409–3416 (2014).

Alekseyenko, A. A. et al. The oncogenic BRD4−NUT chromatin regulator drives aberrant transcription within large topological domains. Genes Dev. 29, 1507–1523 (2015).

Andreasen, S., French, C. A., Josiassen, M., Hahn, C. H. & Kiss, K. NUT carcinoma of the sublingual gland. Head Neck Pathol. 10, 362–366 (2015).

Reynoird, N. et al. Oncogenesis by sequestration of CBP/p300 in transcriptionally inactive hyperacetylated chromatin domains. EMBO J. 29, 2943–2952 (2010).

Pleasance, E. D. et al. Genoma de cáncer de pulmón de células pequeñas con firmas complejas de exposición al tabaco. Naturaleza 463, 184–190 (2010).

Gocho, Y. et al. A novel recurrent EP300ZNF384 gene fusion in B-cell precursor acute lymphoblastic leukemia. Leukemia 29, 2445–2448 (2015).

Marschalek, R. Systematic classification of mixed-lineage leukemia fusion partners predicts additional cancer pathways. Ana. Laboratorio. Medicina. 36, 85–100 (2016).

Panagopoulos, I. et al. Fusion of ZMYND8 y RELA genes in acute erythroid leukemia. Más uno 8, e63663 (2013).

Edgren, H. et al. Identification of fusion genes in breast cancer by paired-end RNA-sequencing. Genome Biol. 12, R6 (2011).

Kalyana-Sundaram, S. et al. Gene fusions associated with recurrent amplicons represent a class of passenger aberrations in breast cancer. Neoplasia 14, 702–708 (2012).

de Rooij, J. D. et al. Recurrent translocation t(1017)(p15q21) in minimally differentiated acute myeloid leukemia results in ZMYND11/MBTD1 fusión. Genes Chromosomes Cancer 55, 237–241 (2016).

Frattini, V. et al. The integrated landscape of driver genomic alterations in glioblastoma. Nat. Gineta. 45, 1141–1149 (2013).

Robinson, D. R. et al. Functionally recurrent rearrangements of the MAST kinase and Notch gene families in breast cancer. Nat. Medicina. 17, 1646–1651 (2011).

Asmann, Y. W. et al. Detection of redundant fusion transcripts as biomarkers or disease-specific therapeutic targets in breast cancer. Cancer Res. 72, 1921–1928 (2012).

Wu, W. J. et al. Prognostic relevance of BRD7 expression in colorectal carcinoma. EUR. J. Clin. Invertir. 43, 131–140 (2013).

Park, Y. A. et al. Tumor suppressive effects of bromodomain-containing protein 7 (BRD7) in epithelial ovarian carcinoma. Clin. Cancer Res. 20, 565–575 (2014).

Herquel, B. et al. Transcription cofactors TRIM24, TRIM28, and TRIM33 associate to form regulatory complexes that suppress murine hepatocellular carcinoma. Proc. Natl Acad. Sci. Estados Unidos 108, 8212–8217 (2011).

Xue, J. et al. Tumour suppressor TRIM33 targets nuclear β-catenin degradation. Nat. Comun. 6, 6156 (2015).

Varela, I. et al. Exome sequencing identifies frequent mutation of the SWI/SNF complex gene PBRM1 in renal carcinoma. Naturaleza 469, 539–542 (2011). This large-scale study demonstrated the power of the whole-exome sequencing technique to identify mutations in BRD-containing proteins.

Jiao, Y. et al. Exome sequencing identifies frequent inactivating mutations in BAP1, ARID1A y PBRM1 in intrahepatic cholangiocarcinomas. Nat. Gineta. 45, 1470–1473 (2013).

Wilson, B. G. & Roberts, C. W. SWI/SNF nucleosome remodellers and cancer. Nat. Rev.Cáncer 11, 481–492 (2011).

Egelhofer, T. A. et al. An assessment of histone-modification antibody quality. Nat. Struct. Mol. Biol. 18, 91–93 (2011).

Rothbart, S. B. et al. An interactive database for the assessment of histone antibody specificity. Mol. Celda 59, 502–511 (2015).

Zhang, G. y col. Down-regulation of NF-κB transcriptional activity in HIV-associated kidney disease by BRD4 inhibition. J. Biol. Chem. 287, 28840–28851 (2012).

Li, A. G. et al. An acetylation switch in p53 mediates holo-TFIID recruitment. Mol. Celda 28, 408–421 (2007).

Ciceri, P. et al. Dual kinase-bromodomain inhibitors for rationally designed polypharmacology. Nat. Chem. Biol. 10, 305–312 (2014).

Martin, M. P., Olesen, S. H., Georg, G. I. & Schonbrunn, E. Cyclin-dependent kinase inhibitor dinaciclib interacts with the acetyl-lysine recognition site of bromodomains. ACS Chem. Biol. 8, 2360–2365 (2013).

Dittmann, A. et al. The commonly used PI3-kinase probe LY294002 is an inhibitor of BET bromodomains. ACS Chem. Biol. 9, 495–502 (2014).

Ember, S. W. et al. Acetyl-lysine binding site of bromodomain-containing protein 4 (BRD4) interacts with diverse kinase inhibitors. ACS Chem. Biol. 9, 1160–1171 (2014).

Allen, B. K. et al. Large-scale computational screening identifies first in class multitarget inhibitor of EGFR kinase and BRD4. Sci. Reps. 5, 16924 (2015).

Kurimchak, A. M. et al. Resistance to BET bromodomain inhibitors is mediated by kinome reprogramming in ovarian cancer. Rep. Celular 16, 1273–1286 (2016).

Dawson, M. A. et al. Inhibition of BET recruitment to chromatin as an effective treatment for MLL-fusion leukaemia. Naturaleza 478, 529–533 (2011).

Stathis, A. et al. Clinical response of carcinomas harboring the BRD4−NUT oncoprotein to the targeted bromodomain inhibitor OTX015/MK-8628. Cancer Discov. 6, 492–500 (2016).

Bolden, J. E. et al. Inducible en vivo silencing of Brd4 identifies potential toxicities of sustained BET protein inhibition. Rep. Celular 8, 1919–1929 (2014).

Di Micco, R. et al. Control of embryonic stem cell identity by BRD4-dependent transcriptional elongation of super-enhancer-associated pluripotency genes. Rep. Celular 9, 234–247 (2014). References 182 and 183 raise concerns about the potential toxicity of inhibiting BET proteins.

Korb, E., Herre, M., Zucker-Scharff, I., Darnell, R. B. & Allis, C. D. BET protein Brd4 activates transcription in neurons and BET inhibitor Jq1 blocks memory in mice. Nat. Neurosci. 18, 1464–1473 (2015).

Fong, C. Y. et al. BET inhibitor resistance emerges from leukaemia stem cells. Naturaleza 525, 538–542 (2015).

Rathert, P. et al. Transcriptional plasticity promotes primary and acquired resistance to BET inhibition. Naturaleza 525, 543–547 (2015).

Shu, S. et al. Response and resistance to BET bromodomain inhibitors in triple-negative breast cancer. Naturaleza 529, 413–417 (2016).

Togel, L. et al. Dual targeting of bromodomain and extra-terminal domain proteins, and WNT or MAPK signaling, inhibits c-MYC expression and proliferation of colorectal cancer cells. Mol. Cancer Ther. 15, 1217–1226 (2016).


Using protein-protein interactions to annotate protein function

In addition to identifying disease-associated mutations, PrePPI can also be used to gain a better understanding of the cellular processes in which a gene or protein is involved. Similarly to how the Honig Lab took the BLAST concept and applied it to protein structure, they have also begun using PrePPI within a gene set enrichment analysis (GSEA) framework.

Using PrePPI for gene set enrichment analysis. To infer the function of a particular protein, Q, the Honig Lab places all proteins in the human proteome, lI, in a list and sorts them according to the interaction likelihood ratio between lI and Q. They then search for gene sets associated with a given Gene Ontology annotation that is enriched among the high-scoring interactors of Q. In the example, Gene Set 1 would be enriched whereas Gene Sets 2 and 3 would not be, since the proteins in those sets are either evenly distributed throughout the ranked list or clustered with proteins that are unlikely to interact with Q. The paper reports on top ranked gene sets found for BRCA1 and PEX2. (Image courtesy of eLife.)

For each protein, they queried PrePPI to construct a list of the proteins whose scores make them most likely to interact with it, and then, using GSEA, looked for the GO terms associated with each. They found that the top-ranked gene sets that PrePPI predicted accurately reflected their function, as documented in a resource called the Molecular Signatures Database (mSigDB). Moreover, through the automatic computational method made possible by PrePPI, they predicted the functions of approximately 2,000 additional proteins whose functions were previously unknown.

Honig cautions that the interactions and functions predicted using PrePPI should not necessarily be assumed as fact. Nevertheless, his lab’s tests so far indicate that they are largely reliable. “PrePPI is based on statistical analysis and not experiment, which is really the gold standard,” he explains. “What we’re ultimately trying to do with these methods is to generate hypotheses that can be cross-referenced with other computational and experimental methods. We’re excited because the number of interactions that PrePPI finds is unprecedented in scope, and so our hope is that it will help systems biologists and other biomedical researchers who do not typically look at structure to be able to incorporate information about this essential layer of activity into their investigations."

Related publications

Garzón JI, Deng L, Murray D, Shapira S, Petrey D, Honig B. A computational interactome and functional annotation for the human proteome. Elife. 2016 Oct 225. pii: e18715.

Westphalen CB, Takemoto Y, Tanaka T, Macchini M, Jiang Z, Renz BW, Chen X, Ormanns S, Nagar K, Tailor Y, May R, Cho Y, Asfaha S, Worthley DL, Hayakawa Y, Urbanska AM, Quante M, Reichert M, Broyde J, Subramaniam PS, Remotti H, Su GH, Rustgi AK, Friedman RA, Honig B, Califano A, Houchen CW, Olive KP, Wang TC. Dclk1 defines quiescent pancreatic progenitors that promote injury-induced regeneration and tumorigenesis. Cell Stem Cell. 2016 Apr 718(4):441-55.

Chen TS, Petrey D, Garzon JI, Honig B. Predicting peptide-mediated interactions on a genome-wide scale. PLoS Comput Biol. 2015 May 411(5):e1004248.

Zhang QC, Petrey D, Deng L, Qiang L, Shi Y, Thu CA, Bisikirska B, Lefebvre C, Accili D, Hunter T, Maniatis T, Califano A, Honig B. Structure-based prediction of protein-protein interactions on a genome-wide scale. Naturaleza. 2012 Oct 25490(7421):556-60.


Ver el vídeo: DNA μέρος 2ο: Ας φτιάξουμε πρωτεΐνες! (Diciembre 2022).