Benutzer:Rjh/Protein-erstellungs-Programm

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

WebAccessProtein (so der Name des Programmes) ist ein Windows-Programm das die Uniprot-Datenbank Seiten nach Informationen scannt, um daraus eine Vorlage für Artikel zu machen. Es muss die Uniprot Nummer oder der Name des Proteins eingegeben werden und dann per Mausklick die jeweilige Seite aufgerufen und ausgewertet werden. Die Vorlage kann man sich dann entweder aus dem unteren Edit Fenster kopieren oder in eine (auch Unicode) Textdatei speichern.

Benutzung[Bearbeiten | Quelltext bearbeiten]

  1. Uniprot-Nummer oder Name des Proteins oben links eingeben (am besten vorher in die Zwischenablage kopieren, dann trägt sie sich selbst ein)
  2. "Uniprot-aufrufen" Button drücken und dann "auswerten" Button drücken
  3. Wenn noch Orthologe ausgefüllt werden soll, dann jetzt auf Orthologie klicken und dann dort noch mal auf auswerten (der Button daneben).
  4. Entweder Speichern drücken oder den Inhalt aus dem Textfeld unten kopieren (per Button oder manuell über markieren )

Feature-Requests oder Bugs melden[Bearbeiten | Quelltext bearbeiten]

  • Disease nicht ausgefüllt Sonabi] ( 1.0.0.1)
  • ein Bild ist meistens nicht unter der PDB-Nummer bei Commons gespeichert und es gibt m.E. keine Möglichkeit zur Darstellung von extern bei PDB gespeicherten Bildern. Da würde es vermutlich mehr Sinn machen, die ersten drei PDB-Einträge in der Infobox im Feld PDB einzutragen und das Feld Bild freizulassen (das Bild würde ich aus dem en.wp-Artikel besorgen, falls dort vorhanden). Ghilt ( 1.0.0.3)
  • Bei der Nummer Q62401 kommt in der Auswertung noch HTML vor. Ghilt ( 1.0.0.3)
  • Es wäre schön, wenn Orthologe auch dabei wären. Sonabi] ( 1.0.0.5)
    • Ich finde kein Beispiel, so dass ich das nicht zur Zeit nicht umsetzen kann. --Rjh
Zum Beispiel bei N-WASP, da waren die Orthologe nicht dabei; oder meinst du was anderes? --Sonabi
Wie ich sehe gibt es da eine Vorlage. Ich weiß nur nicht, mit welchen Elementen aus Uniprot ich die ausfüllen soll und ob ich sie immer oder nur in bestimmten Fällen eintragen soll.
  • Wenn möglich, wäre es toll wenn OMIM und MGI-Nummern auch gleich dabei wären --Sonabi
Das Programm bedient sich aus Uniprot, wo OMIM und MGI nicht aufgeführt werden. --Ghilt (Diskussion) 17:32, 21. Okt. 2016 (CEST)
@Ghilt:@Rjh:: Ich weiß, dass das Programm seine Daten ausschließlich aus UniProt rekurtiert. Für meine Vorschläge sind aber weitere Datenbanken vonnöten (mindestens GeneCards oder Entrez; an die käme man auch ran, ohne zusätzliche Nummern angeben zu müssen). Ich erwarte nicht, dass so etwas gleich passiert oder Rjh sich meinetwegen in zusätzliche Arbeit stürzt. Das sind nur Vorschläge, die schön wären und Arbeit abnehmen würden. Gruß --Sonabi (Diskussion) 22:30, 21. Okt. 2016 (CEST)
GeneCards wurde im September letzten Jahres so umgestellt, dass die Info im Quelltext nicht mehr verfügbar ist. Zudem enthält es m.E. nur humane Gene. Auf GeneCards basierte der nicht mehr funktionierende Vorgänger von WebAccessProtein, Gene2Wiki. Aber vielleicht geht Entrez, Grüße, --Ghilt (Diskussion) 23:05, 21. Okt. 2016 (CEST)
Wenn ihr mir sagt, wo ich die Informationen in verwertbarer Form finde, dann kann ich die Sammlung von dort auch einbinden. Rjh (Diskussion) 08:09, 22. Okt. 2016 (CEST)
OMIM gäbe es bei Entrez als Link in der rechten Spalte oder unter der Entrez-Nummer hier, bei EntrezGene funktioniert die Suche mit Namen, Abkürzung oder Uniprot-Nummer. Grüße, --Ghilt (Diskussion) 09:12, 22. Okt. 2016 (CEST)
Ich hab mal versucht die Daten zusammenzutragen. MGI konnte ich nicht finden. Bitte mal ausprobieren. Auch auf die bisherigen Daten noch mal schauen, da ich den Code nochmal überarbeitet hab. ( 1.0.0.5) Rjh (Diskussion) 11:12, 31. Okt. 2016 (CET)
Sorry für die lange Antwort-Pause. Ich hab dein Programm jetzt nochmal in der neusten Version (1.0.0.6?) für das Protein WASF2 ausprobiert. Die Omim-Nummer und die Orthologe beim Menschen waren sehr schön dabei. Die bei der Maus (auch wenn ich die Entrez-Seite für die Maus im Programm aufgerufen habe, leider nicht. Danke für die Arbeit; vielleicht deine Anleitung oben noch aktualisieren. Lg --Sonabi (Diskussion) 13:53, 23. Nov. 2016 (CET)
Das mit der Maus ist klar, weil ich nur für den ersten Teil was eingebaut habe. Da müsste ich mir erstmal überlegen, wie ich da die Unterscheidung mache. Also wie ich zwischen linkem und rechten Eintrag unterscheide. Rjh (Diskussion) 07:21, 24. Nov. 2016 (CET)
Ist nun drin. Es gibt nun zwei Tasten für den linken und rechten Bereich. Ausserdem hab ich versucht das Chromosom noch zu erkennen. Für die Spezies hab ich erstmal nur Mensch und Hausmaus direkt ins Deutsche übersetzt. Ansonsten bleibt es bei dem was da steht. ( 1.0.0.7) Rjh (Diskussion) 16:57, 28. Dez. 2016 (CET)
  • bei WASF2 hat das Programm PDB-Code "unknown" ausgespukt, obwohl ein Eintrag vorhanden ist (2A40) Sonabi]
    • Hmm, bei mir spuckt er die 2A40 raus. Mit welcher Version hast Du probiert ? Rjh (Diskussion) 11:44, 29. Okt. 2016 (CEST)( 1.0.0.3)
      • Habs jetzt nochmals mit der neusten ausprobiert und es funktioniert. Danke --Sonabi (Diskussion) 13:53, 23. Nov. 2016 (CET)
  • Könnte der String "Human chromosome 16" auf der Uniprot-Seite (mögliche Werte 1-22, X, Y) in die "Kategorie:Codiert auf Chromosom 16 (Mensch)" konvertiert werden? Ghilt
    • Ja, das dürfte gehen. Schau ich mir an. Rjh (Diskussion) 20:41, 30. Okt. 2016 (CET)( 1.0.0.4)
  • Es gibt noch HTML-Reste beim Abrufen von CD20 human (in der Infobox)( 1.0.0.6) und CD21 human (unter 'Eigenschaften') Ghilt
    • Bei CD21 sehe ich keine html-Reste unter Eigenschaften? Rjh
      Unter Keywords, folgender string "<p><a href="/manual/evidences#ECO:0000256">More…</a" Ghilt
  • Komisch. Sehe ich nicht. Und an der Stelle hab ich auch nichts geändert. Bei mir steht da:
Keywords - Molecular function: Host cell receptor for virus entry, Receptor
Keywords - Biological process: Complement pathway, Host-virus interaction, Immunity, Innate immunity
Keywords - PTM: Disulfide bond, Glycoprotein
Keywords - Disease: Systemic lupus erythematosus,
  • +Zeichen statt Leerstellen beim Mesh-Weblink - Mesh will es leider so Ghilt ( 1.0.0.6)
  • Commonscat-Weblink raus - gibts zu selten Ghilt ( 1.0.0.6)
  • In der Infobox das Feld 'Bild' leerlassen und die drei PDB Links dafür gemeinsam im Feld 'PDB' Ghilt ( 1.0.0.6)
  • Aus Uniprot die weiteren Abschnitte unter Function bei Integrin beta-1 wurden nicht übernommen Ghilt
    • Du meinst "Isoform 5" und "(Microbial infection)" ? Rjh (Diskussion) 17:30, 15. Nov. 2016 (CET)
      Ja, und vielen Dank! Ghilt
  • ( 1.0.0.6) -> Das war schwerer. Da musste ich jetzt fummeln, da das ineinander verschachtelt war. Bitte mal aufpassen, dass "Funktion" nicht ab und zu ganz leer ist oder das sich komische Effekte ergeben, weil ich eine Basisfunktion korrigieren musste. Ich hab bei CD20, CD21, Q62401, WASF2 und eben Integrin beta-1 gegengetestet und da ging es auf jeden Fall. Rjh (Diskussion) 18:32, 15. Nov. 2016 (CET)
  • So ist hochgeladen (im WebSpace, den Link hab ich rumgeschickt). Ich geh jetzt erst mal was essen. ;) Rjh (Diskussion) 18:35, 15. Nov. 2016 (CET)
Vielen Dank, aber wann sollte ich den Link erhalten haben? Grüße, --Ghilt (Diskussion) 19:01, 15. Nov. 2016 (CET)
Stimmt. Ich dachte ich hab den Link an die gesamte Redaktion geschickt. Aber anscheinend nur an die die mich gefragt haben. Ich hab gerade den Link noch mal an Dich geschickt. Allerdings ist anscheinend gerade der Server down, also vielleicht in einer Stunde nochmal probieren. Rjh (Diskussion) 20:53, 15. Nov. 2016 (CET)
 ((Infobox Protein
 | Name           = Integrin beta-1
 | Bild           = 
 | Bild_legende   = 
 | Andere Namen   = Fibronectin receptor subunit beta, Glycoprotein IIa, GPIIA
 | PDB            = ((PDB|1K11)), ((PDB|1LHA)), ((PDB|3G9W))
 | Groesse        = 798 ((Aminosäuren)), 88.415 ((Atomare Masseneinheit|Da))
 | Kofaktor       =
 | Precursor      =
 | Struktur       =
 | Isoformen      =
 | HGNCid         = 6153
 | Symbol         =
 | AltSymbols     =
 | GeneCards      = ITGB1
 | OMIM           = 
 | UniProt        = P05556
 | MGIid          =
 | CID            =
 | CAS            =
 | CASergänzend   =
 | ATC-Code       =
 | DrugBank       =
 | Wirkstoffklasse =
 | TCDB           =
 | TranspText     =
 | EC-Nummer      = 
 | Kategorie      =
 | Peptidase_fam  =
 | Inhibitor_fam  =
 | Reaktionsart   =
 | Substrat       =
 | Produkte       =
 | MoreEC1        =
 | MoreEC2        =
 | MoreEC3        =
 | Homolog_db     = HBG006190
 | Homolog_fam    =
 | Taxon          =
 | Taxon_Ausnahme =
 | Orthologe      =
  <!--(( Protein Orthologe
 | Spezies1 = Mensch
 | Spezies2 =
 | S1_EntrezGene = 
 | S1_Ensembl = 
 | S1_RefseqmRNA = 
 | S1_RefseqProtein = 
 | S1_GenLoc_db =
 | S1_GenLoc_chr =
 | S1_GenLoc_start = 
 | S1_GenLoc_end = 
 | S1_Uniprot = P05556
 | S2_EntrezGene =
 | S2_Ensembl =
 | S2_RefseqmRNA =
 | S2_RefseqProtein =
 | S2_GenLoc_db =
 | S2_GenLoc_chr =
 | S2_GenLoc_start =
 | S2_GenLoc_end =
 | S2_Uniprot =
 ))-->
 ))
 
 '''Integrin beta-1''' ist ein ((Protein)) aus ((Mensch))en/((Säugetiere))n/((Wirbeltiere))n.
 
 == Eigenschaften ==
 Tissue specificity: Isoform 1 is widely expressed, other isoforms are generally coexpressed with a more restricted distribution. Isoform 2 is expressed in skin, liver, skeletal muscle, cardiac muscle, placenta, umbilical vein endothelial cells, neuroblastoma cells, lymphoma cells, hepatoma cells and astrocytoma cells. Isoform 3 and isoform 4 are expressed in muscle, kidney, liver, placenta, cervical epithelium, umbilical vein endothelial cells, fibroblast cells, embryonal kidney cells, platelets and several blood cell lines. Isoform 4, rather than isoform 3, is selectively expressed in peripheral T-cells. Isoform 3 is expressed in non-proliferating and differentiated prostate gland epithelial cells and in platelets, on the surface of erythroleukemia cells and in various hematopoietic cell lines. Isoform 5 is expressed specifically in striated muscle (skeletal and cardiac muscle).
 
 Function: Integrins alpha-1/beta-1, alpha-2/beta-1, alpha-10/beta-1 and alpha-11/beta-1 are receptors for collagen. Integrins alpha-1/beta-1 and alpha-2/beta-2 recognize the proline-hydroxylated sequence G-F-P-G-E-R in collagen. Integrins alpha-2/beta-1, alpha-3/beta-1, alpha-4/beta-1, alpha-5/beta-1, alpha-8/beta-1, alpha-10/beta-1, alpha-11/beta-1 and alpha-V/beta-1 are receptors for fibronectin. Alpha-4/beta-1 recognizes one or more domains within the alternatively spliced CS-1 and CS-5 regions of fibronectin. Integrin alpha-5/beta-1 is a receptor for fibrinogen. Integrin alpha-1/beta-1, alpha-2/beta-1, alpha-6/beta-1 and alpha-7/beta-1 are receptors for lamimin. Integrin alpha-4/beta-1 is a receptor for VCAM1. It recognizes the sequence Q-I-D-S in VCAM1. Integrin alpha-9/beta-1 is a receptor for VCAM1, cytotactin and osteopontin. It recognizes the sequence A-E-I-D-G-I-E-L in cytotactin. Integrin alpha-3/beta-1 is a receptor for epiligrin, thrombospondin and CSPG4. Alpha-3/beta-1 may mediate with LGALS3 the stimulation by CSPG4 of endothelial cells migration. Integrin alpha-V/beta-1 is a receptor for vitronectin. Beta-1 integrins recognize the sequence R-G-D in a wide array of ligands. Isoform 2 interferes with isoform 1 resulting in a dominant negative effect on cell adhesion and migration (in vitro). When associated with alpha-7/beta-1 integrin, regulates cell adhesion and laminin matrix deposition. Involved in promoting endothelial cell motility and angiogenesis. Involved in osteoblast compaction through the fibronectin fibrillogenesis cell-mediated matrix assembly process and the formation of mineralized bone nodules. May be involved in up-regulation of the activity of kinases such as PKC via binding to KRT1. Together with KRT1 and RACK1, serves as a platform for SRC activation or inactivation. Plays a mechanistic adhesive role during telophase, required for the successful completion of cytokinesis. Integrin alpha-3/beta-1 provides a docking site for FAP (seprase) at invadopodia plasma membranes in a collagen-dependent manner and hence may participate in the adhesion, formation of invadopodia and matrix degradation processes, promoting cell invasion. ITGA4:ITGB1 binds to fractalkine (CX3CL1) and may act as its coreceptor in CX3CR1-dependent fractalkine signaling (PubMed:<a href="/citations/23125415">23125415</a>, PubMed:<a href="/citations/24789099">24789099</a>). ITGA4:ITGB1 and ITGA5:ITGB1 bind to PLA2G2A via a site (site 2) which is distinct from the classical ligand-binding site (site 1) and this induces integrin conformational changes and enhanced ligand binding to site 1 (PubMed:<a href="/citations/18635536">18635536</a>, PubMed:<a href="/citations/25398877">25398877</a>). ITGA5:ITGB1 acts as a receptor for fibrillin-1 (FBN1) and mediates R-G-D-dependent cell adhesion to FBN1 (PubMed:<a href="/citations/12807887">12807887</a>, PubMed:<a href="/citations/17158881">17158881</a>).
 
 Molecular function:
 * actin binding
 * cadherin binding involved in cell-cell adhesion
 * cell adhesion molecule binding
 * collagen binding involved in cell-matrix adhesion
 * coreceptor activity
 * fibronectin binding
 * metal ion binding
 * protease binding
 * protein complex binding
 * protein heterodimerization activity
 * virus receptor activity
 
 Biological process:
 * axon extension
 * B cell differentiation
 * calcium-independent cell-matrix adhesion
 * cardiac muscle cell differentiation
 * cell adhesion mediated by integrin
 * cell-cell adhesion mediated by integrin
 * cell fate specification
 * cell-matrix adhesion
 * cell migration
 * cell migration involved in sprouting angiogenesis
 * cell-substrate adhesion
 * cellular defense response
 * cellular response to low-density lipoprotein particle stimulus
 * dendrite morphogenesis
 * extracellular matrix organization
 * formation of radial glial scaffolds
 * G1/S transition of mitotic cell cycle
 * germ cell migration
 * heterotypic cell-cell adhesion
 * homophilic cell adhesion via plasma membrane adhesion molecules
 * integrin-mediated signaling pathway
 * in utero embryonic development
 * leukocyte cell-cell adhesion
 * leukocyte migration
 * leukocyte tethering or rolling
 * mesodermal cell differentiation
 * negative regulation of anoikis
 * negative regulation of cell differentiation
 * negative regulation of Rho protein signal transduction
 * positive regulation of apoptotic process
 * positive regulation of cell proliferation
 * positive regulation of establishment of protein localization to plasma membrane
 * positive regulation of GTPase activity
 * receptor internalization
 * regulation of cell cycle
 * regulation of collagen catabolic process
 * regulation of immune response
 * sarcomere organization
 * visual learning
 
 Keywords - Molecular function: Host cell receptor for virus entry, Integrin, Receptor
 Keywords - Biological process: Cell adhesion, Host-virus interaction
 Keywords - PTM: Acetylation, Disulfide bond, Glycoprotein, Isopeptide bond, Phosphoprotein, Ubl conjugation
 Keywords - Disease: 
 
 == Weblinks ==
 * ((MeshName|Integrin+beta-1))
 
 == Einzelnachweise ==
 <references />
 
 ((Kategorie:Protein))
 ((Kategorie:Codiert auf Chromosom 10 (Mensch)))