Benutzer:NadirSH/RC-Treffen Kassel

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Thema: Kategorisierung

[Bearbeiten | Quelltext bearbeiten]

Richtlinien: Kategorisierung von chemischen Verbindungen:

Grundregeln der Kategorisierung von Chemikalien

[Bearbeiten | Quelltext bearbeiten]
  • möglichst speziell (Anmerkung: nicht zuviele Einträge in einer Kategorie, Empfehlung: WP <200 Einträge, aber nicht < 10 Einträge.)
  • Es werden generell alle funktionellen Gruppen, auch bei komplizierteren Strukturen, berücksichtigt (Anmerkung: Sollte es nicht besser heißen, es werden alle Strukturelemente berücksichtigt?)
  • In Kategorien zu organischen Teilstrukturen ist es ausdrücklich erwünscht, dass in der Kategorie ein Strukturbild der jeweiligen Teilstruktur angegeben wird. (Anmerkung: Der Begriff Teilstruktur wird nicht explizit definiert)

Stand: 20.05.2019

12.851 Seiten in 659 Unterkategorien / Tiefe: 7 Ebenen

442 Kategorien ohne weitere Unterkategorien (67%), davon

160 mit weniger als 10 Einträgen (36,2%)
83 mit 1–5 Einträgen (18,8%)
77 mit 6–9 Einträgen (17,4%)

Anzahl der Einträge – inklusive Unterkategorien – für alle 659 Kategorien:

188 mit weniger als 10 Einträgen (28,5%)
20 mit > 200 Einträgen
Nr 200-300 Einträge 300-400 Einträge >400 Einträge
1 Chlorid‎ (205 S) Alken (18K, 303) Carbonsäure (10K, 390 S)
2 Fluoralkan‎ (206 S) Proteingruppe (3K, 316 S) Carbonsäureester (12K, 443 S)
3 Piperidin (1 K, 209 S)| Alkohol (17K, 318 S) Phenolether (468 S)
4 Ether‎ (15 K, 210 S) Carbonsäureamid (8K, 321 S)
5 Chloralkan‎ (218 S) Cyclohexan (2K, 321 S)
6 Aminobenzol‎ (266 S) Protein (24K, 325 S)
7 Phenol‎ (3 K, 266 S) Keton (12K, 341 S)
8 Chlorbenzol‎ (284 S) Amin (26K, 342 S)
9 Aromat (33K, 349S)

Derzeitige Schwachpunkte / Mögliche Verbesserungen

[Bearbeiten | Quelltext bearbeiten]
  • Zuviele kleine Kategorien
Vorschlag: Löschen der Kategorien mit <10 Seiten und keiner weiteren UKat (...sofern kein Potenzial für weiteren Ausbau gesehen wird).
  • Einige überdimensionierte Kategorien
Vorschlag: Verkleinern der Kategorien mit >200 Seiten, durch Anlegen neuer UKats:
Potenzial: konsequente Nutzung des Alkan-Strukturelements zur Kategorisierung
Phenolether (468 S)
Kategorie:Methoxybenzol
Kategorie:Ethoxybenzol
usw.
Carbonsäureester (12K, 443 S)
Kategorie:Alkansäuremethylester
Kategorie:Alkansäureethylester
usw.
Verwendung der Kategorie:Propionsäureester, Kategorie:Buttersäureester, etc. auch für Verbindungen mit weiteren funktionellen Gruppen/Heteroatomen am Carbonsäurerest. Einige Beispiele gibt es in der Kategorie:Essigsäureester (z.B. Chloressigsäuremethylester, Bromessigsäureethylester)
Carbonsäure (10 K, 391 S)
Kategorie:Ethansäure
Kategorie:Propansäure
Kategorie:Butansäure
usw.
  • Alkan-Strukturelemente in komplexen Verbindungen werden zurzeit weitestgehend nicht kategorisiert.
Vorschlag: Konsequente Kategorisierung von Alkan-Teilstrukturen. Neue Alkan-UKat anlegen: Kategorie:Methan, Kategorie:Ethan, Kategorie:Propan, usw.
Beispiel: 1,2-Cyclohexandicarbonsäurediisononylester, aktuell: Kategorie:Carbonsäureester, Kategorie:Cyclohexan – zukünftig zusätzlich Kategorie:Alkan (oder Kategorie:Nonan)
  • Überflüssige Parallelstrukturen:
Kategorie:Cycloalkan -> UKat von Kategorie:Alicyclische Verbindung und Kategorie:Alkan
Kategorie:Cycloalken -> UKat von Kategorie:Alicyclische Verbindung und Kategorie:Alken
Vorschlag: Die UKat der Kategorie:Alicyclische Verbindung werden wie die Kategorie:Alkan, Kategorie:Alken der Kategorie:Kohlenwasserstoff zugeordnet und die Kategorie:Alicyclische Verbindung wird gelöscht
  • Widersprüchliche Vorgehensweise bei der Verwendung von Kategorien:
In den meisten Fällen werden alle Verbindungen in eine Kategorie eingeordnet, die das entsprechende Strukturelement aufweisen, aber ansonsten beliebig substituiert sind. Es gibt jedoch einige Kategorien, die weitere Substituenten (Heteroatome) an Teilstrukturen explizit ausschließen (Kategorie:Aromatischer Kohlenwasserstoff, Kategorie:Alkylbenzol, Kategorie:Vinylverbindung, Kategorie:Allylverbindung, u.a.)
s. auch Diskussion Fluoralkan 05/2015
s. auch Diskussion Fluoralkylverbindung 04/2019
s. auch Details zur Kategorie:Kohlenwasserstoff
Eine grundsätzliche Entscheidung sollte getroffen werden, ob man für die Kategorisierung chemischer Verbindungen konsequent bei dem Teilstruktur-Prinzip mit beliebigen weiteren Substituenten bleibt oder parallel eine Teilstruktur-Kategorisierung mit exakter Teilstruktur erlaubt.


Vorschlag: Um die Kategorisierung möglichst einfach und konsistent zu halten, soll nur nach Teilstrukturen mit beliebigen weiteren Substituenten kantegorisiert werden.
Beispiel:
Kategorie:Propionsäureester (s. Diskussion Polybutylensuccinat): Kategorie enthält auch alle Verbindungen mit Substituenten an der Propionsäureteilstruktur
Beispiel: Bernsteinsäuredimethylester, aktuell: Kategorie:Carbonsäureester, zukünftig: Kategorie:Propionsäureester, Kategorie:Alkan (oder Kategorie:Methan


Falls man sich darauf einigt, dass auch eine Teilstruktur-Kategorisierung mit exakter Teilstruktur erlaubt sein soll, so ist dies möglichst eindeutig zu definieren.
Mögliche Festlegung: Die in der Kategorie definierte Grundstruktur organischer Verbindungen kann beliebig substituiert sein. D.h. jedes Kohlenstoff-gebundene H-Atom kann durch eine beliebige funktionelle Gruppe, bzw. durch ein beliebiges Heteroatom ersetzt werden.
Hat laut Kategoriebezeichnung eine Grundstruktur bereits einen Substituenten, so werden nur Seiten in die Kategorie eingeordnet, die exakt diesen Substituenten aufweisen.
Beispiele:
Kategorie:Alkylbenzol: Benzolring beliebig substituiert, aber mindestens eine unsubstituierte Alkylgruppe (-CnH2n+1)
Alkansäure (68 S): lt. Kategoriedefinition nur Vertreter ohne weitere Heteroatome. Statt dessen alle Alkansäurederivate mit beliebigen weiteren funktionellen Gruppen, bzw. Heteroatomen. (analog Kategorie:Alkensäure)
Kategorie:Phenylalkan: Alkan beliebig substituiert, aber mindestens eine unsubstituierte Phenylgruppe (-C6H5)
Alternativ: In der Kategoriebezeichnung wird bereits kenntlich gemacht, dass die Teilstrukturen keine weiteren funktionellen Gruppen oder Heteroatome aufweisen sollen.
Beispiele:
Kategorie:Alkylbenzol, unsubstituiert: keine Heteroatome im Benzolring, bzw. Seitenkette.
Kategorie:Fluoralkan, unsubstituiert: außer Fluor keine weiteren Heteroatome oder funktionelle Gruppen am Alkanrest.
  • Unterschiedliche Definition in ähnlichen Kategorien:
Beispiel: Kategorie:Alkanon / Kategorie:Cycloalkanon
Kategorie:Alkanon:
Unterkategorie von Kategorie:Keton
Def.: gesättigte Ketone mit Alkylresten ohne Heteroatome
Kategorie:Cycloalkanon:
Unterkategorie von Kategorie:Keton und Kategorie:Cycloalkan
Def.: keine weitere Einschränkung bez. Heteroatome, beliebige Substituenten in den Seiten der UKats Kategorie:Cyclohexanon und Kategorie:Cyclopentanon
(analog: Kategorie:Alkanol/Kategorie:Cycloalkanol)
Vorschlag: Vergleichbare Kategorien sollen auch in analoger Weise Behandelt werden
Kategorie:Alkanon als Unterkategorie von Kategorie:Keton und Kategorie:Alkan, neue Def.: gesättigte Ketone mit beliebig substitierten Alkylresten.
  • Teilweise unpräzise Definition der Kategorien:
Welche Variationen in der Teilstruktur sollen erlaubt sein?
Beispiel:
Kategorie:Azin -> Nach der Bezeichnung ein Sechsring mit Stickstoffatom. Laut Kat.-Def. kann der Sechsring aber weitere Heteroatome aufweisen.
Kategorie:Pyridin als UKat der Kategorie:Azin wird Verbindungen mit der exakten Teilstruktur verwendet.
Die Definition der Kategorie:Azin Ist problematisch, da beispielsweise die UKat Kategorie:Thiazin besser als UKat der Kategorie:Dihydroazin aufgehoben wäre.
Vorschlag:Alternative Vorgehensweise bei heterocyclischen Verbindungen:
Heterocyclen, die sich durch Art und Anzahl der Heteroatome und die Zahl der Doppelbindungen im Ring unterscheiden, sollten immer in parallelen Kategorien untergebracht werden. Falls es die entsprechende Kategorie nicht gibt, wird die Seite in der oder den übergeordneten Kategorien untergebracht.
  • Eine Kategorie, die keine zusätzlichen Strukturinformationen, bzw. Detaillierung beinhaltet, sollte nicht an eine Strukturkategorie angehängt werden.
Beispiele:
Kategorie:TropanalkaloidKategorie:Psychotropes Tropanalkaloid (d.h. die Seiten in der Kategorie:Psychotropes Tropanalkaloid werden in beide Kategorien einsortiert. Wird bei Atropin bereits so gemacht)
Kategorie:Anthrachinon‎Kategorie:Anthrachinon-Farbstoff‎ (d.h. die Seiten in der Kategorie:Anthrachinon-Farbstoff‎ (z.B. Chinalizarin) werden in beide Kategorien einsortiert)
  • Ergänzende Regelungen für die Richtlinie zur Kategorisierung chemischer Strukturen:
Kategorien homologer Strukturelemente werden stets parallel unter derselben übergeordneten Kategorie eingeliedert. Gibt es für homologe Verbindungen keine eigene Kategorie, so werden diese in die übergeordnete Kategorie eingeliedert.
Beispiel: Mögliche UKat für Kategorie:Alkan: Kategorie:Methan, Kategorie:Ethan, Kategorie:Propan, usw.
Obwohl man formal Ethan als substituiertes Methan beschreiben kann, ist Kategorie:Ethan keine UKat von Kategorie:Methan.
Falls es keine eigene Kategorie:Hexan gibt, werden Hexan-Derivate in die Kategorie:Alkan eingeordnet, obwohl Hexan als substituiertes Methan, Ethan, Propan, usw. beschrieben werden kann.
Analoge Vorgehensweise für kondensierte aromatische Systeme:
Kategorie:Naphthalin ist keine UKat der Kategorie:Benzol.
Definition des Begriffs Teilstruktur für organische Verbindungen:
Organische Verbindungen die man durch den Ersatz eines C-gebundener H-Atoms durch eine beliebige funktionelle Gruppe, bzw. durch ein beliebiges Heteroatom beschreiben kann, werden der entsprechenden Teilstruktur-Kategorie zugeordnet.

Fragen / Diskussionspunkte

[Bearbeiten | Quelltext bearbeiten]