Vorlage Diskussion:Infobox Gemeinde in Frankreich/Archiv/2010

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Pamandzi funzt nicht

Die Infobox mag Pamandzi nicht, die INSEE-Zahl sei nicht korrekt, und und und... Was tun?

Später funktionierte sie doch, aber mit der Postleitzahl als INSEE-Code.--Stanzilla 16:27, 11. Jan. 2010 (CET)
Es mit der Postleitzahl als INSEE-Code zu versuchen, ist zwar eine ganz nette Idee, funktioniert hier aber nur zufällig.
Der INSEE-Code von Mayotte wurde schon mit dem Code officiel géographique 2008 von 985 nach 976 geändert, hat sich aber aus irgendwelchen Gründen noch nicht besonders weit herumgesprochen. Die aktuellen INSEE-Codes sind unter http://www.insee.fr/fr/methodes/default.asp?page=nomenclatures/cog/outremer.htm#mayotte zu finden. Dass bei Pamandzi auch die letzten beiden Ziffern anscheinend mit der Postleitzahl übereinstimmen, ist reiner Zufall. --Entlinkt 17:07, 11. Jan. 2010 (CET)
Danke für den Link, ich hatte auch auf der INSEE-Seite gesucht aber offensichtlich zu früh aufgegeben.--Stanzilla 13:08, 12. Jan. 2010 (CET)

unter Parameter stehen aber noch die alten Einträge

Unter Parameter stehen aber noch die alten Einträge. Ist das gewollt?--Stanzilla 13:25, 20. Feb. 2010 (CET)

Die dort ab lat-deg abwärts sind Absicht. Ich hatte mir das so gedacht, dass sie stehenbleiben, bis sie in keinem Artikel mehr im Quelltext stehen, damit niemand, der sie irgendwo findet, sich wundert, wofür sie eigentlich da sind. Ein bisschen Transparenz halt. --Entlinkt 13:32, 20. Feb. 2010 (CET)

Botlauf März 2010

Kann man nicht PatDis Bot rumschicken und die Infoboxen aktualisieren?--Stanzilla 09:36, 28. Feb. 2010 (CET)

Kann ich gerne anbieten. Bitte halt zusammenstellen, was er optimalerweise alles ändern sollte. Damit wir vielleicht mehrere Aufgaben in einem Streich erledigen können. Grüße, Patrick, «Disk» «V» 10:27, 28. Feb. 2010 (CET)
Entlinkt kann das natürlich besser sagen, ich würde sagen die Einträge ign, sans, date-sans, dens, locode, maire, mandat und intercomm löschen und statt blason, site, image und description, die neuen Begriffe einfügen.--Stanzilla 10:58, 28. Feb. 2010 (CET)

Das Hauptziel, die Kompatibilität zu einer der beiden meistverwendeten französischen Vorlagen wiederherzustellen, ist erreicht (es gibt noch ein halbes Dutzend mehr Vorlagen in der französischen Wikipedia, die kaum benutzt werden; Kompatibilität zu allen ist nicht möglich). Die Anpassung der vorhandenen Einbindungen ist eigentlich mehr Kür als Pflicht (die alten Parameter funktionieren ja weiter). Folgendes könnte ohne jeden Verlust gemacht werden:

  • Bei km² das Komma durch einen Punkt ersetzen (eine unendliche Geschichte ist das)
  • lat-deg/lat-min/lat-sec/lat und lon-deg/lon-min/lon-sec/lon (de:-Erfindungen) zu latitude und longitude zusammenfassen
  • site (de:-Erfindung) zu siteweb umbenennen
  • blason (de:-Erfindung) zu armoiries umbenennen
  • description (de:-Erfindung) zu image-desc umbenennen
  • locode (de:-Erfindung) entfernen, wo es leer ist
  • dens (sinnfrei) entfernen
  • ign (nicht mehr funktionierende de:-Erfindung) entfernen
  • depnr (sinnfreie de:-Erfindung) entfernen
  • hectares (sinnfrei) entfernen

Folgendes wird aus „unserer“ Sicht nicht gebraucht, aber es könnte Einwände grundsätzlicherer Art geben:

  • sans
  • date-sans

Bei folgendem hätte ich Bauchschmerzen:

  • maire, mandat. maire wird zurzeit nur bei Paris ausgewertet (weil der maire de Paris, der eigentlich kein gewöhnlicher maire ist, auch im Rang eines président du conseil général steht; der conseil de Paris, der kein gewöhnlicher conseil municipal ist, steht auch im Rang eines conseil général), mandat nirgendwo. Größtenteils sind diese Daten veraltet, aber bei Neuanlagen würden sie sich eh wieder ansammeln; gelegentlich sieht man auch, dass Leute die Daten trotzdem pflegen, weil sie vielleicht annehmen, sie würden doch irgendwann „aktiviert“ werden. Ich persönlich taste diese Daten nicht an und hätte kein gutes Gefühl, sie flächendeckend zu entfernen.
  • intercomm (Gemeindeverband) sollte eigentlich auswertet werden. Als vor Jahren diese Box importiert und dieser Parameter nicht übernommen wurde, war das meiner Meinung nach ein Fehler. Der Gemeindeverband ist wichtig; tendenziell wichtiger als die diversen Gemeindeverbände, die es anderswo (etwa in Deutschland) gibt, weil die französischen Gemeinden so klein sind, dass sie auf Verbände quasi angewiesen sind. 33636 der 36681 französischen Gemeinden (91,7 %) gehören einem Gemeindeverband an (Europa + DOM-ROM, Gebietsstand 1. Januar 2008, Anteil dürfte durch Umwandlung von Zweckverbänden weiter gestiegen sein); das ist die französische Lösung für die Probleme, die andernorts durch Zwangseingemeindungen gelöst werden (Zwangseingemeindungen wären auch in Frankreich rechtlich möglich, aber politisch nicht durchsetzbar). In den Anfangszeiten des Projekts wurde leider der Schwerpunkt auf die Kantone gelegt, die wohl für sowas wie Gemeindeverbände gehalten wurden. Paradoxerweise steht die Tatsache, dass der Parameter teilweise vorhanden ist, einer schnellen „Aktivierung“ im Weg, weil er nicht immer richtig ist und die Fehler sichtbar würden. Da wird man sich etwas überlegen müssen (oder es halt lassen); Schnellschüsse sind zu vermeiden. Im Zweifelsfall nicht antasten.

So insgesamt sehe ich jetzt eigentlich keinen Grund, schnell irgendwas zu machen. Es wäre schon ganz gut, wenn neue Artikel gleich von Anfang an die neuen Parameter verwenden, aber es braucht sich niemand genötigt fühlen, die alten möglichst schnell überall zu ersetzen. Die alten Parameter werden so lange weiter unterstützt, bis der letzte Artikel umgestellt ist. Langfristig sollte das natürlich schon gemacht werden. --Entlinkt 16:05, 28. Feb. 2010 (CET)

Ich wusste nicht, dass Maire überhaupt irgendwo ausgewertet wird, dann kann man das natürlich nicht ändern. Wenn die intercomms noch irgendwann dargestellt werden ist es natürlich angebracht sie zu belassen, allerdings hab ich schon sehr viele aus der Infobox gelöscht und in den Fließtext geschrieben, das gleiche gilt für sans, date-sans (allerdings nur gelöscht, nicht in den Fließtext).
Bei neuen Artikeln, die nicht die aktuelle Infobox verwenden, wird in den meisten Fällen die französische Infobox verwandt. Manchmal wird auch eine ältere Version der deutschen Infobox verwendet, aber wenn die Infoboxen alle aktualisiert wären, gäbe es keine älteren Versionen. Warum soll man den Bot nicht wenigstens die deutschsprachigen Erfindungen entfernen oder umschreiben lassen, wenn er das kann?--Stanzilla 16:53, 28. Feb. 2010 (CET)
Bei maire gibt es wohl ein Missverständnis: Überall außer bei Paris kann es durchaus entfernt werden, bzw. es macht keinen Unterschied, ob es da ist oder nicht, die Angabe wird einfach ignoriert. Nur würde ich persönlich es nicht per Bot flächendeckend entfernen bzw. wenn ich Botbetreiber wäre, es nicht machen wollen, um niemanden vor den Kopf zu stoßen. Einen expliziten „Beschluss“, den Bürgermeister nicht anzuzeigen, auf den man sich berufen könnte, hat es meines Wissens nie gegeben. Letztlich ist es aber wurscht (dass der Parameter außer bei Paris jemals irgendwo eingeführt wird, ist sowas von unwahrscheinlich).
intercomm wäre ein längerfristiges Projekt. Ich weiß noch gar nicht, wie man das angehen kann. Wenn der Parameter nirgendwo vorhanden wäre, könnte man ihn sofort einführen (natürlich optional; muss aber eh optional sein, weil nicht alle Gemeinden einem Verband angehören) und sagen, ab jetzt muss das, was dort steht, entweder richtig sein oder es darf gar nichts da sein. Eine mögliche Lösung wäre, alles per Bot zu entfernen und komplett neu anzufangen. Es gibt andere denkbare Lösungen (Parameter departementsweise aktivieren und nach und nach die Gemeinden eines Departements überprüfen). Solange das nicht geklärt ist, würde ich davon abraten, den Parameter anzurühren.
sans und date-sans sind eine längere, technisch-trockene Geschichte. Es gab mal eine ergebnislose Diskussion über das Für und Wider des Entfernens, die ich gerade nicht wiederfinde. Ich persönlich meine, dass die Argumente fürs Behalten nicht mehr ziehen, hätte aber Bedenken, sie per Bot zu entfernen, solange es irgendwo noch eine nicht abgeschlossene Diskussion gibt. Wenn ich Artikel bearbeite, entferne ich sie von Hand. --Entlinkt 17:22, 28. Feb. 2010 (CET)
Neenee, ich hatte schon verstanden, dass das maire nur bei Paris gebraucht wird, und gedacht, dass man das deshalb aber nicht per Bot entfernen kann. Ich verstehe dich ausserdem so, dass intercomms aus der Infobox per Hand entfernt werden können, desgleichen die sans und date-sans, aber halt lieber nicht per Bot, richtig? Kann PatDiBot dann den Rest so machen wie wir beide das gesagt haben (ich wusste nicht, ob der Bot die Koordinaten anpassen kann, sonst hätte ich das auch gewünscht)?--Stanzilla 18:13, 28. Feb. 2010 (CET)

Ich werde mir die nächsten Tage mal die einzelnen Aufgaben der Reihe nach ansehen, und entsprechende Module schreiben oder aktivieren. Das mit km² besteht bereits, einzelne nicht mehr benötigte Argumente zu löschen, wird problemlos gehen. Die Zusamenfassung von lat und lon sollte auch keinen größeren Aufwand bedeuten.
Was ich gerne noch machen würde (bin ich mir aber noch nicht sicher ob ich das mit dem derzeitigen Wissen schaffe) die Höhenangaben mit dem RGC automatisch abzugleichen.
Intercoms, Bürgermeister und co. werde ich derzeit nicht antasten.
Eine Idee mit den Intercoms wäre beispielsweise das vorhandene Argument in einen ..._alt= Intercom ... umzubenennen, dann könnte der neue aktiviert und schrittweise der alte überprüft werdne.Grüße, Patrick, «Disk» «V» 21:21, 28. Feb. 2010 (CET)

So nun habe ich mal meinen BOT entsprechend eingerichtet. Er würde folgendes machen:
  • Bei km² das Komma durch einen Punkt ersetzen (eine unendliche Geschichte ist das)  Ok
  • lat-deg/lat-min/lat-sec/lat und lon-deg/lon-min/lon-sec/lon (de:-Erfindungen) zu latitude und longitude zusammenfassen  Ok
  • site (de:-Erfindung) zu siteweb umbenennen  Ok
  • blason (de:-Erfindung) zu armoiries umbenennen  Ok
  • description (de:-Erfindung) zu image-desc umbenennen  Ok
  • locode (de:-Erfindung) entfernen, wo es leer ist Nein
  • dens (sinnfrei) entfernen  Ok
  • ign (nicht mehr funktionierende de:-Erfindung) entfernen  Ok
  • depnr (sinnfreie de:-Erfindung) entfernen Nein
  • hect (sinnfrei) entfernen  Ok
  • Darüber hinaus würde er alle Regionen Frankreichs in Region (Frankreich) umwandeln  Ok

alle anderen Parameter wird er vorerst nicht anrühren. Leider funktioniert das mit dem Datenabgleich mit anderen Quellen (noch) nicht so recht, aber das wird ein nächster Schritt.

Ich würde jetzt auf ein OK von Euch (speziell auch Entlinkt) warten, damit ich den Bot starten würde. Über das Wochenende wäre dann vielleicht die Arbeit erledigt.Grüße, Patrick, «Disk» «V» 21:49, 4. Mär. 2010 (CET)

Ein paar Bemerkungen:

  • Man sollte den Botlauf auf Wikipedia Diskussion:WikiProjekt Französische Gemeinden ankündigen und ein paar Tage warten, ob es noch irgendwelche Wünsche gibt.
  • Die zu entfernenden Parameter sollten ganz entfernt werden, auch wenn sie leer sind, sonst denkt noch jemand, sie wären absichtlich leer eingefügt worden und füllt sie aus. Sie würden sich mit der Zeit wieder ansammeln.
  • Dasselbe bei den umzubenennenden Parametern. Bitte auch dann umbenennen, wenn sie leer sind, sonst sammeln sie sich wieder an.
  • Mir ist nicht ganz klar, warum depnr nicht entfernt werden kann. Gibt es da ein technisches Problem? In der Sache ist der Parameter völlig überflüssig. Er stammt noch aus Zeiten, als es statt der Vorlage:INSEE-ISO 3166-2 eine nicht funktionierende Vorgänger-Vorlage:CodeDépartement gab. Auch diese Vorgängerin extrahierte die „Nummer“ des Departements (die ja nicht immer eine Zahl ist) aus dem INSEE-Code, aber sie behandelte die Sonderfälle, wo es keine Zahl ist (Korsika, Übersee) nicht korrekt. Anstatt das an der Wurzel zu korrigieren, wurde dieser Parameter depnr eingeführt, aber nie wie vorgesehen genutzt, weil niemand durchgeblickt hat, wofür er eigentlich da war. Die neue Vorlage braucht diesen Parameter einfach nicht mehr, er ist auch nirgendwo mehr ausgefüllt. Am 14. Oktober 2009 (Stand der letzten Vorlagenauswertung) war er noch bei 58 Artikeln vorhanden, davon 2 mit Inhalt (Paris und La Verrie, beide händisch entfernt) und 56 leere. Es geht also ausschließlich um die Löschung von maximal 56 Zeilen |depnr=, die aus der Kopiervorlage übernommen wurden, aber keinen Inhalt haben.
  • Dasselbe mit locode. Vor vielen Jahren war es mal Mode, in alle Ort-in-Land-Boxen diesen Parameter einzubauen. Er hat sich aber nicht durchgesetzt (und kann bei Frankreich in der Form, in der er eingebaut wurde, auch nicht funktionieren). Von über 7000 Artikeln hatten am 14. Oktober 2009 nur 547 diesen Parameter, darunter 530 leere und 17 mit Inhalt. Von den 17 waren 4 Stück auch noch falsch und wurden händisch entfernt. Die 530 leeren Zeilen |locode= braucht definitiv niemand. Falls es technisch einfacher ist, kann man die 13 restlichen (die wie gesagt nicht funktionieren, da fälschlich ohne „FR“ eingegeben) auch entfernen und hier auf der Diskussionsseite deponieren. Nur damit es nicht heißt, etwas wertvolles wäre entfernt worden.
  • Die Koordinatenparameter sollten im Grad-Minuten-Sekunden-Format (Schreibweise mit Schrägstrichen, siehe Vorlage:Coordinate#NS und EW) zusammengefasst, aber nicht ins Dezimalformat umgewandelt werden. Für das Dezimalformat gibt es keinen Konsens, das käme nicht gut an.
  • Was sans und date-sans angeht, hätte ich gerne die oben erwähnte alte Diskussion wiedergefunden. Ist mir leider nicht gelungen. Das wesentliche Argument fürs Behalten war, dass das WikiProjekt Georeferenzierung die Metavorlagen nicht lesen kann, so dass beim Entfernen des Parameters sans die Information über die Objektgröße verlorengegangen wäre. Diese Information wird benutzt, damit Nachnutzer der Geodaten (Google Maps & Co.) die Orte nach Größe differenziert darstellen können. Durch eine Änderung der Auswertungsmethode im Mai 2009 funktioniert die Auswertung nun auch mit den Metavorlagen, das einzig wirklich stichhaltige Argument fürs Behalten ist damit weggefallen (andere Behaltenargumente waren mehr „Prinzipienreiterei“, ums mal so zu sagen). Als Argument fürs Entfernen wurde genannt, es sei verwirrend, wenn im Quelltext Zahlen stehen, die nicht (vor Änderung der Auswertungsmethode hätte es heißen müssen: nicht unmittelbar ersichtlich) genutzt werden. Die Entscheidung würde ich Dir überlassen. Die Wartungslinks in der Vorlage sind zurzeit auf „wird entfernt“ eingestellt. Falls Du sie nicht entfernst, sag bitte kurz vorher bescheid.
  • Es gäbe noch ein paar alte Arrondissementweiterleitungen aufzulösen, die bei früheren Botläufen „vergessen“ wurden (aber bitte nur in den Artikeln auflösen, die auch wegen der Infobox „angefasst“ werden müssen):
    • [[Basse-Terre (Arrondissement)|Basse-Terre]] → [[Arrondissement Basse-Terre|Basse-Terre]]
    • [[Besançon (Arrondissement)|Besançon]] → [[Arrondissement Besançon|Besançon]]
    • [[Cayenne (Arrondissement)|Cayenne]] → [[Arrondissement Cayenne|Cayenne]]
    • [[Millau (Arrondissement)|Millau]] → [[Arrondissement Millau|Millau]]
    • [[Pointe-à-Pitre (Arrondissement)|Pointe-à-Pitre]] → [[Arrondissement Pointe-à-Pitre|Pointe-à-Pitre]]
    • [[Strasbourg-Campagne]] → [[Arrondissement Strasbourg-Campagne|Strasbourg-Campagne]]
    • [[Strasbourg-Ville]] → [[Arrondissement Strasbourg-Ville|Strasbourg-Ville]]
    • [[Vesoul (Arrondissement)|Vesoul]] → [[Arrondissement Vesoul|Vesoul]]

Gruß --Entlinkt 16:57, 5. Mär. 2010 (CET)

Hallo Entlinkt. Danke für den ausführlichen Kommntar. Kurze Antworten:
  • Ankündigung ist OK, werde ich machen, sobald wir hier alles durch haben und der Bot einsatzbereit wäre.
  • Die zu entfernenden Parameter werden in Abhängigkeit vom Vorkommen des Parameters und nicht von Argumenten gelöscht oder umbenannt.
  • DepNr und Locode kann ich entfernen. War mir initial beim erstellen nicht ganz sicher, was das "sofern leer" bedeutet. Werde ich noch einbauen und die 2 Parameter vollständig löschen lassen.
  • Entfernen von Sans und Date-Sans ist technisch kein Problem, ich wollte bloß nicht etwas vorgreifen, was dann nur sehr schwer rückgängig gemacht werden könnte. Wie Du richtig darlegst werden die Werte nicht weiter benötigt. Wenn es OK ist, werde ich auch diese Werte einfach mal killen.
  • Die gewünschten Arrondissements werde ich alle miteinarbeiten.
Grüße, Patrick, «Disk» «V» 20:44, 5. Mär. 2010 (CET)
Wunderbar. Von mir aus ist nix mehr im Weg. Zur Dokumentation für die Nachwelt der letzte Stand von locode: Amiens = AMI, Angers = ANE, Argentré = GTR, Brumath = BRM, Caluire-et-Cuire = FR CAL, Lannion = LAI, Laxou = LXO, Lyon = LIO, Nantes = NTE, Paris = PAR, Renazé = REN, Saint-Laurent-Médoc = DXO, Toulouse = TLS. Gruß --Entlinkt 06:06, 6. Mär. 2010 (CET)

Übersicht über geplante Änderungen

Umfasst sind alle Gemeindeartikel die in der Kategorie:Gemeinde in Frankreich gelistet sind.

Änderung Details Berücksichtigt
km² Datenabgleich mit RGC

Umwandlung Hektar --> km²
Komma --> Punkt
Überprüfung auf richtige Nachkommerstellen (immer 2 Stellen, auch x,00)

 Ok
site umbenennen site= --> siteweb=  Ok
blason umbenennen blason= --> armoiries=  Ok
description umbenennen description= --> image-desc=  Ok
Koordinaten Abgleich mit den Daten von RGC

lat-deg bis lon --> latitude=00/00/00/NS und longitude=00/00/00/WE

 Ok
dens entfernen incl. Parameter entfernt  Ok
locode entfernen incl. Parameter entfernt  Ok
depnr entfernen incl. Parameter entfernt  Ok
sans entfernen incl. Parameter entfernt  Ok
date-sans entfernen incl. Parameter entfernt  Ok
IGN entfernen incl. Parameter entfernt  Ok
hect / hectares entfernen incl. Parameter entfernt  Ok
Regionen Frankreichs Umwandeln Region --> Region (Frankreich)  Ok
Umwandlung Arrondissements Basse-TerreBasse-Terre

BesançonBesançon
CayenneCayenne
MillauMillau
Pointe-à-PitrePointe-à-Pitre
Strasbourg-CampagneStrasbourg-Campagne
Strasbourg-VilleStrasbourg-Ville
VesoulVesoul

 Ok
Änderung der Regionenbezeichnung BourgogneBurgund

AquitaineAquitanien

 Ok
Höhenangaben Abgleich mit den Daten von RGC 2008  Ok
Vorbereitung der intercomm Leere Intercomm-Parameter löschen oder

Bestehende intercomm-Angabe in intercomm_alt= umwandeln und
einen neuen Parameter intercomm= direkt vor Intercomm_alt einfügen.

 Ok

Einverstanden mit den Änderungen. Maires habe ich wegen der Unpflegbarkeit (selbst bei den französischen Kollegen ist die Pflege sogut wie ausgeschlossen) schon sehr oft entfernt, die Gemeindeverbands-Mitgliedschaft halte ich dagegen für wichtiger als die Zugehörigkeit zu Kantonen. Mittelfristig werden wohl auch Navileisten zu CC-Mitgliedschaften auftauchen. Rauenstein 13:12, 7. Mär. 2010 (CET) Off-Topic: Warum wird in der Infobox, die ausschließlich in deutschsprachigen Artikeln verwendet wird, nicht deutsch geschrieben (alt moy, description, armoires)?

Irgendwo taucht immer wieder das Argument des Imports der Infoboxen aus dem franz. Artikel auf. Vielleicht ist deswegen die franz. Bezeichnung der Argumente?? Das mit den CC-Mitgliedschaften stimmt in der von dir dargestellten Version. Nur sind die Daten, welche sich in den Infoboxen finden, momentan einfach nicht zu benutzen. In einer abgestimmten Aktion (siehe Diskussionsbeitrag von Entlinkt weiter oben) sollten wir die Problematik sicherlich mal in Angriff nehmen und die Gemeindeverbände in den Infoboxen freischalten und überprüfen. Danke auch für Dein OK. Grüße, Patrick, «Disk» «V» 13:31, 7. Mär. 2010 (CET)
Import der französischen Infobox? Gibts das wirklich und wenn ja wie oft? Rauenstein 14:04, 7. Mär. 2010 (CET)
Aber sicher gibt's das, dass die Box aus fr: kopiert wird, wo kommen die ganzen Bürgermeister (trotz fleißigen Entfernens 2053 Stück am 14. Oktober 2009 und auch in neuen Artikeln auffindbar) denn sonst her? Keine Aussage, dass der Bürgermeister sinnvoll sei, aber ich habe da meine Zweifel, dass die Leute die Daten tatsächlich an der Quelle (Répertoire géographique des communes für die Flächen, Höhen und Koordinaten, Laposte für die Postleitzahlen, Code officiel géographique für die Gebietszugehörigkeit und den INSEE-Code) recherchieren. Das wird doch höchstwahrscheinlich aus fr: genommen. Direkt die ganze Box zu kopieren, vermeidet Abschreibefehler.
Das Übersetzen der Parameternamen wurde in der englischen Wikipedia gemacht. Halte ich für keine Verbesserung bzw. sinnlose Englischtümelei, nur schadet es in en: weniger, weil dort alle „Artikel“ bereits angelegt sind. Unsere Situation (Parameter mit gleicher Bedeutung wie in fr:, aber anderen Namen, die auch französisch aussehen, aber nicht gleich sind) ist von allen Möglichkeiten so ziemlich die schlechteste. Wenn deutsche Parameternamen irgendwie wichtig wären, könnte man dafür einen Wrapper (eine Vorlage, die keinen Code enthält, sondern nur die Parameternamen „übersetzt“) erstellen. Hat aber nicht direkt was mit dem Botlauf zu tun. --Entlinkt 14:25, 7. Mär. 2010 (CET)
Sorry, die Frage war nicht so ernst gemeint und ich hatte wieder irgendeinen smile-icon vergessen. Ansonsten natürlich d'accord mit Deinen Ausführungen. Rauenstein 14:32, 7. Mär. 2010 (CET)
OK. Ich sag's nur noch mal für die Akten, weil die Frage immer wieder aufkommt:
  1. Dass irgendjemand die Daten nicht wenigstens teilweise aus fr: übernehmen würde, erscheint angesichts von Dingen, für die man mit der Zeit einen Blick entwickelt, wenig glaubwürdig. Beispiel: In fr: sind die Koordinaten ausnahmslos um ca. 200 Meter nach Nordosten „gedriftet“, weil in grauen Anfangszeiten ein falsches Bezugssystem gewählt wurde. Bei uns auch, obwohl die Koordinatenparameter bei uns schon immer anders waren (demnächst dann nicht mehr). Nicht dass 200 Meter der Weltuntergang wären, aber es belegt, dass de facto eh aus fr: kopiert wird; also lieber gleich die Parameter wieder aufeinander abstimmen, damit es beim (geringfügigen) systematischen Fehler bleibt und nicht (potenziell gravierende) Abtippfehler dazukommen.
  2. Dass die französischen Parameternamen nicht jedem gefallen, glaub ich gern (Geschmackssache), nur wäre die Alternative (bzw. das andere Extrem), dass man alle Daten neu an der Quelle recherchiert. Die Quelle sind Websites bzw. unhandliche Excel-Tabellen des INSEE, des IGN und der Post, wo man noch viel mehr Französisch können muss, um zu verstehen, worum es überhaupt geht.
Gruß --Entlinkt 18:47, 7. Mär. 2010 (CET)

Diskussion über Ausweitung des Botlaufes

Ich möchte noch bevor ich mit dem Botlauf beginne (die o.g. Funktionen sind alle nun ausgiebig getestet und überprüft - funktionieren) anfragen, ob eine Erweiterung anzustreben wäre. Mitlerweile habe ich die Funktion implementiert, die Daten mit anderen Quellen (im ersten Schritt mit der Textdatei des RGC) abzugleichen. Was ich daraus an Möglichkeiten sehe:

  • automatisches Abgleichen der Höhenangaben (alt min, alt max, alt moy)
  • Überprüfen der Flächenangaben
  • Korrektur der 200m Differenz aufgrund des Bezugsystems

Bevor ich mich aber nun hinsetze und diese Änderungen programmiere, würde ich um eine prinzipielle Stellungnahme bitten, ob das gewünscht wird und ob wir das auch noch hinzu nehmen sollten.

Gesammelte Datenquellen für die Bürgermeister sind ja sicher nicht verfügbar? Grüße, Patrick, «Disk» «V» 07:49, 8. Mär. 2010 (CET)

Ja gern @RGC.
Was die Bürgermeister angeht, ich habe früher immer die Bürgermeister erwähnt, dann verstarben der Maire von Le Bec-Hellouin und der von Morsan. Ich weiss, dass die neu gewählt wurden, an der Mairie hing dann nach der Wahl auch ein Zettel, wer denn jetzt der Bürgermeister sei. Es dauerte Monate, wenn nicht gar ein Jahr, bis der Maire mal auf der Seite der Préfecture von Eure auftauchte und dann war es komischerweise nicht der auf dem Zettel (-kratz am Kopf-). Daraufhin hab ich soweit sie sonst keine Bedeutung hatten alle Maires aus meinen Artikeln entfernt. Auf der genannten Seite gibt es eine Liste mit allen Gemeinden (klick, scroll runter, valider), auf der Gemeindeseite stehen auch die angeblichen Maires. Das Innenministerium bietet Wahlergebnisse als xls zum Download an (die kennst du vielleicht sowieso), das sind dann aber unter Umständen aus oben genannten Gründen nicht die aktuellen Maires. Zusammenfassung: ich würds lassen.--Stanzilla 12:53, 8. Mär. 2010 (CET)
Lassen wir die Bürgermeister mal außen vor. Die Sache mit dem Verstorbenen und dem Zettel ist nett, aber keine Entscheidungsgrundlage. Es ist garantiert gesetzlich geregelt, was passiert, wenn ein Bürgermeister stirbt, wer das Amt kommissarisch ausübt, wie das mit der Nachwahl läuft, auf welcher Art von „Zettel“ die Ergebnisse zu veröffentlichen sind, um rechtswirksam zu sein usw., es hat bloß noch niemand im Gesetz nachgelesen. Ich persönlich bevorzuge es, eine Entscheidung erst zu treffen, wenn ich alles über das Thema weiß. Eine technische Notwendigkeit für welche Änderung auch immer besteht nicht.
Die RGC-Sache klingt gut, aber bitte 5 Dinge beachten:
  1. Die Daten im RGC sind nicht ganz aktuell. Es bestehen folgende Diskrepanzen zwischen dem RGC und dem aktuellen Gebietsstand (der Bot kann sie überschreiben, man muss sie aber nachkontrollieren):
    • Saint-Germain-Source-Seine (21551) zuviel, hat zum 01.01.2009 fusioniert
    • Lieoux (31300) fehlt, wurde zum 13.02.2008 wiederhergestellt
    • Saint-Symphorien (35317) fehlt, wurde zum 01.01.2008 wiederhergestellt
    • Le Mesnil-Angot (50303) zuviel, hat zum 08.03.2007 fusioniert
    • Verquigneul (62847) fehlt, wurde zum 01.01.2008 wiederhergestellt
    • Guitalens (81107) zuviel, hat zum 29.06.2007 fusioniert
    • Rosoy (89326) fehlt, wurde zum 12.02.2008 wiederhergestellt
  2. Die Gemeinden der Überseegebiete sind in einer getrennten Tabelle, wo die Koordinaten in zwei Bezugssystemen drin stehen. Die für uns gültigen Werte stehen in den Spalten LONGI_DMS_MOND und LATI_DMS_MOND (globales Bezugssystem). LONGI_DMS_LOC und LATI_DMS_LOC (lokales Bezugssystem) wären noch weit mehr als 200 Meter daneben.
  3. Mayotte ist im RGC bereits drin, aber noch unter dem alten INSEE-Code 985. Wir verwenden bereits den neuen INSEE-Code 976. Falls das zu viel Aufwand bedeutet, kannst Du Mayotte oder auch alle Überseegebiete ausklammern. Es betrifft so wenige Artikel (32 × GP + 6 × MQ + 22 × GF + 9 × RE + 3 × YT = 72), dass man sie auch von Hand kontrollieren kann.
  4. Paris fehlt im RGC, weil statt der Gemeinde die 20 Stadtbezirke drin stehen. Bitte diesen Artikel, falls möglich, ausklammern, andernfalls nachkontrollieren.
  5. Im RGC sind die Flächen in Hektar, bei der Umwandlung nach km² stellt sich die Frage nach den Nachkommastellen. 100 Hektar sollten zu 1.00 km² (nicht 1 km²) werden. Die Nullen hinterm Komma sind wichtig, weil sie etwas über die Genauigkeit aussagen. Ein Negativbeispiel ist die Vorlage:Infobox Gemeinde in Italien, wo das falsch gemacht wurde.
Und wo wir schon dabei sind, könnten wir vielleicht auch die Sache mit den Gemeindeverbänden soweit vorbereiten, wie es jetzt möglich ist. Von den bisherigen Vorschlägen wäre das Umbenennen des Parameters als einstweilige Sofortmaßnahme IMHO am besten. Idealerweise nur dann, wenn er nicht leer ist. Wäre das möglich? Gruß --Entlinkt 15:03, 8. Mär. 2010 (CET)
Erstmals Danke für die ausführlichen Hinweise! Nachdem es mir scheint, dass die Ergänzungen gewünscht sind, werde ich mich daran machen, diese einzubauen. Dafür werde ich aber etwas Zeit benötigen, um auch entsprechende Tests durchführen zu können. Daher wäre erstmals mein Vorschlag, dass ich den Start des Bot's auf Ende des Monats ansetzen werde (da sollte ich auch privat etwas mehr Zeit haben) und bis dahin die entsprechenden Änderungen noch vornehmen.
  • Die Bürgermeister werde ich nicht anrühren, war nur eine prinzipielle Frage ob es überhaupt Datensätze gäbe.
  • Nachdem ich den Bot nun vollständig in einer Programmiersprache aufbauen kann (C#) sollten Ausnahmen etc. kein größeres Problem mehr darstellen.
  • Die Umwandlung von ha in km² sollte eigentlich überhaupt kein Problem sein. Den entsprechenden Parameter werde ich einfach durch 100 teilen lassen (bzw. an der entsprehcenden Stelle einen Punkt einfügen.
  • Auch die Umbenennung des bisherigen intercomm-Parameters ist kein großer Aufwand.
Soweit mal die kurze Stellungnahme. Ich werde nun mal schauen, wie weit ich mit der Programmierarbeit vorankomme. Einzelne Veränderungen werde ich in obiger Tabelle ergänzen, sobald absehbar ist, dass es gut funktioniert. Diskussionen bitte ich hier weiter zu führen. Grüße, Patrick, «Disk» «V» 17:49, 8. Mär. 2010 (CET)
Ausnahmen für die 7 oben genannten von Gebietsveränderungen betroffenen Gemeinden lohnen sich wahrscheinlich nicht. Die Artikel muss man eh nachkontrollieren (ökonomischerweise nach dem Botlauf).
Beim Hektar durch 100 teilen muss man aufpassen, weil manche Programmiersprachen (insbesondere die MediaWiki-Vorlagensyntax) die Nullen hinterm Komma „auffressen“, wenn man nicht aufpasst. Deshalb ist es ja so wichtig, sie in der Wikipedia in km² zu erfassen. Man kann aber auch nicht einfach einen Punkt einfügen, weil es Flächen unter 100 Hektar gibt (Extremfall: Castelmoron-d’Albret mit nur 4 Hektar). Mögliche Lösung mit Stringverarbeitung: Erst von rechts nach links mit Nullen auf 3 Stellen auffüllen (falls 3 oder mehr Stellen, so lassen), dann zwischen drittletzter und zweitletzter Stelle einen Punkt einfügen.
Der Zeitpunkt des Botlaufs bleibt natürlich Dir überlassen. Gruß --Entlinkt 18:12, 8. Mär. 2010 (CET)

Die neuen Daten der Gemeinden, die fusioniert haben:

Code Name km² longitude latitude alt mini alt maxi alt moy
21084 Source-Seine 16.42 4/41/8/E 47/29/21/N 354 523 463
50216 Graignes-Mesnil-Angot 18.35 1/12/6/W 49/14/18/N 0 37 11
81132 Guitalens-L’Albarède 9.36 2/2/33/E 43/38/40/N 138 290 142

Bei denen, die sich wieder getrennt haben (Saint-Symphorien aus Hédé, Verquigneul aus Béthune, Rosoy aus Sens, Lieoux aus Saint-Gaudens), weiß ich zurzeit auch nicht, wo die neuen Daten herkommen sollen. Es betrifft aber nur 3 geschriebene Artikel, wo die Daten auch jetzt schon falsch sind, also kein Hindernis für den Bot. --Entlinkt 01:55, 9. Mär. 2010 (CET)

Communautes de Communes, etc.

Nachdem wir ja nun doch auch die CC, CU, etc. in die Infobox integrieren wollen, ist meine Frage nun ob wir nich im Rahmen des Bot-Laufes auch schon die Daten automatisiert ausfüllen sollten.

  • Datenquelle: INSEE - Telechargement (die entsprechende Excel-Datei).
  • Da die CC's etc. mit dem Insee-Code der Gemeinde verknüpft sind, könnte man diese Liste gut mittels Bot auslesen und die Daten integrieren.

Offene Fragen:

  • Wollen wir das auf diese Weise machen, oder erst in einem zweiten Botlauf?
  • Sind die o.g. Daten überhaupt verwertbar?
  • Namenskonvention und Form der Verlinkung (CC ausgeschrieben oder abgekürzt, etc.)
  • Als Link oder nur als Text eintragen?

Grüße, Patrick, «Disk» «V» 11:18, 14. Mär. 2010 (CET)

Oh je, das ist sehr schwierig.
  • Punkt 1: Es gäbe 4 Typen (Rechtsformen) von Gemeindeverbänden, die einzutragen wären, nämlich die EPCI à fiscalité propre (Gemeindeverbände, die selbst Steuern erheben dürfen). Eine Gemeinde kann nur in einem EPCI à fiscalité propre Mitglied sein. Die EPCI sans fiscalité propre (SIVU, SIVOM) sollten unberücksichtigt bleiben, weil eine Gemeinde mehreren EPCI sans fiscalité propre oder auch einem EPCI à fiscalité propre und einem oder mehereren EPCI sans fiscalité propre angehören kann. Das nur zur Klarstellung.
  • Punkt 2: Die Wikipedia-Artikel sind sehr uneinheitlich benannt. Manche haben die Rechsform im Lemma, manche nicht.
  • Punkt 3: Die INSEE-Tabelle ist, soweit ich das sehe, auf dem Stand vom 1. Januar 2008. Auf der Website des Innenministeriums heißt es, die Anzahl der Gemeinden, die einem EPCI à fiscalité propre angehören, sei vom 1. Januar 2009 bis zum 1. Januar 2010 von 34166 um 608 auf 34774 gestiegen; das sind wohlgemerkt nur die Änderungen im Lauf des Jahres 2009, die im Lauf des Jahres 2008 kommen noch dazu. Es ist Ziel der Politik, dass jede Gemeinde einem EPCI à fiscalité propre angehört. Wenn, dann sollte man also die Daten vom Innenministerium (Tabelle Base des EPCI à fiscalité propre avec commune) nehmen, weil die vom INSEE definitiv zu alt sind.
→ Ich fürchte, dass das nicht so einfach ist und dass man (wenigstens zur Kontrolle) auf die Websites der einzelnen Verbände angewiesen sein wird. --Entlinkt 13:30, 14. Mär. 2010 (CET)

Danke für die ausführliche Stellungnahme. Somit scheint es derzeit nicht sinnvoll zu sein. Ich denke, das sollten wir in einem neueren Anlauf zuvor ausführlich vorbereiten. Ich werde nur wie schon oben angekündigt, die Infoboxen vorbereiten. Somit erledigt Grüße, Patrick, «Disk» «V» 20:55, 14. Mär. 2010 (CET)

OK, dann hätte ich nur noch drei Fragen: (1) Gleichst Du die Koordinaten auch mit dem RGC ab oder passt Du nur das Format an? Aus Neugier, wäre mir beides recht; (2) Benennst Du den Parameter intercomm um? Wäre, wenn ich's mir überlege, schon ganz sinnvoll, dann könnte man ihn aktivieren und schon mal anfangen, ihn punktuell von Hand zu befüllen. Man muss es aber nicht, oder nicht überall auf einmal. Es ist ja nicht falsch, wenn dort nichts eingetragen ist und wäre keine Verschlechterung im Vergleich zum jetzigen Zustand. (3) In welchen Namensräumen würdest Du das machen? Ich würde es als Bot nur im Artikelnamensraum machen. In den anderen Namensräumen habe ich es (bis auf meine eigenen Unterseiten) bereits von Hand erledigt. --Entlinkt 22:16, 14. Mär. 2010 (CET)

Hallo Entlinkt!

  1. Ich bin dabei auch die Koordinaten mit dem RGC abzugleichen. Das Einlesen der Daten aus dem RGC funktioniert bereits, die entsprechende Umwandlung in unser Format programmiere ich gerade. Wird etwas brauchen, aber es wird klappen. Ich muss momentan etwas (beruflich) zurückstecken, darum erst der Bot-Start am Ende des Monats.
  2. Ich habe es vor den bestehnden Parameter intercomm=xxx in intercomm_alt=xxx umzubenennen sofern ein Inhalt angegeben ist. Dann würde ich auch den neuen Paramter intercomm in die Infobox aufnehmen, sofern einer umbenannt wurde oder noch gar nicht vorhanden ist. (Erst in Entwicklung) Als Alternative haben ich mir überlegt, ich werde erst noch schauen ob das besser wäre, einfach den bestehenden Inhalt automatisch in <!-- xxx --> einzuschließen. Aber technisch und aus Gründen der manuellen Wartung bevorzuge ich die erstere Variante.
  3. Ich werde den Bot nur im Artikelnamensraum laufen lassen, und das eingeschränkt auf die Artikel in der Kategorie:Gemeinde in Frankreich zum Datum des Bot-Starts (herusnehmen werde ich noch Paris und die anderen Ausnahmen) - Solltest Du den Wunsch haben, Deine Unterseiten könnte ich auch manuell dem Bot hinzufügen.
  4. Das mit dem Abgleich der Höhendaten funktioniert problemlos auch für die Überseedepartemets.
  5. Die Umwandlung der abgeglichenen Hectar-Angaben in km² funktioniert sehr gut (auf 2 Nachkommastellen genau) auch wenn es sich "nur" um 4 ha (--> 0.04 km²) oder 400 ha (--> 4.00 km²).
Es gibt keinen Zeitdruck bei diesem Botlauf. Kein Bedarf, Berufliches zurückzustellen. ;-)
intercomm in Kommentarzeichen einschließen ist keine so gute Idee. Man kann dann keinen Wartungslink erstellen, weil Kommentare der Vorlagenprogrammierung unzugänglich sind. Umbenennen ist besser und bei diesem Botlauf völlig ausreichend. Das Befüllen können wir auf ein anderes Mal verschieben.
Welche Ausnahmen gibt es außer Paris? Bei Mayotte würde ich einfach in der Textdatei vor dem Einlesen manuell die 985 durch 976 ersetzen, das sollte reichen. Weitere Ausnahmen in der Kategorie:Gemeinde in Frankreich wären St. Pierre und Miquelon (nur 2 Gemeinden, zurzeit in der Hauptebene), Französisch-Polynesien und Neukaledonien (Unterkats), aber die haben eh keine Infobox. Meine Unterseiten sind wurscht. Falls noch irgendwo andere Benutzerseiten auftauchen würden, fände man sie mit den Wartungslinks und könnte sie schnell von Hand erledigen. Gruß --Entlinkt 23:12, 14. Mär. 2010 (CET)

Abschluss

So wie es ausschaut habe ich nun den Bot (endlich) fertig programmiert. Hier habe ich eine beispielshafte Gegenüberstellung von einer Infobox mit den wichtigsten Änderungen erstellt. Einige kleine Änderungen (Umbenennungen Höhendatenabgleich etc.) werden hier nicht erfasst.

Ich werde jetzt noch ein paar Tests durchführen, damit ich nicht dann beim Betrieb auf unvorhergesehene Dinge stoße und dann entweder dieses oder eher nächstes Wochenend den Bot durchlaufen lassen.Grüße, Patrick, «Disk» «V» 09:44, 17. Mär. 2010 (CET)

Nur noch eine Kleinigkeit, weil gerade das Beispiel Dijon gewählt wurde: könnte man nicht die internen Weiterleitungen auf die Regionen gleich mit entfernen? Beispiele: von région=[[Burgund|Bourgogne]] auf région=[[Burgund]] oder bei Nérac région=[[Aquitanien|Aquitaine]] auf région=[[Aquitanien]]. Rauenstein 20:57, 17. Mär. 2010 (CET)

Ich würde ja viel lieber dazu übergehen, dass all diese Parameter (Region, Departement, Arrondissement, Kanton) unverlinkt eingegeben werden. Für Sonderfälle (Gemeinde in mehreren Kantonen etc.) müsste man sie weiter auch verlinkt eingeben können. Das könnte man wie bei der Vorlage:Infobox Verwaltungseinheit in Deutschland mit #ifexist lösen. Vorteile wären, dass auf jeden Fall das Arrondissement und in der Regel auch der Kanton nicht mehr doppelt eingegeben werden müssen (eine Fehlerquelle weniger) und dass die Daten auswertbar werden. Nur lohnt sich das eigentlich erst, nachdem die Gemeinde-, Arrondissement- und Kantonsboxen analog der Vorlage:Infobox Verwaltungseinheit in Deutschland zusammengeführt sind, und das wiederum lohnt sich erst, nachdem die Parameter harmonisiert sind etc. pp. --Entlinkt 21:30, 17. Mär. 2010 (CET)
Dieser Ansatz sollte unbedingt weiter verfolgt werden. Ich bin sicher, dass Du das im Hinterkopf behälst. Eine Sache, die ich wohl schonmal angesprochen hatte - und die jetzt nichts mit dem Boteinsatz zu tun hat - ist die Klammerschreibweise mehrfach vorkommender Gemeindenamen. Mit dem Département in Klammern haben wir zwar eine einfache Methode, die wohl bisher auch Verschiebe-wars verhindert hat, sie hat aber auch ihre Tücken. Das ist mir gerade erst wieder in der BKL Loison klar geworden. Da sehr viele Départements nach Flüssen benannt wurden, reiben sich die Klammerlemmata mit den Flussnamen, die wikipediaweit bei mehrfach vorkommenden Flussnamen mit den Flüssen beklammert werden, in die sie fließen. Da auch der Artikelbestand selbst kleinster Flüsse in Frankreich zunehmen wird, werden viele neue BKL nötig. Dass Gemeinden an Flüssen liegen, deren Namen auch Départements tragen, selbst aber in einem anderen Département liegen, wird dann auch nicht mehr so selten sein (die Stadt Clamecy (Nièvre) liegt an der Yonne, nicht aber im Département Yonne usw.). Vielleicht wäre ein Ansatz, hierarchisch von oben nach unten vorzugehen: Brest hieße dann nicht mehr Brest (Finistère) sondern Brest (Frankreich) (Gegenstück Brest (Weißrussland)). Bei mehrfach vorkommenden Ortsnamen in Frankreich würde nach Regionen beklammert (Wildenstein (Elsass) liest sich irgendwie besser als Wildenstein (Haut-Rhin)), erst wenn in einer Region doppelte Ortsnamen existieren nach Département. Mir ist klar, dass dies einen riesigen Schwanz an Verschiebungen und edits nach sich zieht, aber der Gemeinde-Artikelbestand liegt momentan erst bei 19,6 %. Wenn künftige Mitarbeiter in einigen Jahren auf die Idee kommen... gruss Rauenstein 23:49, 17. Mär. 2010 (CET)
(Viel Text, der sich stark vom Thema entfernt:)
Ne sorry, aber die Idee sagt mir ganz und gar nicht zu. Es gibt nicht nur Gemeinden, die nicht an dem Fluss liegen, der wie das Departement heißt, in dem sie liegen, sondern es gibt sogar ein Departement, das wie ein Fluss heißt, der das Gebiet des Departements infolge einer Grenzänderung seit 1860 nicht mehr berührt, nämlich Var. Und trotzdem heißt dieses Departement Var, sein Generalrat conseil général du Var mit der URL http://www.var.fr/ (einer der ganz wenigen, bei denen die URL nicht dem Schema http://www.cg83.fr/ folgt bzw. wo dies nur eine Umleitung ist, sie scheinen ihren Namen also durchaus selbstbewusst zu führen), sein Präfekt préfet du Var. Ein Lemma der Form „Gemeindename (Klammerzusatz)“ impliziert nicht, dass der Klammerzusatz für einen Fluss steht; mir fällt auf Anhieb nur ein Länderprojekt ein, das verschärft Flussnamen als Klammerzusatz für Gemeinden verwendet, nämlich das WikiProjekt Kommunen und Landkreise in Deutschland. Bei italienischen Gemeinden ist es flächendeckend die Region, bei Orten in den USA flächendeckend der Bundesstaat, bei Schweizer Orten flächendeckend der Kanton, bei russischen Orten flächendeckend die Oblast usw. Diese Idee mit den Flüssen scheint mir eine spezifisch deutsche Sache zu sein, andere Länderprojekte setzen auf übergeordnete Verwaltungseinheiten, und zwar, soweit ersichtlich, auf solche derselben Ebene, was die Vorhersagbarkeit des Lemmas erleichtert. Verwechslungsgefahr mit Flüssen besteht m. E. nicht, denn wenn eine französische Gemeinde tatsächlich nach einem Fluss benannt ist, dann ist der Name des Flusses mit der Präposition -sur- angebunden; Namen mit Klammerzusatz gibt es in Frankreich nicht bzw. nur bei Château-Chinon (Ville) vs. Château-Chinon (Campagne).
Dass eine Kategorie:Brest (Frankreich) angelegt wurde, habe ich schon gemerkt. Sehe ich eher ungern, muss ich ganz ehrlich sagen. Ja, es gibt ein Lemma Brest (Weißrussland), aber das liegt m. E. daran, dass sich für Weißrussland noch kein anderes System herauskristallisiert hat; für Frankreich haben wir eines. Gerade bei Brest kann ich auch gar nicht nachvollziehen, was es an dem Lemma Brest (Finistère) überhaupt zu beanstanden gibt. Finistère bedeutet wörtlich „Ende der Welt“ und ist nun mal der Name des Departements, auf dessen Gebiet die Gemeinde liegt; wo der Name genau herkommt, weiß man nicht, aber es gibt (zumindest heute) nichts außer dem Departement, das so heißt. Überhaupt heißt meines Wissens nur eine Minderheit bzw. maximal ungefähr die Hälfte der Departements exakt wie ein Fluss. Falsch ist „Brest (Frankreich)“ zwar nicht, aber ich frage mich immer, ob das WikiProjekt Kommunen und Landkreise in Deutschland ein Lemma Kutzenhausen (Deutschland) akzeptieren würde (würde es natürlich nicht, kein einziger Artikel über eine deutsche Gemeinde hat den Zusatz „Deutschland“) und warum wohl nicht? Weil das Deutschlandprojekt ein System entwickelt hat, Gemeinden durch Flüsse zu unterscheiden, in dem ein Lemma „Kutzenhausen (Deutschland)“ keinen Platz hätte. Sei ihm gegönnt, nur hat das Frankreichprojekt halt ein anderes System.
In Frankreich dürften die beiden Bedeutungen des Wortes Var (und der anderen so gelagerten Fälle) ungefähr gleichberechtigt sein; eher würde man den Fluss mit dem Zusatz rivière versehen. Dass das Frankreichprojekt jemals Flüsse als Unterscheidungsmerkmal für Gemeinden nutzen wird, halte ich für ausgeschlossen und sehe insofern keinen Grund, dem Schema „Gemeindename (Departement)“ auszuweichen. Eine Kollision mit den Namenskonventionen für Flüsse, die das tatsächlich unausweichlich machen würde, gäbe es nur, wenn es eine Gemeinde X im Departement Y und zugleich einen Fluss X gäbe, der in den Fluss Y mündet. Zur Homonymie Departement/Fluss müsste noch eine Homonymie Fluss/Gemeinde kommen, was meines Wissens nie beobachtet wurde.
Allenfalls könnte man auf die Region ausweichen (bei Korsika hast Du die Rotlinks in den Gemeindelisten ja bereits in diesem Sinne angepasst), nur sehe ich damit drei Probleme:
Kurzum: Kontra meinerseits. Gruß --Entlinkt 02:33, 18. Mär. 2010 (CET)
Kein Problem, einverstanden. Dass unzählige deutsche Gemeinden amtliche Klammern oder Schrägstriche mit Flussnamen führen, ist hier wahrscheinlich nebensächlich. Auch, dass sich WP-Sprachversionen bei den geografischen Objekten des eigenen Sprachgebietes etwas anders verhalten als bei fremdsprachigen, muss nichts heißen. Rauenstein 02:55, 19. Mär. 2010 (CET)

Zurück zum Thema:
@ Rauenstein: klar kann ich die beiden erwähnten Weiterleitungen auflösen. Das werde ich morgen noch einarbeiten.
So wie es momentan ausschaut, denke ich mal werde ich den Bot anschließend (Nachmittag) starten. Rechnerisch sollte der Bot sicherlich an die 30 Stunden arbeiten, nachdem wir derzeit rund 7200 Seiten haben und nicht mehr als 3 - 4 Seiten pro Minute abgearbeitet werden sollten. Mit Unterbrechungen meinerseits sollte die Umstellung am Ende des Wochenendes abgeschlossen sein. Durch die vielen Wartungskategorien sollten mögliche unerwartet auftretende Fehler aufgedeckt werden. Die Tests bei mehr als 100 zufällig ausgewählten Orten verliefen völlig problemlos. Sollten noch Einwände / Wünsche / etc. bestehen, bitte bis morgen hier deponieren. Ich denke jene die dieses Thema interessiert sollten auch diese Diskussion mitbekommen und registriert haben.
@ Themenabweichung: Die Harmonisierung der Parameter und Zusammenführung der Infoboxen fände ich auch sehr sinnvoll. Das gehört aber sicherlich nicht zu den vordringlichsten Projekten und vorab ausgiebig diskutiert und geplant. Die Umsetzung kann ich dann gerne wieder (auch mit dem BOT) unterstützen. Zuvor fände ich eine Anpassung der Infobox Gemeindeverband an die restlichen Infoboxen dringend notwendig. Und die anderweitige Benennung der Klammerlemmata sehe ich (ähnlich wie Entlinkt) eher kritisch.
Grüße, Patrick, «Disk» «V» 17:29, 18. Mär. 2010 (CET)

Der Bot wurde am 19.3.2010 um 13:00 gestartet. Grüße, Patrick, «Disk» «V» 12:56, 19. Mär. 2010 (CET)

Der erste Durchgang des Botlaufes konnte am 23.3.2010 um 20:00 beendet werden. Insgesamt 183 Artikel sind noch übrig geblieben. Diese werden noch in einem zweiten Durchgang halbautomatisch kontrolliert. Eine Liste aller noch händisch zu bearbeiteten Artikel findet sich dann abschielend hier. Grüße, Patrick, «Disk» «V» 20:15, 23. Mär. 2010 (CET)

Nacharbeit nach dem Botlauf

Hoffentlich keine :-)

  • Aufgrund von Interaktionen (mit ev. gerade bearbeiteen Artikeln) kommt es immer wieder dazu, dass einzelne Artikel nicht geändert werden. Ich werde die nach Abschluss einer ersten Runde noch einmal durch den Bot durchschicken. Eine Liste mit händisch zu korrigierenden Artikeln würde ich zu gegebenen Zeitpunkt hier ablegen.
  • Bevor wir beginnen mit dem Befüllen der neuen Intercomm Parameter wäre es sicherlich sinnvoll, wenn wir uns auf eine gemeinsame Vorgehensweise und in dem Zusammenhang auch gelich auf eine Namenskonvention einigen könnten. Die Diskussion dazu sollte am sinnvollsten auf der Projekt-Seite stattfinden. Bis dahin würde ich noch mit dem Befüllen und Umschreiben zuwarten.

Grüße, Patrick, «Disk» «V» 14:26, 19. Mär. 2010 (CET)

Update:
Übschlagsmäßig werden zwischen 1 und 2% aller Artikel vom Bot derzeit nicht bearbeitet. Die Gründe hierfür sind vielfältig, auf alle Fälle war es bewußt so, dass bevor Unsinn in den überarbeiteten Artikeln vorkommt, lasse ich sie lieber unbearbeitet. Teilweise sind auch kleinere Programmierungenauigkeiten dafür verantwortlich. Diese werde ich im zweiten Botlauf berücksichtigen. Zum Glück sind duch die Wartungskategorien die noch nicht bearbeiteten Artikel eindeutig zu identifizieren.
Nachdem ich doch während des Bot-Betriebs ein Auge auf die Tätigkeit werfen möchte, dauert die Umstellung etwas länger als veranschlagt (will ja nicht bei dem schönen Wetter 24 h am Tag vor dem PC verbringen :-). Die nächsten Tage werde ich fertig werden. Grüße, Patrick, «Disk» «V» 18:41, 21. Mär. 2010 (CET)

Ich sehe ja, dass dein Bot sehr fleissig ist, meine Beobachtungsliste ist voll von seinem Tun. Du darfst dich natürlich auch einmal von WP ausruhen (ich kann dir auch das schlechte Wetter schicken, das wir heute Vormittag hatten ;) ). Ich danke dir auf jeden Fall schon jetzt für die Aktion.--Stanzilla 20:01, 21. Mär. 2010 (CET)

Der Bot entfernt sinnvolle Leerzeichen aus Überschriften und kategorisiert Hauptartikel falsch um. Beispiel. --Hydro 10:45, 22. Mär. 2010 (CET)

Das mit den Leerzeichen in Überschriften ist unglücklich, aber nicht weiter tragisch. Manche Interwikibots (nicht alle) fügen sie wieder ein. Die Artikel nur deshalb nochmal anzurühren, wäre weit überzogen.
Das mit den Kategorien passiert nicht zum ersten Mal und geht natürlich nicht. Es ist wahrscheinlich dadurch verursacht, dass der Bot das Leerzeichen als „Linktext“ erkennt und entfernt. Aus [[Kategorie:Poitiers| ]] macht der Bot [[Kategorie:Poitiers|]], daraus wird beim Abspeichern [[Kategorie:Poitiers|Poitiers]] (m:Help:Piped link#Automatic conversion of the wikitext). --Entlinkt 14:53, 22. Mär. 2010 (CET)
Das mit den Problemen tut mir leid. Der Umstand mit den Überschriften dürfte erst bei den letzten ca. 500 Artikeln passiert sein, Das ist ein Missgeschick von mir. Gott sei Dank funktioniert der Quelltext trotzdem noch. Bei den restlichen Seiten sollte dies nicht mehr passieren. Ansonsten kann ich mir den Umstand mit dem Linktext bei den Kategorien nicht wirklich nicht erklären. Daran sollte und dürfte der Bot nichts anrühren. Insgesamt handelt es sich aber sicherlich nicht um allzu viele Artikel, denn es werden sicher nicht viele unter [[Kategorie:Poitiers| ]] abgelegt. Die Hauptartikel der jeweiligen Kategorie werde ich noch händisch überprüfen (das sind die 84 Artikel hier)
Trotzdem Danke für die Hinweise, dass etwas nicht funktioniert. Bevor ich den Bot weiterarbeiten lasse, werde ich selbstverständlich prüfen, dass alles wieder passt.
@ Hydro: Das mit dem Amoklauf habe ich nun mal nicht wirklich als Beleidigung aufgefasst, auch wenn die Ausdrucksweise nicht gerade freundlich rüberkommt. (Und suboptimale Umkategorisierungen sind nicht das alleinige Problem des Bot's - soll aber keine Entschuldigung sein) Grüße, Patrick, «Disk» «V» 18:19, 22. Mär. 2010 (CET)

Ende

Der Bot wurde am 24.3.2010 um 20:45 hoffentlich beendet. Grüße, Patrick, «Disk» «V» 21:02, 24. Mär. 2010 (CET)Grüße, Patrick, «Disk» «V» 12:56, 19. Mär. 2010 (CET)

Nunmehr ist die Arbeit des Bots auch im zweiten Durchgang abgeschlossen. Es bleiben eine Hand voll Artikel (allesamt hier, hier, hier und hier angeführt).
Diese Artikel würden noch einer händischen Nacharbeit bedürfen, wobei bei manchen bloß noch einzelne Parameter fehlen.
Bitte bei allen Artikeln auch noch die Koordinaten und Höhen mit den Daten von RGC 2008 (IGN - RGC unter Téléchargement sind die Daten downloadbar) abgleichen! Danke!!!
Bedanken möchte ich mich noch bei Benutzer:Complex und Benutzer:Århus für die Unterstützung beim Aufräumen eines kleineren Botfehlers. Und natürlich ganz ganz herzlich bei Entlinkt für die geduldige Vorarbeit und Unterstützung mit enormen Fachwissen. Grüße, Patrick, «Disk» «V» 21:02, 24. Mär. 2010 (CET)

Vielen, vielen Dank, PatDi. Ich habe nun folgendes implementiert:

  • Die alten Parameter sind nirgendwo mehr in Verwendung und werden nicht mehr unterstützt. Für den Fall, dass jemand sie aus Gewohnheit wieder einfügt, sollte man die Wartungslinks noch etwas im Auge behalten.
  • Die Gemeindeverbände (intercomm) werden nun angezeigt, wenn vorhanden. In 46 Artikeln sind sie bereits angegeben. Zum Teil sind das die Artikel, die der Bot übersprungen hat (diese habe ich noch nicht inhaltlich geprüft), zum Teil wurden sie auch in der Nacht auf heute neu eingetragen. Ich deponiere sie mal hier, weil man sie wahrscheinlich bald nicht mehr von Neueinträgen (für die die Eintragenden allein verantwortlich sind) unterscheiden können wird.
  • 1612 Artikel haben jetzt den Parameter intercomm_alt. Standardmäßig wird er nicht angezeigt, man kann die Einbindungen über Spezial:Linkliste/Vorlage:Infobox Gemeinde in Frankreich/Wartung/intercomm_alt finden oder mit tr.metadata { display:table-row !important; } in der eigenen CSS-Datei (je nach Skin Spezial:Mypage/monobook.css usw.) sichtbar machen. Diese Einträge stimmen formal und inhaltlich nicht immer und können ohne Eile migriert werden. Am aktuellsten und zuverlässigsten erscheint mir die Datenbank BANATIC, oder halt die Websites der Verbände selbst.

Gruß --Entlinkt 08:32, 25. Mär. 2010 (CET)

Wie sollen wir denn die Links gestalten? Persönlich finde ich die Variante von Rauenstein [1] besser als die vollständig ausgeschribene Form. Sollten wir - wenn wir nun schon die Möglcihkeit haben, dies nicht versuchen, einheitlich zu gestalten? Grüße, Patrick, «Disk» «V» 22:29, 25. Mär. 2010 (CET)
Der eine Account macht es so, der nächste anders. Verschiedene Accounts, die es verschieden machen, setzen aber nicht verschiedene Personen voraus, weshalb die Formulierung „Variante von Rauenstein“ nicht wirklich ein brauchbarer „Arbeitstitel“ für eine Variante ist. Ich muss mich gerade ziemlich beherrschen, nicht mehr dazu zu sagen.
In der Sache habe ich (noch) keine ausgeprägte Meinung. Die französische Wikipedia schreibt die Namen aus. Ich sage ja immer, die Wahrscheinlichkeit, dass sich dewiki-Sonderwege bewähren, ist gering (es ist nicht so, dass die Leute in der französischen Wikipedia keine Erfahrung hätten; Erfahrungen mit Sonderwegen, die sich nicht bewähren, haben wir allerdings reichlich), und wie man Namen wie Communauté de communes rurales du canton de Brionne (nicht der einzige dieser Art) abkürzen soll, weiß wohl auch niemand (Einheitlichkeit ist so definitiv nicht zu erreichen), und warum man die Art des Gemeindeverbands verstecken sollte, ist mir auch nicht klar (macht man in der Infobox für Gemeinden in Deutschland auch nicht, siehe aktuell die Koexistenz von Verwaltungsgemeinschaften und Verbandsgemeinden in Sachsen-Anhalt; in Frankreich gibt die Art darüber hinaus Aufschluss, ob die Gemeinde urban oder ländlich geprägt ist), aber man kann es ja versuchen. Warum auch nicht. Vielleicht muss man die Erfahrung einfach selbst machen. --Entlinkt 23:16, 25. Mär. 2010 (CET)
Das ist keine Sache, die ich zwingend verteidigen werde, nur gefällt mir der Vorschlag Communauté de communes des Monts d'Orb von Benutzer:Bourbon-l'Arches besser (meinetwegen auch "typographisch korrekt" Communauté de communes des Monts d’Orb) als Monts d'Orb. Klar, die Version ist länger, aber wir handeln uns entweder unnötige Inkonsistenzen ein (Communauté de communes de Bitche et environs, Bitche et environs, Bitche oder Bitche und Umgebung gar?) oder können uns ohne große Not lange überlegen, wie ein langes Regelwerk aussehen soll, das solche Probleme vermeidet. Communauté de communes Ackerland oder dem Leser vorspiegeln, dass er den Artikel Ackerland zu lesen bekommt, wo er vielleicht halbwegs wissend Ackerland erwarten könnte? —Complex 00:09, 26. Mär. 2010 (CET)
Sollte wirklich in der rechten Spalte Communauté de communes des Mynes et Hautes-Vosges du sud stehen? Wird in dewiki in keinem Gemeindeartikel so gehandhabt, in der rechten Spalte wird Verwaltungsgemeinschaft, Verbandsgemeinde etc. immer versteckt, weil dort schon links als Parameter genannt. Sollte die linke Spalte die Art des Verbandes beschreiben (um dann rechts abkürzen zu können, wenn es möglich ist), würde das wohl der Vorgabe zuwiderlaufen, die Parameter deutsch zu benennen. Natürlich wird man die „Kantons-CC“ nicht abkürzen können (sieht ausgeschrieben so aus). Enwiki hat übrigens keine Skrupel, einige CC sinngemäß zu übersetzen und so einzubinden). Ich hänge wirklich nicht an den Abkürzungen, sagt einfach bescheid, wenn der Findungsprozess ein Ergebnis zeitigt. Rauenstein 00:19, 26. Mär. 2010 (CET) P.S. Sehr guter Botlauf incl. Vorbereitung/Dokumentation.
Noch was gefunden: Vallée d’Argelès-Gazost, Pays d’Iroise, Cergy-Pontoise, Reims Métropole, (Saint-Quentin-en-Yvelines). Rauenstein 00:32, 26. Mär. 2010 (CET)
Erstmal was Technisches: Durch eine Änderung vor 4 Jahren, die an sich nicht verkehrt war, wurde die Box (je nach Browser mehr oder weniger) schmaler. Dies führte dazu, dass bspw. bei Kalhausen der Eintrag Communauté d’agglomération Sarreguemines Confluences 4 Zeilen benötigte, weil die Wortlängen so ungünstig verteilt sind, dass jedes einzelne Wort gerade etwas mehr als die Hälfte der Breite der rechten Spalte beansprucht. Ich habe das (etwas widerwillig) rückgängig gemacht. Es sollten jetzt, vorausgesetzt, die Einstellungen sind nicht zu „exotisch“, nur noch 2 Zeilen sein, andernfalls bitte melden. In indirektem Zusammenhang damit habe ich Wappen und Karte verbreitert, um die ganze Breite auszunutzen. Das könnte man auch wieder rückgängig machen, falls es nicht passt.
Mit weniger als 2 Zeilen auszukommen, ist schwierig. Steht Communauté d’agglomération nicht in der rechten Spalte, dann sollte es (IMHO) anstelle des Verlegenheits-Oberbegriffs „Gemeindeverband“ in der linken Spalte stehen. Da die Spaltenbreiten sich – zumindest wenn ein Wappen vorhanden ist – ungefähr wie 40:60 verhalten (vorgegeben durch die annähernd quadratische Karte), würde Communauté d’agglomération dann eben in der linken Spalte umbrechen. Mal davon abgesehen, dass es einen Zusatzparameter bräuchte, um Communauté d’agglomération in die linke Spalte zu bekommen, würde das auch layouttechnisch nicht viel bringen.
Zum Inhalt: Danke für den Hinweis auf Saint-Quentin-en-Yvelines, im Hinterkopf hatte ich den Fall schon. In BANATIC steht Communauté d’agglomération de Saint-Quentin-en-Yvelines, man kann den Namen aber auch wie einen „normalen“ Ortsnamen gebrauchen. In diesem konkreten Fall erscheint es mir auch ohne den Zusatz angemessen, aber es wird nicht immer gehen, weil bei manch anderen Namen gleich nach Communauté de communes ein Adjektiv folgt, das sich auf communauté (bspw. Communauté de communes interdépartementale des Baronnies) oder eben communes (s. o.) bezieht, so dass der Name schon sprachlich nirgendwo aufteilbar ist. → Ich fürchte, dass es gar nicht so einfach möglich ist, es überall einheitlich zu machen. Soweit der Zielartikel schon da ist, könnte man sich zunächst mal an dessen Lemma orientieren (würde das Problem auf die Lemmafrage verlagern; ob das besser ist, weiß ich auch nicht). --Entlinkt 05:03, 26. Mär. 2010 (CET)

Bürgermeister - zum Zweiten

Da die Informationen mit aktueller Amtszeit in der französischen Vorlage drinstehen, sollten wir diese Felder auch übernehmen. Man muss sie ja nicht jedesmal ausfüllen und anhand des Datums erkennt der Leser eine veraltete Information ohnehin.
Angesichts der formellen Struktur sollte es für einen Bot ein leichtes sein, die Unterschiede zum französischen Artikel zu finden und entweder selbst zu korrigieren bzw. diese Informationen in eine Wartungsliste zu schreiben. --Eingangskontrolle 11:59, 13. Dez. 2010 (CET)

Halte ich für absolut verzichtbar. Warum sollte ein Bot über tausende Artikel herfallen, um Bürgermeisternamen zu ändern, die auch in frwiki nur sporadisch - wenn überhaupt - rechtzeitig angepasst werden? Oft machen es dort IP's ([2]), nachgeprüft wird selten. Der Zustand vieler Artikel in dewiki ist so desolat, dass uns die Bürgermeister als allerletztes interessieren sollten. Rauenstein 23:03, 13. Dez. 2010 (CET