„Optische Notenerkennung“ – Versionsunterschied

Versionsgeschichte interaktiv durchsuchen

[gesichtete Version]

[ungesichtete Version]

← Zum vorherigen Versionsunterschied Zum nächsten Versionsunterschied →

Inhalt gelöscht Inhalt hinzugefügt

Inline

Version vom 30. Juli 2019, 14:11 Uhr

Optische Notenerkennung (engl.: Optical Music Recognition, Abkürzung: OMR) ist das Forschungsfeld, dass das computergestützte Lesen von Musiknotation in Dokumenten untersucht.^[1] Das Ziel ist es, dem Computer das Lesen und Interpretieren von Musiknoten beizubringen, damit dieser eine maschinenlesbare Version erzeugen kann. Sobald diese Version erstellt wurde, kann sie in verschiedene Formate exportiert werden um die Musik wiederzugeben (z.B. mittels MIDI) oder erneut zu setzen (z.B. mittels MusicXML).

In der Vergangenheit wurde OMR auch als Form der optischen Zeichenerkennung angesehen und Music OCR genannt. Aufgrund von zahlreichen signifikanten Unterschieden, sollten diese Begriffe jedoch nicht vermischt und der Begriff Music OCR vermieden werden.

Geschichte

Der erste publizierte digitale Scan von Musiknoten von David Prerau in 1971

Forschung im Bereich der optischen Notenerkennung begann in den späten 1960ern am MIT als die ersten Scanner für Forschungszwecke leistbar wurden.^[2]^[3]^[4] Da der Arbeitsspeicher der verwendeten Computer ein limitierender Faktor war, beschränkten sich die ersten Versuche auf wenige Takte (siehe den ersten publizierten Scan). In 1984 entwickelte eine japanische Forschungsgruppe von der Waseda Universität einen spezialisierten Roboter namens WABOT (WAseda roBOT), welcher die gedruckten Noten vor sich lesen und einen Sänger auf einer elektrischen Orgel begleiten konnte.^[5]^[6]

Entscheidene Forschungsfortschritte in der Anfangszeit wurden von Ichiro Fujinaga, Nicholas Carter, Kia Ng, David Bainbridge und Tim Bell erbracht, die eine Reihe von Ansätzen entwickelt haben, die heute noch in einigen Systemen verwendet werden.

Durch die Verfügbarkeit von kostengünstigen Scannern, konnten mehr Forscher sich der optischen Notenerkennung widmen und die Anzahl der Projekte nahm zu. In 1991 wurde die erste kommerzielle Lösung MIDISCAN (inzwischen SmartScore) von der Musitek Corporation entwickelt.

Mit der Verbreitung von Smartphones, die mit ausreichend guten Kameras und genügend Rechenkapazität ausgestattet sind, wurden einige mobile Lösungen möglich, bei denen mit dem Smartphone aufgenommenen Fotos direkt am Gerät verarbeitet werden.

Beziehung zu anderen Forschungsgebieten

Die optische Notenerkennung steht in Beziehung zu einigen anderen Forschungsgebieten, insbesondere zum maschinellem Sehen, Dokumentenanalyse und Music Information Retrieval. Aus Sicht der musikalischen Praxis kann OMR als Eingabemethode von Noten in den Computer gesehen werden, wodurch das Bearbeiten und Transkribieren von Musiknoten sowie das Komponieren erleichtert werden kann. In Bibliotheken kann OMR genutzt werden um Notenarchive durchsuchbar zu machen^[7] und musikwissenschaftliche Studien können dank OMR kostengünstig im großen Rahmen durchgeführt werden.^[8]

OMR vs. OCR

Optische Notenerkennung wird häufig mit optischer Zeichenerkennung (engl. Optical Character Recognition, kurz OCR) verglichen. Obwohl es viele Gemeinsamkeiten gibt, ist die Bezeichnung “Music OCR” aufgrund von entscheidenden Unterschieden irreführend. Der erste Unterschied ist, dass Musiknotation ein konfiguratives Schreibsystem ist. Das bedeutet, dass die Semantik nicht von den verwendeten Symbolen abhängig ist (z.B. Notenköpfe, Notenhälse, Fähnchen), sondern von der Art wie diese auf den Notenzeilen platziert werden. Zwei-dimensionale Beziehungen und der Kontext sind entscheidend um die korrekte Interpretation von Noten zu bestimmen. Im Gegensatz dazu, ist bei Text üblicherweise nur die Textlinie entscheidend --- geringfügige Abweichungen davon verändern nicht die Bedeutung des Textes. Er kann also entlang der Textlinie als eindimensionaler Fluss von Informationen angesehen werden.

Der zweite große Unterschied liegt an den Erwartungen. Ein OCR System endet üblicherweise bei der Erkennung von Buchstaben und Wörtern, hingegen von einem OMR System wird erwartet, dass es auch die Semantik rekonstruiert (z.B. aus einem gefüllten Notenkopf und einem angehängten Notenhals darauf schließt, dass es sich um eine Note mit einer bestimmten Dauer handelt). Die graphischen Konzepte (Position, Art des Symbols) müssen also in musikalische Konzepte (Tonhöhe, Notendauer, ...) durch Anwenden der Regeln von Musiknotation übersetzt werden. In der Texterkennung gibt es kein passendes Äquivalent für diesen Schritt. Folgender Vergleich kann hilfreich sein: Die Anforderungen an ein OMR System sind ähnlich komplex wie wenn man von einem OCR System erwartet, dass es aus dem Screenshot einer Website den HTML Quellcode rekonstruiert.

Der dritte große Unterschied ist der Zeichensatz. Während es auch in anderen Schriftsystemen wie der chinesischen Schrift ausgesprochen komplexe Symbole und umfangreiche Zeichensätze gibt, ist der Zeichensatz von Musiknotation dadurch geprägt, dass die Symbole enorme Größenunterschiede haben können - von kleinen Punkten bis hin zu Klammern, die eine ganze Seite umspannen. Manche Symbole haben sogar eine nahezu unbeschränkte Darstellungsart wie Bindebögen, die lediglich als mehr oder weniger glatte Kurven definiert werden, die beliebig unterbrochen werden können.

Verfahren

Die Erkennung von Noten erfolgt üblicherweise in mehreren Teilschritten, die mittels spezieller Algorithmen aus dem Bereich der Mustererkennung gelöst werden.

Eine Reihe von konkurrierender Ansätze existiert, wobei die meisten eine Art Pipeline vorsehen, wo jeder Schritt eine spezielle Funktion erfüllt, z.B. das Erkennen und Entfernen von Notenlinien, bevor der nächste Schritt ausgeführt wird. Ein häufiges Problem dieser Methoden ist dass sich Fehler durch das System fortpflanzen und vermehren. Zum Beispiel führt das Übersehen von Notenzeilen in den ersten Schritten dazu, dass die folgenden Schritte diesen Bereich des Bildes vermutlich ignorieren werden, wodurch die Ausgabe unvollständig ist.

Die optische Notenerkennung wird häufig unterschätzt, da es sich um ein scheinbar einfaches Problem handelt: Arbeitet man mit einem perfekten Scan von gedruckten Noten, kann die visuelle Erkennung mit einer Reihe von relativ einfachen Algorithmen wie Projektionen oder Pattern Matching gelöst werden. Der Prozess wird jedoch signifikant schwieriger, wenn der Scan eine niedrige Qualität aufweist oder wenn handschriftliche Notizen erkannt werden sollen - eine Herausforderung an der fast alle Systeme scheitern. Selbst bei einer perfekten visuellen Erkennung, stellt die Rekonstruktion der musikalischen Semantik aufgrund von Mehrdeutigkeiten und häufigen Verletzungen der Regeln der Musiknotation (siehe Chopin’s Nocturne unten) noch immer eine große Herausforderung dar. Donald Byrd und Jakob Simonsen behaupten, dass OMR deshalb so schwierig ist, weil moderne Musiknotation enorm komplex ist.^[9]

Donald Byrd hat eine Reihe von interessanten Beispielen auf seiner Website gesammelt^[10] sowie einige extreme Beispiele, welche demonstrieren wie weit die Regeln der Musiknotation gebogen werden können^[11].

Ausgaben von OMR Systemen

OMR System erzeugen typischerweise eine Version der Noten, die akustisch wiedergegeben werden kann (Wiedergabefähigkeit, engl. Replayability). Die häufigste Art wie so eine Version erzeugt werden kann ist über die Generierung einer MIDI Datei, die mithilfe von einem Synthesizer in eine Audiodatei umgewandelt werden kann. MIDI Dateien sind jedoch eingeschränkt in der Information die sich speichern können. So können diese beispielsweise keinerlei Information über den visuellen Notensatz (wie die Noten konkret angeordnet waren) speichern.

Ist das Ziel der Software die Rekonstruktion einer Version die von Menschen gut gelesen werden kann (Druckbarkeit, engl. Reprintability), muss die vollständige Information wiederhergestellt werden, inklusive präziser Layoutinformationen des Notensatzes. Geeignete Formate für diese Aufgaben sind MEI und MusicXML.

Neben den beiden genannten Anwendungen, kann es auch interessant sein lediglich Metainformation über ein Bild zu extrahieren oder dieses nur Durchsuchbar zu machen. Für diese beiden Fälle kann ein geringeres Verständnis der Noten ausreichend sein.

Generelles Modell (2001)

Im Jahr 2001 veröffentlichen David Bainbridge und Tim Bell einen Überblick über die Forschungsaktivitäten die bis dahin stattgefunden haben. Sie extrahierten daraus ein generelles Modell für OMR, welches als Vorlage für zahlreiche System diente, welche nach 2001 entwickelt wurden.^[12] Das Problem wird in vier Schritte unterteilt, die sich hauptsächlich mit der visuellen Erkennung befassen. Die Autoren erkannten, dass die Beschreibung wie die musikalischen Semantik rekonstruiert wird, häufig in wissenschaftlichen Arbeiten weggelassen wird, da diese Operationen abhängig davon sind welches Ausgabeformat gewählt wird.

Verfeinertes Modell (2012)

Im Jahr 2012 verfassten Ana Rebelo et al. eine weitere Untersuchung über die verwendeten Techniken in optischer Notenerkennung.^[13] Die gefundenen Arbeiten wurden kategorisiert und ein verfeinertes Modell wurde vorgeschlagen mit vier Hauptbestandteilen: Vorverarbeitung, Musiksymbolerkennung, Rekonstruktion der Musiknotation und Konstruktion der finalen Repräsentation. Dieses Modell wurde der de-facto Standard für OMR und wir noch heute so verwendet (wenn auch manchmal mit leicht abweichenden Namen). Für jeden dieser vier Blöcke gibt die Arbeit einen Überblick über die verwendeten Techniken um dieses Problem zu lösen. Die Arbeit ist die am häufigsten zitierte Publikation mit Stand 2019.

Deep Learning (seit 2016)

Mit dem Aufkommen von Deep Learning haben viele Probleme aus dem Bereich des maschinellem Sehen einen Wandel gesehen. An die Stelle von händisch erstellen Heuristiken und dem Entwickeln von geeigneten Merkmalen, tritt das maschinelle Lernen. Die Notenzeilenverarbeitung,^[14] die Musiksymbolerkennung ^[15]^[16]^[17]^[18] sowie die Rekonstruktion der Musiknotation^[19] haben signifikante Fortschritte durch Deep Learning erfahren.

Teilweise entstanden sogar völlig neue Methoden, die versuchen OMR direkt durch Verwendung von Sequenz-zu-Sequenz Modellen zu lösen. Diese Verfahren wandeln ein Bild von Musiknoten direkt in eine vereinfachte Sequenz von erkannten Noten um.^[20]^[21]^[22]

Bedeutsame wissenschaftliche Projekte

Wettbewerb zur Notenzeilenerkennung

Für Systeme die vor 2016 entwickelt wurden, stellte die Erkennung und das Entfernen der Notenlinien eine signifikante Herausforderung dar. Ein wissenschaftlicher Wettbewerb wurde organisiert, um den Stand der Technik für dieses Problem zu verbessern.^[23] Nachdem bereits sehr gute Ergebnisse erzielt werden konnten und viele moderne Ansätze keine explizite Notenzeilenerkennung mehr benötigen, wurde dieser Wettbewerb nicht weitergeführt.

Ein wichtiger Beitrag dieses Wettbewerbes die Entwicklung und Veröffentlichung des frei verfügbare CVC-MUSCIMA Datensatzes. Dieser besteht aus 1000 hochqualitative Bilder handgeschriebener Noten. 50 verschiedene Musiker transkribierten jeweils eine Seite aus 20 musikalischen Werken unterschiedlichster Art. Eine Weiterentwicklung von CVC-MUSCIMA ist der MUSCIMA++ Datensatz, welcher für 140 ausgewählte Seiten noch weitere detaillierte Annotation enthält.

SIMSSA

Das Single Interface for Music Score Searching and Analysis (SIMSSA) Projekt^[24] ist das vermutlich größte Forschungsprojekt, welches die optische Notenerkennung untersucht. Das Ziel ist die effiziente Bereitstellung von großen Mengen an durchsuchbaren Noten in elektronischer Form. Einige Unterprojekte wurden bereits erfolgreich abgeschlossen, zum Beispiel das Liber Usualis Projekt^[25] und das Cantus Ultimus Projekt.^[26]

TROMPA

Towards Richer Online Music Public-domain Archives (TROMPA) ist ein weiteres internationales Forschungsprojekt mit dem Ziel gemeinfreie, digitale Musikressourcen zugänglicher zu machen.^[27]

Datensätze

Die Entwicklung von OMR Systemen wird maßgeblich davon beeinflusst, welche Datensätze zur Entwicklung herangezogen werden. Ein ausreichend großer und diverser Datensatz trägt dazu bei dass das entwickelte System robust in verschiedenen Situationen arbeiten kann und mit unterschiedlichsten Eingaben zurecht kommt. Da Musiknoten durch das Urheberrecht geschützt sind, kann es kompliziert sein, einen entsprechenden Datensatz zu erstellen und zu veröffentlichen. Dennoch gibt es eine Reihe an Datensätzen, die das OMR Dataset Projekt^[28] gesammelt und zusammengefasst hat. Die bedeutendsten sind CVC-MUSCIMA,^[29] MUSCIMA++,^[30] DeepScores,^[31] PrIMuS,^[32] HOMUS,^[33] und der SEILS Datensatz,^[34] sowie die Universal Music Symbol Sammlung.^[35]

Software

Akademische und quelloffene Software

Eine große Anzahl an wissenschaftlichen OMR Projekten wurden durchgeführt, allerdings erreichten nur wenige einen derart ausgereiften Zustand, dass diese veröffentlicht und an Anwender verteilt wurden. Diese Systeme sind:

Aruspix^[36]
Audiveris^[37]
CANTOR^[38]
Gamera^[39]
DMOS^[40]
OpenOMR^[41]
Rodan^[42]

Kommerzielle Software

Die meisten kommerziellen Desktopanwendungen die in den letzten 20 Jahren veröffentlicht wurden sind aufgrund von mangelndem kommerziellen Erfolg wieder vom Markt verschwunden. Nur ein paar wenige Anbieter entwickelt, warten und verkaufen derzeit noch OMR Produkte. Manche dieser Produkte behaupten Erkennungsraten von nahezu 100% zu haben ^[43]^[44], aber nachdem keinerlei Informationen darüber angegeben sind, wie diese Zahlen berechnet wurden und auf welchen Daten sie basieren, sind diese nicht verifizierbar und machen es nahezu unmöglich verschiedene Produkte miteinander zu vergleichen. Neben den Desktopanwendungen wurde auch eine Reihe von mobilen Anwendungen entwickelt. Nachdem die Bewertungen dieser allerdings durchwachsen war, wurden diese Projekte wieder eingestellt (oder haben zumindest keine Aktualisierungen seit 2017 mehr erhalten).^[45]^[46]^[47]

capella-scan^[48]
ForteScan Light von Fortenotation^[49] now Scan Score^[50]
MIDI-Connections Scan von MIDI-Connections^[51]
MP Scan von Braeburn^[52] Uses SharpEye SDK.
NoteScan gebündelt mit Nightingale^[53]
OMeR (Optical Music easy Reader) Add-on for Harmony Assistant and Melody Assistant: Myriad Software^[54] (ShareWare)
PDFtoMusic^[55]
PhotoScore von Neuratron.^[44] The Light version of PhotoScore is used in Sibelius. PhotoScore uses the SharpEye SDK.
Scorscan von npcImaging.^[56] Based on SightReader(?)
SharpEye von Visiv^[57]
- VivaldiScan (genauso wie SharpEye)^[58]
SmartScore von Musitek.^[59] Früher als "MIDISCAN" verkauft. (SmartScore Lite wird in Finale verwendet).

Siehe auch

Mustererkennung
Musteranalyse
Texterkennung befasst sich mit der Erkennung von geschriebenem Text, welches dazu verwendet werden kann um Dokumente durchsuchbar zu machen. OMR kann eine ähnliche Funktion in Music Information Retrieval übernehmen, allerdings muss ein vollständiges OMR System auch den Text der in Musiknoten enthalten ist erkennen, weshalb OCR als ein Teilproblem von OMR angesehen werden kann.^[12]
Music Information Retrieval
Notensatzprogramm

References

↑ Alexander Pacha: Self-Learning Optical Music Recognition (Doktorarbeit). Hrsg.: TU Wien, Austria. 2019, doi:10.13140/RG.2.2.18467.40484 (Direkter Download [PDF]).
↑ Fujinaga, Ichiro (2018). Die Geschichte von OMR (Englisch) auf YouTube, abgerufen am 30. Juli 2019.
↑ Dennis Howard Pruslin: Automatic Recognition of Sheet Music (Doktorarbeit). Hrsg.: Massachusetts Institute of Technology, Cambridge, Massachusetts, USA. 1966.
↑ David S. Prerau: Computer pattern recognition of printed music. Fall Joint Computer Conference. 1971, S. 153–162.
↑ WABOT – WAseda roBOT. Waseda University Humanoid, abgerufen am 30. Juli 2019.
↑ Wabot’s entry in the IEEE collection of Robots. IEEE, abgerufen am 30. Juli 2019.
↑ Audrey Laplante, Ichiro Fujinaga, Fujinaga: Digitizing Musical Scores: Challenges and Opportunities for Libraries. 3rd International Workshop on Digital Libraries for Musicology. 2016, S. 45–48.
↑ Jan jr. Hajič, Marta Kolárová, Alexander Kolárová, Jorge Calvo-Zaragoza: How Current Optical Music Recognition Systems Are Becoming Useful for Digital Libraries. 5th International Conference on Digital Libraries for Musicology. Paris, France 2018, S. 57–61.
↑ Donald Byrd, Jakob Grue Simonsen: Towards a Standard Testbed for Optical Music Recognition: Definitions, Metrics, and Page Images. In: Journal of New Music Research. 44. Jahrgang, Nr. 3, 2015, S. 169–195, doi:10.1080/09298215.2015.1045424.
↑ Donald Byrd: Gallery of Interesting Music Notation. Abgerufen am 30. Juli 2019.
↑ Donald Byrd: Extremes of Conventional Music Notation. Abgerufen am 30. Juli 2019.
↑ ^a ^b David Bainbridge, Tim Bell: The challenge of optical music recognition. In: Computers and the Humanities. 35. Jahrgang, Nr. 2, 2001, S. 95–121, doi:10.1023/A:1002485918032 (researchgate.net).
↑ Ana Rebelo, Ichiro Fujinaga, Filipe Paszkiewicz, Andre R.S. Marcal, Carlos Guedes, Jamie dos Santos Cardoso: Optical music recognition: state-of-the-art and open issues. In: International Journal of Multimedia Information Retrieval. 1. Jahrgang, Nr. 3, 2012, S. 173–190, doi:10.1007/s13735-012-0004-6 (springer.com [PDF]).
↑ Fancisco J. Castellanos, Jorge Calvo-Zaragoza, Gabriel Calvo-Zaragoza, Ichiro Fujinaga: Document Analysis of Music Score Images with Selectional Auto-Encoders. 19th International Society for Music Information Retrieval Conference. Paris, France 2018, S. 256–263 (ircam.fr [PDF]).
↑ Lukas Tuggener, Ismail Elezi, Jürgen Elezi, Thilo Stadelmann: Deep Watershed Detector for Music Object Recognition. 19th International Society for Music Information Retrieval Conference. Paris, France 2018, S. 271–278 (ircam.fr [PDF]).
↑ Jan jr. Hajič, Matthias Dorfer, Gerhard Dorfer, Pavel Pecina: Towards Full-Pipeline Handwritten OMR with Musical Symbol Detection by U-Nets. 19th International Society for Music Information Retrieval Conference. Paris, France 2018, S. 225–232 (ircam.fr [PDF]).
↑ Alexander Pacha, Jan jr. Hajič, Jorge Calvo-Zaragoza: A Baseline for General Music Object Detection with Deep Learning. In: Applied Sciences. 8. Jahrgang, Nr. 9, 2018, S. 1488–1508, doi:10.3390/app8091488 (mdpi.com).
↑ Alexander Pacha, Kwon-Young Choi, Bertrand Choi, Yann Ricquebourg, Richard Zanibbi, Horst Eidenberger: Handwritten Music Object Detection: Open Issues and Baseline Results. 13th International Workshop on Document Analysis Systems. 2018, S. 163–168, doi:10.1109/DAS.2018.51.
↑ Alexander Pacha, Jorge Calvo-Zaragoza, Jan jr. Calvo-Zaragoza: Learning Notation Graph Construction for Full-Pipeline Optical Music Recognition. 20th International Society for Music Information Retrieval Conference (in press). 2019.
↑ Eelco van der Wel, Karen Ullrich, Ullrich: Optical Music Recognition with Convolutional Sequence-to-Sequence Models. 18th International Society for Music Information Retrieval Conference. Suzhou, China 2017 (ismir.net [PDF]).
↑ Jorge Calvo-Zaragoza, David Rizo: End-to-End Neural Optical Music Recognition of Monophonic Scores. In: Applied Sciences. 8. Jahrgang, Nr. 4, 2018, doi:10.3390/app8040606 (mdpi.com).
↑ Arnau Baró, Pau Riba, Jorge Riba, Alicia Fornés: Optical Music Recognition by Recurrent Neural Networks. 14th International Conference on Document Analysis and Recognition. 2017, S. 25–26, doi:10.1109/ICDAR.2017.260.
↑ Alicia Fornés, Anjan Dutta, Albert Gordo, Josep Lladós: The 2012 Music Scores Competitions: Staff Removal and Writer Identification. In: Graphics Recognition. New Trends and Challenges. Springer, 2013, S. 173–186, doi:10.1007/978-3-642-36824-0_17.
↑ Website des SIMSSA Projektes. McGill University, abgerufen am 30. Juli 2019.
↑ The Liber Usualis project website. McGill University, abgerufen am 30. Juli 2019.
↑ The Cantus Ultimus project website. McGill University, abgerufen am 30. Juli 2019.
↑ The TROMPA project website. Trompa Konsortium, abgerufen am 30. Juli 2019.
↑ Pacha, Alexander: The OMR Datasets Project (Github Repository). Abgerufen am 30. Juli 2019.
↑ Alicia Fornés, Anjan Dutta, Albert Gordo, Josep Lladós: CVC-MUSCIMA: A Ground-truth of Handwritten Music Score Images for Writer Identification and Staff Removal. In: International Journal on Document Analysis and Recognition. 15. Jahrgang, Nr. 3, 2012, S. 243–251, doi:10.1007/s10032-011-0168-2.
↑ Jan jr. Hajič, Pavel Pecina, Pecina: The MUSCIMA++ Dataset for Handwritten Optical Music Recognition. 14th International Conference on Document Analysis and Recognition. Kyoto, Japan 2017, S. 39–46, doi:10.1109/ICDAR.2017.16.
↑ Lukas Tuggener, Ismail Elezi, Jürgen Elezi, Marcello Pelillo, Thilo Stadelmann: DeepScores – A Dataset for Segmentation, Detection and Classification of Tiny Objects. 24th International Conference on Pattern Recognition. Beijing, China 2018, doi:10.21256/zhaw-4255.
↑ Jorge Calvo-Zaragoza, David Rizo, Rizo: Camera-PrIMuS: Neural End-to-End Optical Music Recognition on Realistic Monophonic Scores. 19th International Society for Music Information Retrieval Conference. Paris, France 2018, S. 248–255 (ircam.fr [PDF]).
↑ Jorge Calvo-Zaragoza, Jose Oncina, Oncina: Recognition of Pen-Based Music Notation: The HOMUS Dataset. 22nd International Conference on Pattern Recognition. 2014, S. 3038–3043, doi:10.1109/ICPR.2014.524.
↑ Emilia Parada-Cabaleiro, Anton Batliner, Alice Batliner, Björn Schuller: The SEILS Dataset: Symbolically Encoded Scores in Modern-Early Notation for Computational Musicology. 18th International Society for Music Information Retrieval Conference. Suzhou, China 2017, S. 575–581 (smcnus.org [PDF]).
↑ Alexander Pacha, Horst Eidenberger, Eidenberger: Towards a Universal Music Symbol Classifier. 14th International Conference on Document Analysis and Recognition. Kyoto, Japan 2017, S. 35–36, doi:10.1109/ICDAR.2017.265.
↑ Aruspix
↑ Audiveris
↑ CANTOR
↑ Gamera
↑ Bertrand Coüasnon: DMOS: a generic document recognition method, application to an automatic generator of musical scores, mathematical formulae and table structures recognition systems. Sixth International Conference on Document Analysis and Recognition. 2001, S. 215–220, doi:10.1109/ICDAR.2001.953786.
↑ OpenOMR
↑ Rodan
↑ Informationen über die Genauigkeit von capella-scan
↑ ^a ^b PhotoScore Ultimate 7
↑ PlayScore Pro
↑ iSeeNotes
↑ NotateMe Now
↑ Info capella-scan
↑ FORTE Scan Light fortenotation.com (Memento vom 22. September 2013 im Internet Archive)Fehler bei Vorlage * Parametername unbekannt (Vorlage:Webarchiv): "datum" Linktext fehlt.
↑ Scan Score
↑ MIDI-Connections SCAN 2.0 midi-connections.com (Memento vom 20. Dezember 2013 im Internet Archive)Fehler bei Vorlage * Parametername unbekannt (Vorlage:Webarchiv): "datum" Linktext fehlt.
↑ Music Publisher Scanning Edition braeburn.co.uk (Memento vom 13. April 2013 im Internet Archive)Fehler bei Vorlage * Parametername unbekannt (Vorlage:Webarchiv): "datum" Linktext fehlt.
↑ NoteScan
↑ OMeR
↑ PDFtoMusic
↑ ScorScan
↑ SharpEye
↑ VivaldiScan vivaldistudio.com (Memento vom 24. Dezember 2005 im Internet Archive)Fehler bei Vorlage * Parametername unbekannt (Vorlage:Webarchiv): "datum" Linktext fehlt.
↑ SmartScore musitek.com (Memento vom 17. April 2012 im Internet Archive)Fehler bei Vorlage * Parametername unbekannt (Vorlage:Webarchiv): "datum" Linktext fehlt.

Weblinks

Website über Forschungsaktivitäten im Bereich der optischen Notenerkennung
Github page for open-source projects on optical music recognition
Bibliography on OMR-Research
Recording of the ISMIR 2018 tutorial "Optical Music Recognition for Dummies"
Optical Music Recognition (OMR): Programs and scientific papers
OMR (Optical Music Recognition) Systems: Ausführlicher Überblick über OMR Systeme (Zuletzt aktualisiert am: 30 January 2007).
Deutsche Notenscan-Übersichtsseite von Gerd Castan
Bringing Sheet Music to Life: My Experiences with OMR (Andrew H. Bullen)

[1] Alexander Pacha: Self-Learning Optical Music Recognition (Doktorarbeit). Hrsg.: TU Wien, Austria. 2019, doi:10.13140/RG.2.2.18467.40484 (Direkter Download [PDF]).

[2] Fujinaga, Ichiro (2018). Die Geschichte von OMR (Englisch) auf YouTube, abgerufen am 30. Juli 2019.

[3] Dennis Howard Pruslin: Automatic Recognition of Sheet Music (Doktorarbeit). Hrsg.: Massachusetts Institute of Technology, Cambridge, Massachusetts, USA. 1966.

[prerau1971-4] David S. Prerau: Computer pattern recognition of printed music. Fall Joint Computer Conference. 1971, S. 153–162.

[5] WABOT – WAseda roBOT. Waseda University Humanoid, abgerufen am 30. Juli 2019.

[6] Wabot’s entry in the IEEE collection of Robots. IEEE, abgerufen am 30. Juli 2019.

[7] Audrey Laplante, Ichiro Fujinaga, Fujinaga: Digitizing Musical Scores: Challenges and Opportunities for Libraries. 3rd International Workshop on Digital Libraries for Musicology. 2016, S. 45–48.

[8] Jan jr. Hajič, Marta Kolárová, Alexander Kolárová, Jorge Calvo-Zaragoza: How Current Optical Music Recognition Systems Are Becoming Useful for Digital Libraries. 5th International Conference on Digital Libraries for Musicology. Paris, France 2018, S. 57–61.

[9] Donald Byrd, Jakob Grue Simonsen: Towards a Standard Testbed for Optical Music Recognition: Definitions, Metrics, and Page Images. In: Journal of New Music Research. 44. Jahrgang, Nr. 3, 2015, S. 169–195, doi:10.1080/09298215.2015.1045424.

[10] Donald Byrd: Gallery of Interesting Music Notation. Abgerufen am 30. Juli 2019.

[11] Donald Byrd: Extremes of Conventional Music Notation. Abgerufen am 30. Juli 2019.

[Bainbridge2001-12] David Bainbridge, Tim Bell: The challenge of optical music recognition. In: Computers and the Humanities. 35. Jahrgang, Nr. 2, 2001, S. 95–121, doi:10.1023/A:1002485918032 (researchgate.net).

[13] Ana Rebelo, Ichiro Fujinaga, Filipe Paszkiewicz, Andre R.S. Marcal, Carlos Guedes, Jamie dos Santos Cardoso: Optical music recognition: state-of-the-art and open issues. In: International Journal of Multimedia Information Retrieval. 1. Jahrgang, Nr. 3, 2012, S. 173–190, doi:10.1007/s13735-012-0004-6 (springer.com [PDF]).

[14] Fancisco J. Castellanos, Jorge Calvo-Zaragoza, Gabriel Calvo-Zaragoza, Ichiro Fujinaga: Document Analysis of Music Score Images with Selectional Auto-Encoders. 19th International Society for Music Information Retrieval Conference. Paris, France 2018, S. 256–263 (ircam.fr [PDF]).

[15] Lukas Tuggener, Ismail Elezi, Jürgen Elezi, Thilo Stadelmann: Deep Watershed Detector for Music Object Recognition. 19th International Society for Music Information Retrieval Conference. Paris, France 2018, S. 271–278 (ircam.fr [PDF]).

[16] Jan jr. Hajič, Matthias Dorfer, Gerhard Dorfer, Pavel Pecina: Towards Full-Pipeline Handwritten OMR with Musical Symbol Detection by U-Nets. 19th International Society for Music Information Retrieval Conference. Paris, France 2018, S. 225–232 (ircam.fr [PDF]).

[17] Alexander Pacha, Jan jr. Hajič, Jorge Calvo-Zaragoza: A Baseline for General Music Object Detection with Deep Learning. In: Applied Sciences. 8. Jahrgang, Nr. 9, 2018, S. 1488–1508, doi:10.3390/app8091488 (mdpi.com).

[18] Alexander Pacha, Kwon-Young Choi, Bertrand Choi, Yann Ricquebourg, Richard Zanibbi, Horst Eidenberger: Handwritten Music Object Detection: Open Issues and Baseline Results. 13th International Workshop on Document Analysis Systems. 2018, S. 163–168, doi:10.1109/DAS.2018.51.

[19] Alexander Pacha, Jorge Calvo-Zaragoza, Jan jr. Calvo-Zaragoza: Learning Notation Graph Construction for Full-Pipeline Optical Music Recognition. 20th International Society for Music Information Retrieval Conference (in press). 2019.

[20] Eelco van der Wel, Karen Ullrich, Ullrich: Optical Music Recognition with Convolutional Sequence-to-Sequence Models. 18th International Society for Music Information Retrieval Conference. Suzhou, China 2017 (ismir.net [PDF]).

[21] Jorge Calvo-Zaragoza, David Rizo: End-to-End Neural Optical Music Recognition of Monophonic Scores. In: Applied Sciences. 8. Jahrgang, Nr. 4, 2018, doi:10.3390/app8040606 (mdpi.com).

[22] Arnau Baró, Pau Riba, Jorge Riba, Alicia Fornés: Optical Music Recognition by Recurrent Neural Networks. 14th International Conference on Document Analysis and Recognition. 2017, S. 25–26, doi:10.1109/ICDAR.2017.260.

[23] Alicia Fornés, Anjan Dutta, Albert Gordo, Josep Lladós: The 2012 Music Scores Competitions: Staff Removal and Writer Identification. In: Graphics Recognition. New Trends and Challenges. Springer, 2013, S. 173–186, doi:10.1007/978-3-642-36824-0_17.

[24] Website des SIMSSA Projektes. McGill University, abgerufen am 30. Juli 2019.

[25] The Liber Usualis project website. McGill University, abgerufen am 30. Juli 2019.

[26] The Cantus Ultimus project website. McGill University, abgerufen am 30. Juli 2019.

[27] The TROMPA project website. Trompa Konsortium, abgerufen am 30. Juli 2019.

[28] Pacha, Alexander: The OMR Datasets Project (Github Repository). Abgerufen am 30. Juli 2019.

[29] Alicia Fornés, Anjan Dutta, Albert Gordo, Josep Lladós: CVC-MUSCIMA: A Ground-truth of Handwritten Music Score Images for Writer Identification and Staff Removal. In: International Journal on Document Analysis and Recognition. 15. Jahrgang, Nr. 3, 2012, S. 243–251, doi:10.1007/s10032-011-0168-2.

[30] Jan jr. Hajič, Pavel Pecina, Pecina: The MUSCIMA++ Dataset for Handwritten Optical Music Recognition. 14th International Conference on Document Analysis and Recognition. Kyoto, Japan 2017, S. 39–46, doi:10.1109/ICDAR.2017.16.

[31] Lukas Tuggener, Ismail Elezi, Jürgen Elezi, Marcello Pelillo, Thilo Stadelmann: DeepScores – A Dataset for Segmentation, Detection and Classification of Tiny Objects. 24th International Conference on Pattern Recognition. Beijing, China 2018, doi:10.21256/zhaw-4255.

[32] Jorge Calvo-Zaragoza, David Rizo, Rizo: Camera-PrIMuS: Neural End-to-End Optical Music Recognition on Realistic Monophonic Scores. 19th International Society for Music Information Retrieval Conference. Paris, France 2018, S. 248–255 (ircam.fr [PDF]).

[33] Jorge Calvo-Zaragoza, Jose Oncina, Oncina: Recognition of Pen-Based Music Notation: The HOMUS Dataset. 22nd International Conference on Pattern Recognition. 2014, S. 3038–3043, doi:10.1109/ICPR.2014.524.

[34] Emilia Parada-Cabaleiro, Anton Batliner, Alice Batliner, Björn Schuller: The SEILS Dataset: Symbolically Encoded Scores in Modern-Early Notation for Computational Musicology. 18th International Society for Music Information Retrieval Conference. Suzhou, China 2017, S. 575–581 (smcnus.org [PDF]).

[35] Alexander Pacha, Horst Eidenberger, Eidenberger: Towards a Universal Music Symbol Classifier. 14th International Conference on Document Analysis and Recognition. Kyoto, Japan 2017, S. 35–36, doi:10.1109/ICDAR.2017.265.

[36] Aruspix

[37] Audiveris

[38] CANTOR

[39] Gamera

[40] Bertrand Coüasnon: DMOS: a generic document recognition method, application to an automatic generator of musical scores, mathematical formulae and table structures recognition systems. Sixth International Conference on Document Analysis and Recognition. 2001, S. 215–220, doi:10.1109/ICDAR.2001.953786.

[41] OpenOMR

[42] Rodan

[43] Informationen über die Genauigkeit von capella-scan

[photoscore-44] PhotoScore Ultimate 7

[45] PlayScore Pro

[46] SeeNotes

[47] NotateMe Now

[capella-scan-48] Info capella-scan

[49] FORTE Scan Light fortenotation.com (Memento vom 22. September 2013 im Internet Archive)Fehler bei Vorlage * Parametername unbekannt (Vorlage:Webarchiv): "datum" Linktext fehlt.

[50] Scan Score

[51] MIDI-Connections SCAN 2.0 midi-connections.com (Memento vom 20. Dezember 2013 im Internet Archive)Fehler bei Vorlage * Parametername unbekannt (Vorlage:Webarchiv): "datum" Linktext fehlt.

[52] Music Publisher Scanning Edition braeburn.co.uk (Memento vom 13. April 2013 im Internet Archive)Fehler bei Vorlage * Parametername unbekannt (Vorlage:Webarchiv): "datum" Linktext fehlt.

[53] NoteScan

[54] OMeR

[55] PDFtoMusic

[56] ScorScan

[57] SharpEye

[58] VivaldiScan vivaldistudio.com (Memento vom 24. Dezember 2005 im Internet Archive)Fehler bei Vorlage * Parametername unbekannt (Vorlage:Webarchiv): "datum" Linktext fehlt.

[59] SmartScore musitek.com (Memento vom 17. April 2012 im Internet Archive)Fehler bei Vorlage * Parametername unbekannt (Vorlage:Webarchiv): "datum" Linktext fehlt.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]

[49]

[50]

[51]

[52]

[53]

[54]

[55]

[56]

[57]

[58]

[59]

„Optische Notenerkennung“ – Versionsunterschied

Version vom 30. Juli 2019, 14:11 Uhr

Inhaltsverzeichnis

Geschichte