Dienstag, 19. Juni 2018

Was ist in den letzten Monaten bei COVER.INFO passiert?

Auch wenn sich oberflächlich an der Seite seit Wochen nicht viel getan hat, arbeiten wir nach wie vor intensiv am neuen COVER.INFO. Die Datenbank wurde in den letzten Monaten komplett neu designt und die alten Daten wurden überarbeitet, migriert und werden nun erneut einer Überprüfung unterzogen. Als Nutzer bekommt ihr davon wenig mit. Darum wollen wir an dieser Stelle berichten, was es alles im Hintergrund zu tun gab und gibt.

In der Datenbank des alten coverinfo.de wurden fast alle Zusatzinformationen hintereinander in den Kommentar geschrieben, zum Beispiel "Liveversion. 1978 aufgenommen. Deutscher Text: Max Mustermann / Sarah Muster. Von Sarah existiert auch eine französische Version mit dem Titel "Exemple" aus dem Jahre 1980".

Für die neue Seite haben alle diese Informationen ihren eigenen Platz in der Datenbank. Dies vermeidet Fehler, und Daten können viel einfacher eingetragen und verwaltet werden. Zudem kann man eine zusätzliche komplett englischsprachige Version von COVER.INFO umsetzen. Auch wenn ein Großteil der Daten automatisiert ausgewertet werden konnte, war eine Menge manueller Arbeit nötig. In fast 20 Jahren kommen viele interessante Tippfehler zustande – wie "Framzösich" oder "Deusch".

In der alten Datenbank konnte ein Song immer nur ein Original haben. Hatte ein Song mehrere Originale, musste er mehrfach angelegt werden. Dem einen oder anderen aufmerksamen Besucher sind sicherlich diesbezüglich gelegentlich Ungereimtheiten aufgefallen. In der neuen Datenbank existiert ein Song wirklich nur einmal.

Für die neue Seite wurden Songbeziehungen hinzugefügt. Neben Cover und Zitat gibt es nun auch Sample, Medley und Alternativversion. Alternativversionen bilden insbesondere anderssprachige Fassungen des Originals ab. Die waren bisher zwar als Bemerkung erfasst, aber sind nun eigenständige Songs.

Einem Song können nun mehrere Urheber und Interpreten zugeordnet werden. Das war vorher anders. Ein Song konnte nur einen einzigen Interpreten haben. Madonna feat. Justin Timberlake war für die Datenbank ein Interpret. Und wenn ihr auf Madonna oder Justin Timberlake geklickt habt, um alle ihre Songs anzeigen zu lassen, waren die Songs von Madonna feat. Justin Timberlake nicht dabei. Wir mussten deshalb über 100.000 Interpreten überarbeiten und in rund 120.000 trennen. Das ging nicht vollautomatisch, denn das System kann nicht wissen, ob zum Beispiel Kool & The Gang ein oder zwei Interpreten sind.

Urheber stellen ein gesondertes Problem dar, weil diese sehr unterschiedlich in Quellen oder auf Platten erfasst sind. Teilweise ist der Künstlername angegeben, teilweise der bürgerliche Name; teilweise der Vor- und Nachname, teilweise nur der Nachname. All dies muss manuell geprüft werden – bei knapp 90.000 Songs mit Urhebern eine zeitintensive Aufgabe.

Ihr ahnt es: Die neue Seite ist viel komplexer, aber deutlich schneller als die alte. Außerdem ist die neue auf mobilen Geräten nutzbar.

Auf COVER.INFO ist jetzt auf einen Blick zu sehen, welche Songs ein Künstler performt und geschrieben hat und in welchen Bands er Mitglied war bzw. ist.

Zu rund 55 % der Songs konnte unser System insgesamt etwa 230.000 YouTube-Videos finden, die es ermöglichen, diese Songs anzuhören – eine enorme Verbesserung im Vergleich zur alten Seite.

Die Implementierung der Sprachen der Songs ist auch nicht so trivial, wie es auf den ersten Blick scheint. Die Redakteure benötigen eine Auswahlliste für Sprachen. Doch welche Sprachen gibt es überhaupt? Es gibt hier ISO-Standards, aber auch die sind nicht unumstritten. Und so kommt es dann, dass Sprachen in der Auswahlliste zu fehlen scheinen und zu klären ist, warum das so ist. Ist es vielleicht keine Sprache, sondern ein Dialekt? Dialekte wollen wir nämlich nicht erfassen.

Über 66.000 Songs sind bereits mit einer Sprache versehen. Dabei stand bei uns ursprünglich sogar zur Diskussion, diese Information aus der Datenbank zu streichen, weil sie nur bei einer Minderheit der Songs überhaupt erfasst war. Doch euer Feedback zeigte uns, dass euch die Information für eure Recherchen wichtig ist, weshalb wir nun anstreben, allen Songs eine Sprache zuzuweisen.

Schon seit vielen Jahren erfassen wir die Quellen für unsere Datenbankeinträge im Hintergrund. Sehr oft sind das Webseiten. Wir haben schon viele Musikseiten im Internet kommen und gehen sehen. Das heißt, viele der Quellen sind schon gar nicht mehr erreichbar. Manchmal ist eine seriöse Website einer gefährlichen gewichen, weil der Domain-Inhaber gewechselt hat. Wir haben uns nun entschieden, ausgewählte langjährige seriöse Quellen mit euch zu teilen und öffentlich anzuzeigen, darunter Discogs.com und Wikipedia. Außerdem erfassen wir immer öfter zum Beispiel auch Plattenlabels und Bestellnummern. Aber auch diese Angaben bedürfen nun einer Überführung in strukturierte Datenfelder.

Neben diesen ganzen Aufgaben spielen sich im Hintergrund weitere Dinge ab: Es müssen Konzepte erstellt und umgesetzt werden, um die Inhalte der vielen neuen Datenfelder sinnvoll und möglichst übersichtlich auf COVER.INFO anzuzeigen. Außerdem muss ein Ticketsystem geschaffen werden, das es ermöglicht, eure Einsendungen zur Datenbank durch die Redaktion prüfen und in die Datenbank aufnehmen zu lassen. Kontaktformulare gab es bei coverinfo.de zwar auch schon, aber sie generierten lediglich E-Mails, die komplett manuell in die Datenbank übertragen werden mussten. Derzeit versuchen wir, so viel wie möglich zu automatisieren, damit die Datenbank so schnell wie möglich unter der Aufsicht unserer Redaktion wachsen kann.

Zudem gab es eine ganze Reihe von technischen Herausforderungen, die gelöst werden mussten. Insofern haben wir uns in letzter Zeit primär damit beschäftigt, technisch und fachlich eine solide Grundlage für die Zukunft zu schaffen.

Schlussendlich wird COVER.INFO derzeit noch einmal einem Redesign unterzogen, um die Darstellung der Daten zu optimieren und den Nutzen und den Bedienkomfort zu erhöhen.
/TWA, FRI

1 Kommentar:

  1. "Schlussendlich wird COVER.INFO derzeit noch einmal einem Redesign unterzogen, um die Darstellung der Daten zu optimieren und den Nutzen und den Bedienkomfort zu erhöhen."

    Das ist auch dringend notwendig! Wie schon von mir und anderen Usern angemerkt, ist das jetzige Design der letzte Schrott.

    AntwortenLöschen