Komplettes Album an einem Tag

Am Karfreitag des Jahres 2024 habe ich ein komplettes Musikalbum mit zehn neuen Musikstücken produziert. Und zwar mit englischen Texten! Was … äh … what?

Ja, jeder, der mich kennt, wird verwundert auf den Kalender schauen und denken: „Okay, da hat er sich wohl mit dem Datum vertan: Es ist überhaupt nicht der erste April!“

Aber das ist gar kein Aprilscherz – mitnichten … und Neffen! Aber … der Reihe nach:

To make a short story long

Am 29. März 2024 riss ich morgens im Bad von meinem Tageskalender das Blatt des Vortages ab und schaute mir das aktuelle Kalenderblatt aufmerksam an. Das ist nicht so verwunderlich, wie es sich zunächst liest. Denn in meinem Bad steht ein sogenanntes „TYPODARIUM“. Das ist ein Tageskalender, bei dem jedes Kalenderblatt mithilfe einer anderen Schrift, in einer anderen Typografie, gestaltet ist. Das sind manchmal ziemlich anregende Gestaltungen. Zumindest, wenn man – so wie ich – ein Typo-Nerd ist. Mein Schwager hat mich schon für verrückt erklärt, als ich ihm erzählte, dass ich Schriften sammle … aber das führt jetzt zu weit.

Kein Blatt vor dem Mund – ein Blatt vor den Augen!

Jedenfalls stand ich so im Bad, schaute mir das tagesaktuelle Blatt an und wunderte mich.

Nicht, dass die verwendete Schrifttype so außergewöhnlich war. Bei allem Respekt für jeden Menschen, der sich die Arbeit macht, Schriften zu produzieren – das Detail, das mich wundern ließ, stand zwischen der Datumszahl und dem Wochentag. Dort werden (international in Englisch) Feier- oder Gedenktage des jeweiligen Datums aufgeführt. Manchmal sogar mit einem Länderkürzel, damit man weiß, wo man diesen Tag feiert. An diesem Tag stand dort – klein, aber doch gut lesbar: „Good Friday“.

Als Boomer, der ich ja nun mal bin, kenne ich trotzdem den einen oder anderen Begriff aus dem angelsächsischen Sprachgemenge. Aber „Good Friday“ war mir bis dahin kein Begriff. Also: nach der Morgentoilette ab an den Bildschirm und direkt zu Wikipedia. Ach so: Karfreitag auf Englisch! Na, das hätte ich auch … ne, wäre ich nie drauf gekommen. Mit einem Schmunzeln (und etwas mehr Faktenwissen) ging ich zum Frühstück.

Jetzt mache ich mal Musik …

Da meine beiden Lieben noch auf dem Ponyhof im Süden Deutschlands weilten, machte ich es mir nach dem Frühstück in meinem Zimmer (Büro / Studio / Homeoffice / …) vor dem Bildschirm bequem.

… oder schaue erst einmal ins Netz

Ich hatte am Abend vorher in einem Video auf YouTube einen Beitrag von Bob Dyle Media gesehen, in dem Bob Dyle erzählte, dass er Musik mithilfe einer KI-gestützten Software (Suno) erstellt hatte.

Screenshot: ©2024 Bob Dyle Media

Nun, als ich das letzte Mal von einer KI hörte, die „Musik“ machen kann und diese Software testete, war ich beruhigt und amüsiert. Solche akustischen Unfälle ohne Inspiration, bar jeglicher Musikalität ließen mich kalt. Aber: hey, das war ja auch schon wieder fast ein Jahr her!

Neue KI, neues Glück

Also sagte ich mir: „Versuch doch mal »Suno«!“. Im Netz unter https://app.suno.ai richtete ich mir ein Nutzerkonto ein und überlegte mir anschließend einen pseudointellektuellen Satz („Ockhams Rasiermesser schneidet tief in das Herz der Realität“). Dann schaute ich bei DeepL vorbei, um mir diesen Satz einwandfrei ins Englische übersetzen zu lassen. Das Ergebnis kopierte ich ins Eingabefeld bei Suno und drückte den großen, verlockenden Knopf, der – neben einem Noten-Symbol – mit der vielversprechenden Bezeichnung „Create“ beschriftet war. Nach ungefähr einer Minute wurden mir zwei neue Elemente präsentiert, auf denen das bekannte „PLAY“-Symbol prangte. Gleichzeitig erschienen auch zwei kleine Bildchen („Thumbnails“), die speziell für diese Musikstücke generiert wurden – niedlich! Und nebenbei sah ich auch noch den Song-Text: Die Software hatte sich zwei Strophen und einen Refrain ausgedacht! Betitelt hatte Suno die beiden Songs mit „Razor’s Edge“. Na, fleißig war die Software schon mal. Aber: was war nun mit „Musik“?

Der Schock

Ja, liebe Lesenden, nachdem ich »Play« gedrückt hatte, hörte ich: MUSIK! Ein Sänger sang, Instrumente erklangen und als nach zwei Strophen der Refrain einsetzte, wurden meine Augen feucht. Nach einer Minute und zwanzig Sekunden war es schon wieder ruhig im Raum. Ich saß wie versteinert da und fragte mich, was denn jetzt passiert war.

Kein Opus Magnum – aber brauchbar!

Ja, die Klangqualität war weit von „HiFi“ entfernt, der Mix war alles andere als perfekt … aber: LEUTE! Das hatte gar nichts mehr mit dem Mist zu tun, der mir von diversen, unterschiedlichen künstlichen Intelligenzen im letzten Jahr als „Musik“ präsentiert wurde! Der Gesang ist geradezu menschlich artikuliert, der Track hat eine Struktur und die Harmonien klingen interessant.

Tief einatmen!

Es dauerte ein wenig, ehe ich meine Fassung wieder gefunden hatte. Ich begann, diese Software ernst zu nehmen und setzte mich mit ihren Möglichkeiten auseinander.

Der Workflow

Nach ein paar Experimenten entwickelte ich nun folgenden Prozess:

  1. Ich überlegte mir ein Song-Thema und suchte passende Stichwörter
  2. Ich übersetzte diese Stichwörter ins Englische mithilfe von DeepL
  3. Ich „beauftragte“ ChatGPT, mir aus den englischen Wörtern einen Song-Text zu bauen
  4. Ich kopierte den Text ins Textfeld von Suno, wählte ein Musik-Genre und drückte auf „Create“
  5. Ich lud den Text und die Audio-Dateien (es entstanden immer zwei Versionen eines Songs) auf meinen Computer herunter

Am Ende lagen mir innerhalb einer Stunde zehn „Musikstückchen“ inklusive der verwendeten Texte vor. Was sollte ich nun damit machen? In meinem Blog gibt es ja schon die Kategorie „Soundskizze“. Aber das sind alles musikalische Häppchen, die ich komplett „alleine“ – also ohne KI – gebastelt habe. Diese Stücke, die ich ja mittels diverser KI erstellt hatte, wollte ich auf keinen Fall dort präsentieren.

Heftchen erstellen, Download anbieten – fertig!

Da kam mir die Idee: „Gestalte doch ein passendes Heftchen, biete die Tracks als Download an und veröffentliche das Ganze als Album!“

Gestaltung

Kurzentschlossen öffnete ich meine Layout-Software (Adobe InDesign) und schuf die Bühne für das spätere Druckwerk. Es sollte ein Papiereinleger für CD-Hüllen sein. Den kann man sowohl ins sogenannte „JewelCase“ als auch ins „Slim-Case“ stecken. Doppelseitig bedruckt, würden auf dem Papier alle relevanten Informationen dieser CD Platz finden. Und das Schönste daran: sowohl die Texte als auch kleine Bildchen für jeden Track lagen ja schon vor – vielen Dank, Suno!

Der Titel des Albums

Wie sollte ich dieses experimentelle Album nennen? Ich erinnerte mich an meine morgendliche Verwunderung über „Good Friday“ und fand diesen Titel passend. Außerdem hatte ich mich ja hauptsächlich mit Suno als „Sparringspartner“ auseinandergesetzt. Suno war sozusagen mein Assistent beim Erstellungsprozess dieses Albums. Also nannte ich das Ganze:

Good Day with my friend Suno

Die Rückseite des Mini-Heftchens sollte die Stücke und ihre „Eckdaten“ auflisten. Ich ergänzte die Titelliste noch mit den vielfarbigen „Thumbnails“ von Suno. Und nach ein wenig Formatierungsarbeit stand das Layout der Rückseite. Hier die finale Version (schon mit QR-Code und dem Hinweis auf die Erstellung der Cover-Illustration):

Als Albuminterpret trug ich „Christian F. Drab feat. Suno“ ein. Ich hoffe, das ist in dieser Art korrekt. Trotzdem führte ich noch die Unterstützung durch diverse Software auf. Meinen menschlichen Anteil wollte ich natürlich auch möglichst transparent kommunizieren: Ich glaube, die Bezeichnung „Prompt Engineering“ trifft die Tätigkeit, die ich beim Erstellen der Tracks ausübte.

Das Cover

Bei der Gestaltung des Covers gab ich mir besonders viel Mühe. Passend zum Thema sollte es eine fotorealistische Abbildung sein. Sie sollte einen Menschen und einen Roboter zeigen, die zusammen Musik produzieren. Was lag da näher, als auch für diesen Zweck eine KI zu verwenden?

KI-Bilder sind keine Fotos

Vor kurzer Zeit richtete ich mir ein Nutzerkonto bei Ideogram ein. Es gibt ja mittlerweile eine unübersehbare Menge an „text-to-picture“-Seiten im Internet. Alle versprechen tolle Darstellungen durch Eingabe von Beschreibungen zu erzeugen. Unter den kostenlosen Diensten bevorzuge ich aktuell Ideogram. Die Qualität der Ergebnisse sagen mir sehr oft zu.

Prompt Engineering

Auch beim Erstellung künstlich erzeugter Bilder kommt es auf den beschreibenden Text an. Im Laufe der Bildgenerierung passte ich ihn immer wieder ein wenig an. Hier ist der Text, den ich verwendete, um das von mir gewünschte Ergebnis zu generieren:

Wir sehen ein hochmodernes Aufnahmestudio. Im Raum befinden sich mehrere dekorative Leuchten mit warmem Licht. Wir schauen einem menschlichen Tontechniker und einem künstlichen Roboter, die nebeneinander sitzen, über die Schulter. Wir können nur die Hinterköpfe der beiden sehen. Sie sitzen vor einem Mischpult. Hinter dem Mischpult befinden sich Monitorlautsprecher. In der Mitte steht ein Computerbildschirm. Auf diesem Bildschirm läuft eine Audiosoftware. Im Studio gibt es viele grüne Pflanzen mit großen Blättern. Die ganze Szene strahlt eine positive Atmosphäre aus.

Natürlich jagte ich auch diesen Text durch DeepL, um einen gut formulierten, englischen Text verwenden zu können. Das Bild, dass Ideogram dann ausgab, sah so aus:

Das gefiel mir zwar schon ganz gut (witzig fand ich das verunglückte Apple-Logo). Aber es waren einerseits noch hässliche „Artefakte“ zu sehen (z. B. in der Stuhlrückenlehne des Menschen) und die abgebildete Software irritierte mich auch ein wenig.

Nacharbeit – schon wieder mit KI!

Zur Optimierung dieses Bildes öffnete ich die Software, deren Name mittlerweile schon Synonym für das Manipulieren von Fotos verwendet wird. Richtig: Adobe Photoshop. Und hier kam beim Ausbessern schon wieder KI zum Einsatz! Wenn ich eine komplizierte Struktur retuschieren muss, nutze ich gern die Photoshop-Werkzeuge in Kombination mit der integrierten KI, die bei Adobe »Firefly« heißt (die Weiterentwicklung von »Sensei«?). So retuschierte ich das KI-Bild, montierte noch einen Screenshot meiner bevorzugten Audio-Software in den Bildschirm und hatte nun mein Cover-Motiv. Hier das endgültige Bild auf der Titelseite des CD-Heftchens:

Lyrics – kein Anspruch auf Literaturpreise

Die Texte der Doppel-Tracks sollten im Inneren des Heftchens abgedruckt werden. Nach ausgiebigen Formatierungsarbeiten und der Nutzung des Titelmotivs sahen die Seiten nun so aus:

Ich erzeugte eine PDF-Datei (inklusive Schnittmarken) und zusammen mit den MP3-Dateien hatte ich Alles für mein geplantes „CD-Album-Set“ beisammen. Jetzt musste ich nur noch alle Elemente im Internet zum Download platzieren. Dabei musste ich aber beachten, dass ich die Dateien dort platzierte, wo sie mir keinerlei Kosten verursachen können – selbst, wenn sie millionenfach heruntergeladen würden.

Soundcloud

Alle 10 Tracks speicherte ich auf der Musikplattform Soundcloud. Dort kann man sich alle Tracks anhören und sie sich bei Bedarf herunterladen! Hier ist der Link zur Playlist mit allen 10 Tracks zum freien Download: LINK

Alles komplett!

Wer sich den Spaß erlauben (und sich die Mühe machen) möchte, einen physischen Musikträger zu erstellen (wer hat noch einen CD-Brenner?): hier habe ich die PDF des zugehörigen Heftchens abgelegt: LINK zu PDF

Learnings

Ich hoffe, dieser Beitrag hat Euch Spaß gemacht. Mehr sollte er auch nicht. Bitte nicht zu ernst nehmen! Schreibt mir gern einen Kommentar!

Ich hatte jedenfalls bei der Erstellung des Albums viel Spaß und habe wieder sehr viel gelernt – in vielerlei Hinsicht. Auch, dass Software immer besser Musik erstellen kann, die immer mehr „menschengemacht“ klingt. Aber vielleicht liegt das auch daran, dass moderne Musik immer weniger nach Mensch klingt …


Wer meine wenigen, unregelmäßig erscheinenden Beiträge nicht verpassen möchte, trägt einfach seine E-Mail-Adresse ein und klickt auf die Fläche »Abonnieren«:

Kommentar:

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.