Mit Custom GPTs: Bekannte Sehenswürdigkeiten mal ganz anders darstellen

GPTs sind individuell konfigurierbare Bots von OpenAI, die auf dem Large Language Model GPT-4o und auf der Bilder-KI DALL-E basieren. Solche Bots können also Text und auch ausschließlich Images generieren, falls dies thematisch passend erscheint, wie zum Beispiel im künstlerischen Bereich oder im Rahmen der Darstellung von Sehenswürdigkeiten. Übrigens, GPTs stehen nun auch Usern ohne ChatGPT-Abo zur Verfügung.

Hier geht es direkt zum GPT Popular sights in technical drawing

Opernhaus Sydney
Eiffelturm in Paris

GPT erstellen, einstellen und publizieren

Bevor es an den Output geht, muss erst mal der Custom Bot erstellt werden. Dazu geht Ihr auf folgende Webseite https://chatgpt.com/gpts, die Euch in den GPT Store führt und klickt im Anschluss rechts oben (Desktop-Version) auf den Button Erstellen. Dann seht Ihr diese leere Maske, die nun mit Inhalt gefüllt werden möchte. Oben Konfigurieren auswählen, kurz den Titel und die Beschreibung Eures Bots setzen und im Anschluss die wesentlichen Funktionen in das Feld Hinweise eingeben. Dies sind die sogenannten Instructions mit denen der GPT dann gesteuert wird. 

Nun wird der GPT mit Informationen gefüllt

Genau im Detail möchte ich in diesem Beitrag nicht erklären, wie der GPT mit all seinen Feinheiten einzustellen ist, wie etwa einem GPT-Logo via Upload-Funktion oder die Auswahl der Sichtbarkeit, also privat oder öffentlich. Gerne ein wenig in den Settings umschauen. Wichtig ist, dass der Haken über “Konfigurieren” über Funktionen bei DALL-E3 gesetzt ist, aber dies ist er standardmäßig und dies bitte auch nicht ändern, sonst werden keine Bilder ausgegeben 😉

gpt sights
Einstellungen des GPTs im Überblick

In der oberen Abbildung ist der GPT Popular sights in technical drawing nun mit ordentlich Inhalt gefüllt. Da es sich hierbei um einen Bilder-GPT auf der Grundlage von DALL-E3 handeln soll, ist natürlich das wichtigste Feature überhaupt die Ausgabe eines Images, sonst wäre der Bot wohl maximal fehlerhaft. Folgenden Abschnitt habe ich direkt zu Beginn in die Anweisung (Hinweise) eingetragen, um auch wirklich ganz sicherzugehen, dass nach einem User-Prompt auch stets ein Bild mit einer Sehenswürdigkeit generiert wird.

Wichtig: Es wird immer nach einem Prompt ein Bild generiert, bevor der text ausgegeben wird! Reihenfolge des Ouputs dieses GPTs: immer zuerst 1) dann 2) dann 3) dann 4). Achte auf die Vollständigkeit dieser Reihenfolge.

Zu Beginn hatte ich solche Bilder-GPTs anders konzipiert, nämlich mit einem Text ganz am Anfang und erst am Ende mit der Bildgenerierung. Dies hatte den Charme, dass Nutzer sich thematisch einlesen können, währenddessen in dieser Zeit ein Bild erstellt wird. Leider vergisst der GPT gelegentlich einfach seinen Auftrag und gibt gar keine Abbildung aus, sondern nur Text. Ganz schlecht! Um auf Nummer sicher zu gehen, wird im Rahmen der obigen Instructions immer ganz am Anfang direkt ein Image erstellt. Dies hat bislang sehr gut geklappt und daher würde ich dieses Vorgehen auch so empfehlen. 

Ein Tipp: Achtet auf eine Struktur Eurer Absätze und gebt diesen Bezeichnungen wie 1) 2) 3) oder a) b) c) sodass Ihr diese jederzeit darüber ansprechen könnt, ohne viel im Absatz ändern zu müssen. Ändert Ihr zu viel im Text, kann es sein, dass der Custom Bot dann etwas anders läuft. Im Worst Case gibt es auch eine Möglichkeit, oben im Menü über die “drei Punkte” und “Versionsverlauf” den GPT vor z.B. 2 Stunden im Rahmen eines Backups wiederherzustellen. Leider sind die Backups recht kurz, also die Einstellungen vor 2 Tagen werden nicht wieder ausgegeben, wie dies etwa bei Webseiten (Hoster) der Fall ist. 

reichstag
Ganz bequem geht es mit “next” weiter

Einfache Handhabung steht im Vordergrund: Mit “Next” geht es weiter

Generell ist dieser GPT so konzipiert, dass es besonders einfach zu händeln ist, also ganz egal, ob jemand Erfahrungen im Umgang mit solchen KI-Anwendungen gesammelt hat oder eben nicht. Zu Beginn stehen die 4 Starter-Question, um mit nur einem Button-Klick etwa den Eiffelturm generieren zu lassen. Auch eine Text-Eingabe wie Brandenburger Tor reicht völlig aus, um ein Image zu erstellen. Wurde das erste Bild ausgegeben, geht es mit “next” weiter (siehe Abb.), um dann eine weitere bekannte Sehenswürdigkeit darzustellen. Mit “again” wird diese noch einmal erzeugt und mit “back” geht es zurück zur Vorigen. Mehr ist das nicht. Die Navigation würde ich recht simpel halten. Ich persönlich nutze aktuell den “Sightseeing-GPT” ausschließlich mit den Bezeichnungen “los” und “next”, um vor allem die Zuverlässigkeit und natürlich den Output zu kontrollieren. Macht Euch das wirklich so einfach wie möglich und zwar direkt zu Beginn! Das spart sehr viel Zeit.

sights
Mit Texteingabe “next” Bild, Prompt und Erklärung erzeuigt

Generiert werden neben Bild, auch ein Prompt zum Image, den User nun per Copy & Paste für die Bilder-KI DALL-E oder andere Bildgeneratoren verwenden können. Zudem wird ein erklärender Text in maximal 3 Sätzen angezeigt. Ja, das geht alles weitaus komplexer, mit mehr Text, Aufzählungszeichen und externen Verlinkungen, aber die muss auch alles zuverlässig ausgegeben werden. Weniger ist an dieser Stelle meiner Meinung nach einfach mehr. Übrigens, falls Ihr mit dem GPT kommuniziert, um Euch z.B. eine Sehendwürdigkeit näher zu erläutern, dann läuft dies über das neue Top-Sprachmodell GPT-4o, auch “omni” genannt.

Die Stilrichtung macht es: “Glühende Schnittzeichungen” als individueller Style

Da die Bilder-Outputs Eure User begeistern sollen, sind natürlich die Einstellungen dazu wichtig, insbesondere die verwendete Stilrichtung macht häufig den Unterschied. Der Sightseeing-GPT wurde ganz bewusst in der technischen Stilrichtung “Sectional Drawing” gehalten, die vor allem Architekten ein Begriff ist, um z.B. das Innere von Gebäuden auf eine bestimmte Art und Weise zu visualisieren. Um diese Abbildungen zu betonen, können z.B. “Verstärker” wie etwa “Glowing” hinzugefügt werden, wodurch Farbtöne dann einem glühenden Licht erscheinen und das Bild so insgesamt ansprechender bzw. spektakulärer erscheint. Auch Wörter wie “Luminous” oder “Transparent” eignen sich dafür je nach Themenbereich sehr gut. Dieser GPT generiert Bilder ausschließlich in der Stilrichtung “Glwoing Sectional Drawing”. Es gibt wirklich sehr (sehr) viele Möglichkeiten, individuelle Styles einzustellen. Auch das “Kreuzen” von alten und modernen Stilrichtungen ist machbar.

watercolor
GPT duplizieren und fix anpassen

GPT duplizieren und zeiteffizient hinsichtlich Stilrichtung anpassen

Habt Ihr erst mal einen Bilder-GPT auf der Grundlage von DALL-E3 erstellt, so lassen sich nun sehr zeiteffizient weitere auf dieser Basis über die Funktion Duplizieren (GPT-Duplikat) über die drei Punkte oben in der Navigation erstellen. Im folgenden Beispiel wurde der Sightseeing-GPT dupliziert und die Bezeichnung “Glowing Sectional Drawing” mit dem Wort “Aquarell” ausgetauscht. Und schon habt Ihr einen neuen GPT, der nun Sehenswürdigkeiten im Aquarell-Stil (watercolor) ausgibt. Alle anderen Funktionen bleiben gleich. Das geht sehr schnell!

Kolosseum in Rom
Louvre in Paris

Passt im Anschluss den Titel und die Beschreibung an und setzt noch ein passendes GPT-Logo, das über den Reiter “Konfigurieren” hochgeladen werden kann. Dieser GPT muss dann noch veröffentlicht werden, damit dieser langfristig im GPT Store in der Suche auftaucht.

Hier geht es zum GPT Popular sights in watercolor

Zusätzlich eignen sich Duplikationen von GPTs als Sicherheitskopie, wie dies auch direkt bei einem Duplikat im Titel angegeben wird. Macht Ihr wichtige Einstellungen und seid nicht sicher, wie gravierend die Auswirkungen seien könnten, dann macht eine Sicherheitskopie des GPTs und ändert erst mal im Duplikat die Settings und testet diese für eine Weile. Erst dann übernehmt Ihr diese 1:1 für den “richtigen” Custom Bot. So lassen sich schwerwiegende Fehler vermeiden.

Brandenburger Tor
Hamburger Hafen

Schlussendlich gibt es unglaublich viele Möglichkeiten, um GPTs sinnvoll einzusetzen, ganz egal für welche Themenbereiche. Achtet auf einen schicken Stil und einfache Anweisungen, damit ihr den Custom Bot auch jederzeit problemlos anpassen könnt, ohne dass wesentliche Settings umgestellt werden. Die Einfachheit macht es mal wieder 😉

Video erstellt mit Krea.ai über “Keyframes”

Hier geht es zum Blogbeitrag über Krea.ai

Ein Beitrag von

Ähnliche Beiträge