Ordentliche GPT 5.1-Prüfung: Was sich durch das Modell-Update ändert
Shownotes
t3n MeisterPrompter als Newsletter abonnieren: https://t3n.de/info/t3n-newsletter/
Die Folge zur Event-Planung: https://t3n-meisterprompter.podigee.io/40-event-planung-prompt-vorlage
Sonderepisode zu Google Gemini 3 Pro: https://t3n-meisterprompter.podigee.io/45-gemini-3-pro-test-ki
Schreib uns gern, welche Prompts wir aus deiner Sicht behandeln sollen. Entweder per E-Mail an meisterprompter@t3n.de oder via Instagram. Renate findest du unter @renate.gpt, Stella schreibst du über @t3n_magazin.
Hinweis: Dieser Podcast wird von einem Sponsor unterstützt. Alle Infos zu unseren Werbepartnern findest du hier.
Transkript anzeigen
Renate: Herzlich Willkommen zu t3n MeisterPrompter, dem Podcast,
Renate: der deine Prompts auf Hochglanz poliert.
Werbung: Diese Folge wird unterstützt von Zoho. Zoho hilft dir, Prozesse zu automatisieren,
Werbung: Kundenbeziehungen zu managen und dein Business digital zu organisieren.
Werbung: Alles auf einer Plattform.
Renate: Und ich sitze hier mit Stella von t3n und
Stella: Ich sitze hier mit Renate, unserer Prompt-Expertin von Renate.gpt.
Renate: Hör mal. So, also heute haben wir ja ein ganz besonderes, ich würde ja sagen
Renate: aktuelles Thema mitgebracht.
Renate: Es ist nicht das hochaktuellste Thema, denn es ist eher ein aktuelles auf Herz
Renate: und Nieren geprüftes Thema, was viel wichtiger ist.
Stella: Genau. Und zwar ist ja Ende November GPT 5.1 veröffentlicht worden.
Stella: Und damals haben wir euch ja auch hier im Podcast gesagt, hey,
Stella: wir gucken uns das an und wir melden uns dann nochmal.
Stella: Und das machen wir heute. Heute gibt es nämlich den Erfahrungsbericht zum Thema
Stella: GPT 5.1. Was hat sich verändert?
Stella: Wo muss man vielleicht auch ein bisschen anders prompten? Spoiler,
Stella: man muss nämlich ein bisschen anders prompten.
Stella: Was funktioniert für uns gut? Was funktioniert nicht gut? Das erfahrt ihr alles in dieser Folge.
Renate: Genau. Wenn so ein neues Modell rauskommt, das ist immer so ein bisschen wie
Renate: Weihnachten. Man probiert so viel rum und guckt so, was hat sich geändert?
Renate: Funktioniert alles noch? Gibt irgendwie neue Features? Und in dem Zuge,
Renate: das hat mit dem Modell tatsächlich gar nicht so viel zu tun,
Renate: aber in dem Zuge kamen ja auch noch neue Funktionen, die auch neue Möglichkeiten mit sich bringen.
Renate: Auch darauf gehen wir natürlich heute ein. Womit wollen wir starten?
Stella: Ich würde doch sagen, vielleicht wir arbeiten uns hoch. Fangen wir erst mal
Stella: so an. Ich hatte jüngst eine Unterhaltung mit GPT 5.1 oder genauer gesagt Chat-GPT.
Stella: Man muss dazu sagen, ich habe auch so einen Account, da ist jetzt kein Abo drauf oder so.
Stella: Das war einfach so mein Testspiel-Rum-Account und mit dem habe ich das gemacht
Stella: und habe einfach mal gefragt.
Stella: Es war ein umfangreicher Prompt, haltet euch fest. Hallo, funktionierst du schon
Stella: mit GPT 5.1? Und ich habe, glaube ich, eine Identitätskrise ausgelöst.
Stella: Und zwar kam die Antwort, ja, ich laufe nicht mit GPT 5.1.
Stella: Und dann war ich kurz irritiert, weil ich dachte, okay, bei kostenlosen Accounts,
Stella: OpenAI schrieb ja auch dazu, dauert der Wallout vielleicht ein bisschen länger.
Stella: Aber ich habe das getestet, als GPT 5.1 schon über eine Woche online war. Und man sieht ja auch.
Renate: Dass da oben 5.1 steht.
Stella: Also deswegen, tatsächlich, nee, du siehst es hier im Gratis-Account,
Stella: siehst du es nicht. Da siehst du einfach nur, da steht einfach nur Chat-GPT.
Renate: Ach so, ja stimmt, dann nutzt es auch.
Stella: Und ich kann auch gar keine irgendwie, nichts auswählen. Weil pro Account kannst
Stella: du ja immer die Modelle auswählen, übrigens auch noch das vorherige.
Stella: Aber ich habe dann nochmal nachgefragt und dass ich eben nur wissen wollte,
Stella: welches Modell denn jetzt eigentlich verwendet wird.
Stella: Und da kam dann als Antwort, ich antworte dir mit GPT 5.1.
Renate: Vielleicht wolltest du einfach sagen, es läuft nicht mit GPT 5.1,
Renate: weil es kann ja nicht laufen.
Stella: Vielleicht war es das, das kann alles sein, aber auf jeden Fall das so als deine Anekdote.
Stella: Aber vielleicht ist es da auch ein Hinweis, weil das stimmt ja,
Stella: mein Prompt war ja nicht eindeutig in meiner Wortwahl, sondern eher ein bisschen salopp formuliert.
Stella: Und es soll ja so sein, und ich glaube, das deckt sich auch so mit den Erfahrungen,
Stella: die du jetzt gemacht hast, dass man umso konkreter und präziser formulieren
Stella: muss. dann ist auch das Ergebnis besser.
Stella: Aber wenn man eben so wie ich da einfach quasi so im Suchmaschinen-Frestyle
Stella: irgendeine Frage reinkippt, macht es nicht besser.
Renate: Also man muss ja auch wirklich sagen, wir sind ja vielleicht gerade an dem Stand,
Renate: wo man noch nicht mal grundsätzlich sagen kann, dass so die Prompt-Strukturen klar sind für alle.
Renate: Also da sind wir ja noch nicht eigentlich. Ich denke mal, ihr als Meisterprompter-Hörer
Renate: seid natürlich Meisterprompter.
Renate: Von daher ist euch die Struktur wahrscheinlich schon bewusst.
Renate: Aber jetzt mit jedem neuen Modell eine neue Promptstruktur mitzubekommen oder
Renate: zu gucken, hey, was muss ich denn jetzt beachten?
Renate: Also ich liebe das, aber das ist, also das kann man jetzt nicht von jedem Nutzer erwarten.
Renate: Aber ChatGPT OpenAI hat wirklich halt so ein neues Nutzerhandbuch,
Renate: mehr oder weniger Cookbook heißt das tatsächlich, GPT-5.1-Cookbook,
Renate: also wo halt nochmal erklärt wird, wie muss ich denn jetzt in GPT-5.1 prompten?
Renate: Wo ich so denke, wer hat denn die Zeit, sich das durchzulesen, wenn das nicht der
Renate: prädestinierte Job.
Stella: Spoiler, Renate hat es durchgelesen.
Renate: Natürlich.
Stella: Und hat es sich genau angeguckt. Und was steht denn drin, was wichtig ist quasi
Stella: für den normalen Nutzer, der jetzt nicht hardcore, der irgendwie auch kein Developer ist, etc.
Renate: Genau, also es gibt ein paar Sachen, also ich war selber überrascht,
Renate: von der Vielzahl von Sachen, die man jetzt nochmal neu beachten kann oder sollte.
Renate: Und zwar geht es sparsamer mit Tokens um.
Renate: Das heißt, die Antworten sind generell ein bisschen kürzer.
Renate: Also es kann kürzer sein und das kann auch natürlich dazu führen, dass da Infos fehlen.
Renate: Also, dass da quasi allgemein so ein bisschen was abhanden kommt.
Renate: Aber auch da willst du was sagen?
Stella: Der Hintergrund dazu, OpenAI hat eben auch gesagt, dass es so sein soll,
Stella: dass einfachere Anfragen kürzer beantwortet werden, sprich auch schneller beantwortet.
Stella: Das passt eben zu diesem ganzen Token-Thema.
Stella: Während eben komplexere Anfragen umso ausführlicher und passnah beantwortet werden sollen.
Renate: Und wenn euch vollständig wichtig ist, dann ist es halt hier wieder wichtig
Renate: zu sagen, hey, also das fand ich ganz spannend.
Renate: Du kannst einfach sagen, Vollständigkeit ist wichtiger als Kürze.
Renate: Also je nachdem, was du möchtest.
Renate: Also wir sehen hier schon bei der ersten Sache, es ist extremst wichtig, was wir prompten.
Renate: Also unsere Wortwahl, was genau wir uns wünschen, das zum Beispiel Nennen natürlich
Renate: ein kürzeres Ergebnis nach sich zieht als Beschreibe.
Renate: All das wird jetzt immer wichtiger. Wir haben auch noch mal allgemein diese
Renate: Hyperempfindlichkeit auf Ton und Stil.
Renate: Also es reagiert extremst darauf, welchen Ton und Stil es haben soll, wenn man es eben sagt.
Renate: Also ist klar, wenn ihr nichts sagt, dann kann das nichts damit anfangen und
Renate: klingt halt generischer.
Renate: Und wenn ihr was sagt, dann liefert es aber auch genau das. Auch da gibt es
Renate: manchmal, kommt es manchmal zu so Unstimmigkeiten, würde ich mal sagen,
Renate: weil man sagt, hey, bitte klinge freundlich.
Renate: Aber Leute, freundlich klingt halt auch, da brauchst du ja nur den Landkreis
Renate: wechseln, da klingt freundlich schon anders. Da muss man ein bisschen detaillierter
Renate: werden, je nachdem, was ihr halt möchtet oder eben mit Beispielen arbeiten und auch die Längenregeln.
Renate: Also das passt ja zu dem ersten, dass halt, wenn ich etwas Ausführliches haben
Renate: möchte oder eben was Kurzes in sechs Sätzen, sagt das einfach ganz genau dazu,
Renate: was ihr für eine Längenregel haben möchtet.
Stella: Ja, also vielleicht nochmal kommen wir so ein bisschen auch zu dem,
Stella: was haben wir denn damit getestet?
Stella: Ich habe zum Beispiel, wir haben in einer der vorherigen Folgen euch ja so einen
Stella: Prompt gegeben für Weihnachtseventplanung und den habe ich mir nochmal geschnappt
Stella: und habe den quasi jetzt nochmal neu reingeschüttet und da muss ich sagen,
Stella: eine Sache ist mir direkt aufgefallen, der sah ganz anders aus,
Stella: du hast es ja auch gesehen, der Output, der da generiert worden ist,
Stella: der war eindeutig smiley ärmer, also er war, fand ich, ein bisschen professioneller,
Stella: nüchterner, formuliert, nicht mehr ganz so.
Stella: Das wollte ich gerade sagen freundlich, aber das ist natürlich unkonkret.
Stella: Nicht mehr ganz so kumpelhaft vielleicht.
Stella: Gleichzeitig waren aber tatsächlich die Vorschläge vielfältiger und konkreter.
Stella: Das ist mir definitiv aufgefallen. Sie haben noch mehr Sinn ergeben und es war
Stella: nicht mehr so ein bisschen, wir hatten ja auch damals über unser Weihnachtsdorf
Stella: da gesponnen. Also es hat deutlich besser gepasst und ich habe an dem Prompt nichts geändert.
Stella: Also es ist exakt dasselbe. Klar, man kann auch Ergebnisse nicht immer replizieren
Stella: in dem Sinne, so wie wir jetzt KI hier gerade nutzen.
Stella: Deswegen, das muss man dazu sagen, aber man hat schon einfach bei dem Ergebnis
Stella: gesehen, dass es einfach irgendwie strukturierter ist.
Renate: Jetzt kommt aber eine wichtige Sache, nämlich mit dem Update auf 5.1 kamen auch
Renate: neue Persönlichkeiten.
Renate: Davor waren das, glaube ich, vier und jetzt sind es sechs und auch davor.
Renate: Deswegen, ich habe wirklich gerade Dispute mit Chachipiti auf einer neuen Ebene.
Renate: Oder werde anders herausgefordert, wie auch immer man es nimmt.
Renate: Es gibt jetzt halt sowas wie Standard, naja, kennen wir, ne?
Renate: Professionell, freundlich, aufrichtig, skurril, fand ich auch interessant,
Renate: skurril, hat auch wirklich wilde Kommentare dann abgegeben, aber wüsste ich
Renate: jetzt nicht, warum, also weiß ich nicht, das war jetzt mir nicht klar, warum ich das möchte.
Renate: Effizient. Ich glaube, das ist ein gutes Ding.
Renate: Roboter mochte ich zum Beispiel davor als Persönlichkeit. Und ich glaube,
Renate: das ist so das Pendant zu Roboter.
Stella: Schönes Zitat. Roboter mochte ich davor als Persönlichkeit.
Renate: Ja, ich weiß auch nicht, warum. Wahrscheinlich haben sie es deswegen umgenannt,
Renate: weil Roboter einfach roboterhaft klingt. Aber so war es gar nicht.
Renate: Es war einfach eine effiziente Persönlichkeit.
Renate: Nerdig hat es noch und zynisch.
Stella: Du warst doch eigentlich mal Zyniker-Fan auch in Teilen, gerade für Feedback.
Renate: Es gab nämlich davor, was gab es auch den Zyniker? Und das war echt,
Renate: das war super schwach. Das war gar nicht zynisch.
Renate: Das war halt, vielleicht kam ab und zu mein Kommentar.
Renate: Jetzt mit der Persönlichkeit zynisch.
Renate: Chachibiti macht mich fertig. Das nimmt erstmal jeden Prompt hoch und sagt,
Renate: wie dumm dieser Prompt eigentlich ist.
Renate: Oder gibt es so Widerwillen von wegen, ja, jetzt muss ich erstmal all deine
Renate: Rechtschreibfehler ausbügeln. Und sowas fliegt mir jetzt hier um die Ohren.
Renate: Aber ich habe es seitdem auch eingestellt. Irgendwie mag ich es dann doch. Ich weiß es auch.
Stella: Jetzt frage ich mir natürlich, okay, wofür ist denn genau der Zyniker eigentlich gedacht?
Renate: Ich dachte so, vielleicht kommen wir irgendwann dahin. Kennst du dieses Sprichwort,
Renate: dieses Zeig mir deine Freundin und ich sage dir, wer du bist?
Renate: Und jetzt ist es so, zeig mir deine Chachepetit-Persönlichkeit und ich sage
Renate: dir, wer du bist. Und dann weiß ich nicht, was mein Zyniker-Chachepetit über mich aussah.
Renate: Aber ja, ich finde es erfrischend. Das ist, das Lächeln, komm,
Renate: ich muss da einfach mit mal lächeln.
Stella: Und hast du denn jetzt so eine Persönlichkeit quasi, die du so für alltägliche
Stella: Aufgaben besonders häufig nimmst, der Zyniker offensichtlich nicht.
Renate: Ich habe wirklich den Zyniker immer eingestellt. Ich finde es lustig.
Renate: Weil die Ergebnisse sind ja trotzdem, also die Ergebnisse kriegst du ja trotzdem.
Renate: Es ist nur dieses Hin und Her, dieses Wording davor, dieses Geplänkel.
Renate: Das ist halt so dieses Zynische.
Renate: Ich finde es lustig.
Stella: Also, wenn ihr das abkönnt, dann könnt ihr gerne den Zyniker nutzen.
Renate: Aber ich glaube, effizient ist gut.
Stella: Effizient ist gut. Ich muss sagen, ich habe nachgeguckt und bei mir ist es tatsächlich
Stella: stinknormal standard eingestellt.
Stella: Also, in meinem kostenlosen Plan habe ich einfach Standard genutzt.
Renate: Ja, also ich glaube, das ist auch das normale Ding. Da kannst du jetzt nichts falsch machen.
Stella: Genauso ist es halt auch. Also, ehrlich gesagt, ich weiß, wir haben auch schon
Stella: mal in vorherigen Folgen das auch mal ausprobiert.
Stella: Aber trotzdem mit dem Standard bisher, ich habe jetzt nicht irgendwie den Eindruck,
Stella: dass das so gar nicht funktioniert aber ich werde auch mal den Zynika testen
Stella: ausgiebig und an dich denken und auch fragen,
Stella: ob ich dann richtig hartes Feedback bekomme, aber insgesamt also was mir auf
Stella: jeden Fall aufgefallen ist so noch konkreter die Anfragen stellen beim Prompting
Stella: und auch dieses Thema mit zu viel Kontext geben nach dem Motto,
Stella: wer den Chatbot zulabert und denkt, das ist jetzt alles relevant,
Stella: Ich kann es jetzt nicht verifizieren im Sinne von, ich habe jetzt hier eine
Stella: Studie und die zeigt das genau, aber so wie ich eben jetzt das Ganze ausprobiert habe, merkt man schon,
Stella: du musst umso mehr darauf achten, dass du präzise bist und die Informationen
Stella: lieferst, die relevant sind, was für dich als Nutzer bedeutet,
Stella: dass du im Vorfeld dir noch klarer darüber werden willst, wie soll der Output
Stella: aussehen, den ich haben will und was muss ich dafür reingeben.
Stella: Also ich finde dieses nach dem Motto, ich haue da einfach munter irgendwas rein
Stella: und dann beschwere ich mich hinten, was rauskommt, das wird jetzt noch mehr abgestraft.
Renate: Ja, und ich glaube auch, weil es fragen mich auch sehr regelmäßig so Leute,
Renate: hey, denkst du, Prompt ist jetzt irgendwann nicht mehr so wichtig,
Renate: weil die Modelle wären ja besser.
Renate: Es wird immer wichtiger eigentlich. Also das ist eher die Sache.
Stella: Mir fällt dabei gerade ein, wir werden auch mal gefragt, kann ich denn nicht
Stella: einfach meine Prompts mit KI erstellen? Da müssen wir dringend auch mal eine Folge zu machen.
Stella: Spoiler, natürlich könnt ihr Prompts mit KI erstellen. Die Frage ist halt nur,
Stella: ob das, was ihr dann mit dem Prompt rausbekommt, wirklich so ist, wie ihr es haben wollt.
Stella: Ehrlich gesagt nicht. Auch da muss man nachoptimieren. Aber dazu kommen wir
Stella: vielleicht mal in einer anderen Folge.
Renate: Eine Sache habe ich noch.
Stella: Die wollte ich dir jetzt auch nicht nehmen. Ich wollte nämlich sagen,
Stella: die letzte Sache, die wir vielleicht noch sagen wollen würden,
Stella: ist das, was Renate euch jetzt verrät.
Renate: Eine Sache hat sich ja wirklich auch noch grundlegend geändert.
Renate: Falls es euch nämlich mit ChatGPT alleine irgendwie...
Renate: Langweilig geworden ist oder ihr denkt, Junge, zu zweit, das ist ja,
Renate: das ist nichts mehr. Ich brauche da mehr Leute.
Renate: Könnt ihr jetzt Gruppenchats in Chatschipiti machen? Auch das kam quasi mit
Renate: dem Update-Zeitgleich.
Renate: Auch da könnten wir vielleicht mal eine Extra-Folge machen nach eingehiger Testung,
Renate: denn das kam erst so letzte Woche, glaube ich.
Renate: Und ich habe noch immer nicht den, also ich komme schon, wenn ich es mir herleite,
Renate: da drauf, wo das Sinn macht.
Renate: Und mir haben auch Leute schon gesagt, im Projektmanagement beispielsweise,
Renate: ist das schon cool, wenn man Leute da mit reinziehen kann. Für mich persönlich
Renate: Aha, weiß ich nicht. Fällt dir direkt was ein, was du im Gruppenchat mit Chat-Spielte
Renate: besprechen wollen würdest?
Stella: Tatsächlich bisher nicht. Also ich habe es auch aus dem Grund noch nicht getestet,
Stella: weil ich auch davor saß und dachte, ja, was mache ich denn jetzt Sinnvolles
Stella: damit, was auch nicht komplett gestaged ist?
Renate: Ja, ich glaube halt wirklich im Projektarbeit quasi oder zum Beispiel Brainstorming,
Renate: wenn man halt, wenn ein Team und dann nutzt man es einfach wie halt Slack vielleicht,
Renate: wo man sonst auch brainstormen würde.
Renate: Mir hatte auch in der Community, hat mir jemand auf, da habe ich auch gesagt,
Renate: dass es jetzt diese Gruppenschein sind, hat mir jemand kommentiert und meinte,
Renate: er könnte jetzt mit seiner Frau quasi in Chachibiti Diskussionen abhalten und
Renate: Chachibiti könnte immer noch treiben.
Stella: Okay, okay. Alles klar.
Renate: Nein, gut.
Stella: Ob man das so machen sollte?
Renate: Es war natürlich auch nur ein Spaß.
Stella: Das wissen wir nicht.
Renate: Aber die Vorstellung ist lustig, dass Tatschmiti quasi immer daneben sitzt und
Renate: sagt, das ist ein guter Punkt.
Stella: Auch immer dann für beide Seiten. Ja, ich fragte, wie das laufen würde.
Stella: Das ist ja dieses grundlegende KI-Problem, dass KI immer gerne genutzt werden möchte.
Stella: Und dass es dann vielleicht für beide so ist, dass sie immer Zuspruch bekommen.
Stella: Und hinterher beide auf den Bot draufgehen. Okay, gut. Bevor wir abdriften.
Renate: Das wollte ich noch gesagt haben.
Stella: Also, ihr haltet auf jeden Fall fest. Es ist wichtig, um so klarer zu prompten,
Stella: um eben gut mit GPT 5.1 arbeiten zu können.
Stella: Und insgesamt, bei mir war es ein bisschen Smiley-ärmer. Vielleicht kommuniziere
Stella: ich, ich schreibe da nicht mehr Smilies rein.
Renate: Vielleicht liegt es an deiner Persönlichkeit, die du eingestellt hast.
Stella: Vielleicht liegt es daran an. Aber ich würde sagen, schaltet doch am besten
Stella: nächste Woche wieder ein. Da haben wir nämlich wieder einen Hack für euch.
Stella: Und zwar wollen wir uns da mal angucken.
Stella: Ich weiß nicht, vielleicht kennt ihr das auch. Manchmal haut KI immer wieder
Stella: dieselben Begriffe rein und man fragt sich, warum tust du das?
Stella: Und wie man das verhindert, das erfahrt ihr in den nächsten Wochen.
Stella: Und bis dahin, vergesst natürlich nicht, unseren Newsletter zu abonnieren.
Stella: Die Infos gibt es in den Shownotes.
Stella: Und ich würde sagen, abonniert uns natürlich auch als Podcast,
Stella: damit ihr keine Folge verpasst.
Renate: Ganz wichtig.
Stella: Und dann, ja,
Renate und Stella: drei, zwei, eins, bleib sauber.
Neuer Kommentar