Wow – was für eine Woche… 12 Days of OpenAI
Die Ereignisse im KI-Universum überschlagen sich fast. Ich konzentriere mich in meinem heutigen Blog-Beitrag auf die Ankündigungen, die auch sofort verfügbar sind.
12 Tage (Werktage) voll mit neuen Funktionen und Modellen waren von OpenAI im Dezember angekündigt,
und die ersten 7 haben sich bereits gelohnt:
Day 1 – ChatGPT o1 und der 200$ Account
Das angekündigte Modell ist seit heute verfügbar. Für ausgewählte Benutzer konnte man die Preview schon testen, doch seit heute ist es allgemein verfügbar.
o1 wurde entwickelt, um komplexe Probleme durch längeres Nachdenken zu lösen.
Die Auswirkungen auf mathematische oder wissenschaftliche Bereiche sind immens.
Ich habe in meinem Umfeld verschiedene Personen im Bereich PhD / Universität / Forschung das Modell o1 antesten lassen und die Reaktionen waren krass. Kein Vergleich zu den vorhergehenden Modellen und wirklich brauchbar. Das ersetzt Dir schon fast einen wissenschaftlichen Mitarbeiter.
Auch im Bereich Code-Gerneirung und Debugging wurden immense Verbesserungen angekündigt.
Mangels Zugang zu geeigneten Testkandidaten kann ich mir darüber aber kein Urteil erlauben. Hast Du ein Feedback für mich?
ChatGPT PRO Account
OpenAI hat auch einen neuen PRO-Account vorgestellt. Für 200$ im Monat kannst du alle Funktionen von ChatGPT ohne Einschränkungen und im höchsten Leistungsmodus nutzen. Das verkürzt die Rechenzeit und ermöglicht dir mehr Abfragen (und wie sich später herausgestellt hat, auch mehr SORA Nutzung pro Monat).
Was für ein Aufschrei durch die Social Medien ging, ChatGPT kostet jetzt 200$.
Wer lesen und zuhören konnte, hat auch begriffen, dass das ein neuer, leistungsfähiger Modus ist und der bisherige PLUS Account davon nicht betroffen ist. Aber hey, erst mal laut rausschreien! 😀 😀 😀
Day 2 – Reinforcement Fine-Tuning (RFT)
Bei dem Thema bin ich ja fast schon raus, da wird es technisch, aber ich versuche Euch trotzdem abzuholen. Falls das nicht Dein Ding ist, spring einfach weiter auf Day 3, da wird es für alle wieder mega spannend 😀
Reinforcement Fine-Tuning (RFT) ist ein innovativer Ansatz, der den Aufwand für das Tunen eines Modells erheblich reduziert.
Beim klassischen Fine-Tuning wird ein Modell mit neuen, spezifischen Daten weitertrainiert, um eine bestimmte Aufgabe besser erledigen zu können. Ein allgemeines Modell wird dabei durch gezielte Trainingsdaten optimiert, um in einem spezifischen Anwendungsfall bessere Ergebnisse zu erzielen. Beispielsweise kann ein Modell mit juristischen Informationen trainiert werden, um einer Anwaltskanzlei präzisere Antworten zu liefern.
Fine-Tuning: Lernen durch Nachahmung
Reinforcement Fine-Tuning hingegen verwendet ein Belohnungssystem, um das Modell darauf zu trainieren, bessere Entscheidungen zu treffen oder relevantere Informationen zu liefern. Statt ausschliesslich vorgegebene Beispiele zu imitieren, lernt das Modell durch Feedback: Gute Ergebnisse werden belohnt, wodurch das Modell Schritt für Schritt seine Leistung verbessert.
Reinforcement Fine-Tuning (RFT): Lernen durch Belohnung
Forschende, Unternehmen und Universitäten sind eingeladen, sich für dieses Reinforcement Fine-Tunign Research Programm zu bewerben. Wenn Du also einen speziellen Anwendungsfall hast, wo das Sinn ergibt, warum bewirbst Du Dich nicht? (und lass mich wissen, wie es läuft )
Day 3 – jetzt wird es spannend: SORA
SORA wurde ja bereits zum 1. Geburtstag von ChatGPT (am 30.11.2023) angekündigt. Es hat jetzt fast ein ganzes Jahr gedauert, bis es soweit war: SORA ist ab sofort auf der ganzen Welt verfügbar. Der ganzen Welt? Halt, nein! Ein kleines rebellisches Gebiet, nennen wir es EU (inklusive ihrer schweizerischen Datenschutzverbündeten), widersteht dem Fortschritt und verhindert, das SORA dort eingesetzt wird.
Alle anderen können jetzt mit Hilfe der KI Videos erschaffen, die selbst Miraculix vor Neid erblassen lassen.
Ich habe es – Dank der Möglichkeit, auch in der Türkei arbeiten zu können, ausprobiert und es ist wirklich genial. Ein Textprompt, eine kurze Beschreibung, und in kürzester Zeit wird ein Video in einer Qualität produziert, die mich echt erstaunt. Aber sieh selbst:
Prompt: “a cat in a santa costume, flying like a bird in the Swiss alps”
Und die erweiterten Möglichkeiten mit Storybook und Start- und End-Bild habe ich noch gar nicht ausprobiert. In 10 Tagen kann ich Euch mehr darüber berichten. Stay tuned…
Falls Du ein Video hast, dass du gerne einmal ausprobieren möchtest, und noch keinen Zugang hast, schreib mir einfach eine PN. Die besten 5 Ideen werde ich versuchen umzusetzen und ich werde über meine Erfahrungen im neuen Jahr berichten.
(Maximal 20 Sekunden, kein Bezug zu realen Personen, nur mit Wasserzeichen und natürlich keine Themen wie Nackheit, Sex oder ähnliches)
Day 4 – Canvas
Was zur Hölle ist Canvas? Ich kenne Canvas als Präsentationstool, aber was hat das mit ChatGPT zu tun?
Canvas ist das englische Wort für “Leinwand” und wird oft im Zusammenhang mit Whiteboard-Funktionen verwendet. Und ChatGPTs Canvas ist so etwas wie das digitale Whiteboard, bei dem ChatGPT dir über die Schulter schaut und Dich unterstützt.
Du kannst jetzt live mit ChatGPT brainstormen, zu verschiedenen Stellen im Dokument springen und da weiterarbeiten. Es ist wie ein smarter Co-Pilot (nicht zu verwechseln mit DEM Copilot), der dir hilft, Ideen direkt umzusetzen.
Was mir dabei besonders gefällt? Du siehst deine Gedanken wortwörtlich wachsen. Du kannst Abschnitte eines Textes verschieben, neue hinzufügen, parallel an verschiedenen Stellen weiterarbeiten.
Und besonders cool: Für Entwickler gibt es eine eingebaute Python-Umgebung. Du kannst also Code schreiben, ausführen und in Echtzeit anpassen. Ohne zwischen verschiedenen Tools hin- und herzuspringen. Es ist, als ob du gemeinsam mit ChatGPT deinen Code entwickelst, testest und verbesserst.
Probier es aus, es ist kostenlos für alle verfügbar und für mich, speziell in der Textbearbeitung, ein mega hilfreiches Tool.
Erzähl mir, wenn Du es ausprobiert hast, wie sind Deine Erfahrungen damit?
Day 5 – jetzt wird es wieder MEGA spannend: Apple Intelligence
ChatGPT ist jetzt direkt in Apple Intelligence integriert. Verfügbar auf Mac, iPad und iPhone und bringt gleich 3 Anwendungsszenarien mit:
Siri gibt Anfragen an ChatGPT weiter
Wenn Siri merkt, dass ChatGPT für deine Frage besser geeignet ist, leitet sie die Anfrage automatisch weiter. Das ist wie ein unsichtbarer Spielerwechsel, der dir immer die besten Ergebnisse liefert.
Schreibhilfe
ChatGPT kann voll integriert direkt genutzt werden, um Inhalte zu generieren oder bestehende Texte zu optimieren. Super praktisch für schnelle Notizen oder kreative Eingebungen!
Visual Intelligence mit der Kamera
Hier wird es richtig futuristisch: Halte einfach die Kamera auf ein Objekt und frag ChatGPT, was es ist. Objekte erkennen, Infos abrufen – alles in einem Schritt. Perfekt als Ratgeber für all die kleinen Probleme…
Dazu bringt Apple Intelligence noch einige eigene Funktionen, die ich ausprobiert habe und die super cool sind:
- Freitextsuche in Fotos:einfach Suchtext eintippen und Apple findet tatsächlich in deinen Fotos passende Ergebnisse
- Erinnerungs-Videos: als iPhone User kennst du das bestimmt schon, dir wird ein Video zu einem random Thema angeboten und das fasst dann ein Ereigniss oder spezielle Situationen in einem kurzen Video zusammen. Neu kannst Du diese Erinnerungsvideos auch selbst generieren: ein paar Stichpunkte genügen und AI (Apple Intelligence) generiert dir ein Erinnerungsvideo inklusive musikalischer Untermalung.
- Der Zauberstab! Für deine hangeschriebenen Notizen, einfach ein Scan oder ein Bild von deinen Notizen und AI generiert Dir eine digitale Version davon. Und ich muss sagen, ich war echt geflasht. Wer mich kennt und meine Handschrift, das ist echt ein Challenge und AI hat den “accepted”.
Voraussetzungen für die Nutzung der Apple Intelligence:
- MAC mit M2 Chip oder höher, MAC OS Sequoia 15.2
- iPad Pro mit M1-Chip oder neuer mit iPad OS 17
- iPad Air, 5. Generation M1-2022 oder neuer mit iPad OS 17
- iPd mini: 7. Generation A17 Pro, 2024 mit iPad OS 17
- iPhone 15 Pro / 15 Pro Max oder iPhone 16 mit iOS 18.2
und für alle gilt: Systemsprache Englisch und SIRI Sprache muss der Systemsprache entsprechen. Mit Deutsch funktioniert es nicht.
Day 6 – Advanced Video Mode
Habt ihr den advanced Voice Mode schon ausprobiert? Mit dem advanced Voice Mode kannst Du direkt mit ChatGPT sprechen und Chatty antwortet Dir in natürlicher Sprache. Ohne zu tippen, kannst du einfach eine Unterhaltung mit ihm führen.
Mit dem Advanced Video Mode setzt OpenAI noch einen drauf: du kannst nicht nur mit ChatGPT in natürlicher, gesprochener Sprache interagieren, sondern du kannst jetzt auch noch die Kamera anmachen und ChatGTP nimmt auf, was es sieht und antwortet dir im Kontext dieser Bilder.
Das funktioniert auch mit der Bildschirmfreigabe, super praktisch, wenn Du Dir am Handy etwas erklären lassen willst und nicht zuerst zig Screenshots machen musst.
Insgesamt macht der AVM die Nutzung nochmal intuitiver und einfacher. Probier es mal aus, es gibt hier keine Einschränkungen (Sprache, Länder etc.) und ist mit einigen Einschränkungen sogar kostenlos verfügbar.
Day 7 – Projects
Nervt es dich auch manchmal, dass du deine Chats nicht organisieren kannst und ständig nach zusammengehörigen Inhalten suchen musst?
Mit der neuen Projects-Funktion in ChatGPT hat OpenAI jetzt genau dieses Problem adressiert: Du kannst deine Unterhaltungen und Dateien effizient in Ordnern organisieren und mit Drag & Drop neue Inhalte hinzufügen.
Die wichtigsten Funktionen im Schnelldurchlauf:
- Ordnerbasierte Organisation: Projekte als Ordner anlegen, um deine Arbeit thematisch zu strukturieren.
- Drag & Drop: Chats kannst Du per Drag & Drop in die entsprechenden Projekte verschieben, um den Überblick zu behalten.
- Datei-Upload: Füge Dateien zu deinen Projekten hinzu und nutze sie direkt in ChatGPT.
- Personalisierte Anweisungen: Du kannst pro Projekt individuelle Anweisungen hinterlegen, um die Antworten von ChatGPT auf die spezifischen Anforderungen deines Projekts zu optimieren.
Verfügbarkeit:
Projects wird derzeit für ChatGPT Plus-, Pro- und Teams-Nutzer bereitgestellt. Kostenlose Nutzer sollen die Funktion „so bald wie möglich“ erhalten, während Enterprise- und Edu-Nutzer Anfang des neuen Jahres damit rechnen können.
Hast Du Projects schon ausprobiert? Dein Feedback würde mich wirklich interessieren.
Was ist Dein Highlight aus diseen ersten 7 “Days of OpenAi”?
#askMrD
Folge mir auf LinkedIn