OpenAI präsentiert eine neue Generation von Embedding-Modellen, darunter die Modelle GPT-4 Turbo und Moderation, aktualisierte API-Management-Tools und bald auch eine Preissenkung für GPT-3.5 Turbo.
Die neuen Modelle umfassen:
- Zwei neue Embedding-Modelle
- Ein aktualisiertes GPT-4 Turbo-Preview-Modell
- Ein aktualisiertes GPT-3.5 Turbo-Modell
- Ein aktualisiertes Text-Moderationsmodell
Standardmäßig wird die an die OpenAI-API gesendete Daten nicht für das Training oder die Verbesserung der OpenAI-Modelle verwendet.
Neue Embedding-Modelle mit niedrigeren Preisen
OpenAI führt zwei neue Embedding-Modelle ein: ein kleineres und äußerst effizientes Text-Embedding-3-Small-Modell sowie ein größeres und leistungsstärkeres Text-Embedding-3-Large-Modell.
- Text-Embedding-3-Small:
- Verbesserte Leistung: Im Vergleich zum Vorgängermodell Text-Embedding-Ada-002 steigt die durchschnittliche Punktzahl auf dem Multi-Language Retrieval-Benchmark (MIRACL) von 31,4% auf 44,0%, während die durchschnittliche Punktzahl auf dem Benchmark für englische Aufgaben (MTEB) von 61,0% auf 62,3% steigt.
- Reduzierter Preis: Der Preis für Text-Embedding-3-Small wurde um das 5-fache gegenüber Text-Embedding-Ada-002 gesenkt, von $0,0001 pro 1.000 Tokens auf $0,00002.
- Text-Embedding-3-Large:
- Verbesserte Leistung: Text-Embedding-3-Large ist das neue leistungsstärkste Modell. Auf MIRACL steigt die durchschnittliche Punktzahl von 31,4% auf 54,9%, während auf MTEB die durchschnittliche Punktzahl von 61,0% auf 64,6% steigt.
- Preis: Text-Embedding-3-Large wird zu $0,00013 pro 1.000 Tokens angeboten.
Entwickler haben die Möglichkeit, Embeddings zu kürzen und so eine flexible Nutzung zu ermöglichen. Dies ermöglicht es, Kosten zu sparen, ohne wesentliche Einbußen bei der Leistung zu haben.
Weitere Updates und niedrigere Preise
- Aktualisiertes GPT-3.5 Turbo-Modell und niedrigere Preise:
- In der kommenden Woche wird das neue GPT-3.5 Turbo-Modell, GPT-3.5-Turbo-0125, eingeführt und die Preise um 50% für die Eingabe und 25% für die Ausgabe gesenkt.
- Aktualisiertes GPT-4 Turbo-Preview:
- Das aktualisierte GPT-4 Turbo-Preview-Modell, GPT-4-0125-Preview, bietet eine verbesserte Leistung bei Aufgaben wie Code-Generierung.
- Aktualisiertes Moderationsmodell:
- Das Moderations-API erhält mit Text-Moderation-007 ein robustes Update.
Neue Möglichkeiten zur API-Nutzung und Schlüsselverwaltung
OpenAI führt zwei Plattformverbesserungen ein, um Entwicklern mehr Transparenz über ihre Nutzung zu bieten und die Kontrolle über API-Schlüssel zu ermöglichen.
- Entwickler können nun Berechtigungen für API-Schlüssel direkt von der API-Schlüssel-Seite aus zuweisen.
- Das Dashboard und die Exportfunktion für die Nutzung zeigen jetzt Metriken auf API-Schlüssel-Ebene an.
Diese Verbesserungen sollen Entwicklern helfen, ihre API-Nutzung besser zu verstehen und API-Schlüssel effektiver zu verwalten.
Für die neuesten Updates zu OpenAI-APIs folgen Sie @OpenAIDevs auf Twitter.