반응형
블로그 이미지
개발자로서 현장에서 일하면서 새로 접하는 기술들이나 알게된 정보 등을 정리하기 위한 블로그입니다. 운 좋게 미국에서 큰 회사들의 프로젝트에서 컬설턴트로 일하고 있어서 새로운 기술들을 접할 기회가 많이 있습니다. 미국의 IT 프로젝트에서 사용되는 툴들에 대해 많은 분들과 정보를 공유하고 싶습니다.
솔웅

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백

글 보관함

카테고리


반응형

GPT-4 API general availability and deprecation of older models in the Completions API (openai.com)

 

GPT-4 API general availability and deprecation of older models in the Completions API

GPT-3.5 Turbo, DALL·E and Whisper APIs are also generally available, and we are releasing a deprecation plan for older models of the Completions API, which will retire at the beginning of 2024.

openai.com

 

GPT-4 API general availability and deprecation of older models in the Completions API

GPT-3.5 Turbo, DALL·E and Whisper APIs are also generally available, and we are releasing a deprecation plan for older models of the Completions API, which will retire at the beginning of 2024.

 

GPT-3.5 Turbo, DALL·E 및 Whisper API도 generally 사용할 수 있으며, Completions API의 이전 모델에 대한 지원 중단 계획을 발표합니다. 이 모델들은 2024년 초에 사용 중지됩니다.

 

July 6, 2023

 

Starting today, all paying API customers have access to GPT-4. In March, we introduced the ChatGPT API, and earlier this month we released our first updates to the chat-based models. We envision a future where chat-based models can support any use case. Today we’re announcing a deprecation plan for older models of the Completions API, and recommend that users adopt the Chat Completions API.

 

오늘부터 모든 유료 API 고객은 GPT-4에 액세스할 수 있습니다. 3월에 우리는 ChatGPT API를 도입했고 이달 초에는 채팅 기반 모델에 대한 첫 번째 업데이트를 발표했습니다. 우리는 채팅 기반 모델이 모든 사용 사례를 지원할 수 있는 미래를 상상합니다. 오늘 우리는 Completions API의 이전 모델에 대한 지원 중단 계획을 발표하고 사용자가 Chat Completions API를 채택할 것을 권장합니다.

 

GPT-4 API general availability

 

GPT-4 is our most capable model. Millions of developers have requested access to the GPT-4 API since March, and the range of innovative products leveraging GPT-4 is growing every day. Today all existing API developers with a history of successful payments can access the GPT-4 API with 8K context. We plan to open up access to new developers by the end of this month, and then start raising rate-limits after that depending on compute availability.

 

GPT-4는 가장 capable한 모델입니다. 3월부터 수백만 명의 개발자가 GPT-4 API에 대한 액세스를 요청했으며 GPT-4를 활용하는 혁신적인 제품의 범위가 매일 증가하고 있습니다. 현재 성공적인 결제 기록이 있는 모든 기존 API 개발자는 8K 컨텍스트로 GPT-4 API에 액세스할 수 있습니다. 이달 말까지 새로운 개발자에게 액세스를 허용한 다음 컴퓨팅 가용성에 따라 속도 제한을 높일 계획입니다.

 

Based on the stability and readiness of these models for production-scale use, we are also making the GPT-3.5 Turbo, DALL·E and Whisper APIs generally available. We are working on safely enabling fine-tuning for GPT-4 and GPT-3.5 Turbo and expect this feature to be available later this year.

 

생산 규모 사용을 위한 이러한 모델의 안정성과 준비성을 기반으로 GPT-3.5 Turbo, DALL·E 및 Whisper API를 generally 사용할 수 있도록 만들고 있습니다. 우리는 GPT-4 및 GPT-3.5 Turbo에 대한 fine-tuning을 안전하게 활성화하기 위해 노력하고 있으며 이 기능은 올해 말에 제공될 예정입니다.

 

Moving from text completions to chat completions

We introduced the Chat Completions API in March, and it now accounts for 97% of our API GPT usage.

 

3월에 Chat Completions API를 도입했으며 현재 API GPT 사용량의 97%를 차지합니다.

 

The initial Completions API was introduced in June 2020 to provide a freeform text prompt for interacting with our language models. We’ve since learned that we can often provide better results with a more structured prompt interface. The chat-based paradigm has proven to be powerful, handling the vast majority of previous use cases and new conversational needs, while providing higher flexibility and specificity. In particular, the Chat Completions API’s structured interface (e.g., system messages, function calling) and multi-turn conversation capabilities enable developers to build conversational experiences and a broad range of completion tasks. It also helps lower the risk of prompt injection attacks, since user-provided content can be structurally separated from instructions.

 

초기 Completions API는 2020년 6월에 도입되어 언어 모델과 상호 작용하기 위한 자유 형식 텍스트 프롬프트를 제공합니다. 이후 우리는 보다 구조화된 프롬프트 인터페이스를 통해 종종 더 나은 결과를 제공할 수 있다는 것을 알게 되었습니다. 채팅 기반 패러다임은 이전 사용 사례와 새로운 대화 요구 사항의 대부분을 처리하는 동시에 더 높은 유연성과 특수성을 제공하는 강력한 것으로 입증되었습니다. 특히 Chat Completions API의 구조화된 인터페이스(예: 시스템 메시지, 함수 호출) 및 멀티턴 대화 기능을 통해 개발자는 대화형 경험과 광범위한 완료 작업을 구축할 수 있습니다. 또한 사용자가 제공한 콘텐츠와 지침을 구조적으로 분리할 수 있으므로 프롬프트 인젝션 공격의 위험을 줄이는 데 도움이 됩니다.

 

 

We plan to continue investing most of our platform efforts in this direction, as we believe it will offer an increasingly capable and easy-to-use experience for developers. We’re working on closing the last few remaining gaps of the Chat Completions API quickly, such as log probabilities for completion tokens and increased steerability to reduce the “chattiness” of responses.

 

우리는 이 방향으로 대부분의 플랫폼 노력을 계속해서 투자할 계획입니다. 이는 개발자에게 점점 더 기능이 풍부하고 사용하기 쉬운 경험을 제공할 것이라고 믿기 때문입니다. 완료 토큰에 대한 로그 확률 및 응답의 "채팅성"을 줄이기 위한 향상된 조종성 등 Chat Completions API의 마지막 몇 가지 남은 격차를 신속하게 해결하기 위해 노력하고 있습니다.

 

Deprecation of older models in the Completions API

As part of our increased investment in the Chat Completions API and our efforts to optimize our compute capacity, in 6 months we will be retiring some of our older models using the Completions API. While this API will remain accessible, we will label it as “legacy” in our developer documentation starting today. We plan for future model and product improvements to focus on the Chat Completions API, and do not have plans to publicly release new models using the Completions API.

 

Chat Completions API에 대한 투자 증가와 컴퓨팅 용량을 최적화하기 위한 노력의 일환으로 6개월 후에 Completions API를 사용하는 이전 모델 중 일부를 폐기할 예정입니다. 이 API는 계속 액세스할 수 있지만 오늘부터 개발자 문서에서 "레거시"로 표시됩니다. Chat Completions API에 집중하기 위해 향후 모델 및 제품 개선을 계획하고 Completions API를 사용하여 새 모델을 공개적으로 출시할 계획은 없습니다.

 

Starting January 4, 2024, older completion models will no longer be available, and will be replaced with the following models:

 

2024년 1월 4일부터 이전 완료 모델을 더 이상 사용할 수 없으며 다음 모델로 대체됩니다.

 

Applications using the stable model names for base GPT-3 models (ada, babbage, curie, davinci) will automatically be upgraded to the new models listed above on January 4, 2024. The new models will also be accessible in the coming weeks for early testing by specifying the following model names in API calls: ada-002, babbage-002, curie-002, davinci-002.

 

기본 GPT-3 모델(ada, babbage, curie, davinci)에 안정적인 모델 이름을 사용하는 애플리케이션은 2024년 1월 4일에 위에 나열된 새 모델로 자동 업그레이드됩니다. API 호출에 다음 모델 이름을 지정하여 테스트: ada-002, babbage-002, curie-002, davinci-002.

 

Developers using other older completion models (such as text-davinci-003) will need to manually upgrade their integration by January 4, 2024 by specifying gpt-3.5-turbo-instruct in the “model” parameter of their API requests. gpt-3.5-turbo-instruct is an InstructGPT-style model, trained similarly to text-davinci-003. This new model is a drop-in replacement in the Completions API and will be available in the coming weeks for early testing.

 

다른 이전 완성 모델(예: text-davinci-003)을 사용하는 개발자는 API 요청의 "모델" 매개변수에 gpt-3.5-turbo-instruct를 지정하여 2024년 1월 4일까지 통합을 수동으로 업그레이드해야 합니다. gpt-3.5-turbo-instruct는 text-davinci-003과 유사하게 훈련된 InstructGPT 스타일 모델입니다. 이 새 모델은 Completions API의 드롭인 대체품이며 초기 테스트를 위해 앞으로 몇 주 안에 사용할 수 있습니다.

 

Developers wishing to continue using their fine-tuned models beyond January 4, 2024 will need to fine-tune replacements atop the new base GPT-3 models (ada-002, babbage-002, curie-002, davinci-002), or newer models (gpt-3.5-turbo, gpt-4). Once this feature is available later this year, we will give priority access to GPT-3.5 Turbo and GPT-4 fine-tuning to users who previously fine-tuned older models. We acknowledge that migrating off of models that are fine-tuned on your own data is challenging. We will be providing support to users who previously fine-tuned models to make this transition as smooth as possible.

 

 fine-tuned된 모델을 2024년 1월 4일 이후에도 계속 사용하려는 개발자는 새로운 기본 GPT-3 모델(ada-002, babbage-002, curie-002, davinci-002) 이나 최근 모델(gpt-3.5-turbo, gpt-4)에서  fine-tuning해야 합니다 . 올해 후반에 이 기능을 사용할 수 있게 되면 이전 모델을 fine-tuning한 사용자에게 GPT-3.5 Turbo 및 GPT-4 fine-tuning에 대한 우선 액세스 권한을 부여할 것입니다. 자체 데이터에 대해 미세 조정된 모델에서 마이그레이션하는 것이 어렵다는 것을 알고 있습니다. 이전에 모델을 미세 조정한 사용자에게 이러한 전환이 최대한 원활하게 이루어지도록 지원을 제공할 예정입니다.

 

In the coming weeks, we will reach out to developers who have recently used these older models, and will provide more information once the new completion models are ready for early testing.

 

앞으로 몇 주 동안 이러한 이전 모델을 최근에 사용한 개발자에게 연락을 취하고 새로운 완성 모델이 초기 테스트 준비가 되면 더 많은 정보를 제공할 것입니다.

 

Deprecation of older embeddings models

Users of older embeddings models (e.g., text-search-davinci-doc-001) will need to migrate to text-embedding-ada-002 by January 4, 2024. We released text-embedding-ada-002 in December 2022, and have found it more capable and cost effective than previous models. Today text-embedding-ada-002 accounts for 99.9% of all embedding API usage.

 

이전 임베딩 모델(예: text-search-davinci-doc-001) 사용자는 2024년 1월 4일까지 text-embedding-ada-002로 마이그레이션해야 합니다. 2022년 12월에 text-embedding-ada-002를 출시했으며 이전 모델보다 성능이 뛰어나고 비용 효율적이라는 사실을 알게 되었습니다. 현재 text-embedding-ada-002는 모든 임베딩 API 사용량의 99.9%를 차지합니다.

 

We recognize this is a significant change for developers using those older models. Winding down these models is not a decision we are making lightly. We will cover the financial cost of users re-embedding content with these new models. We will be in touch with impacted users over the coming days.

 

우리는 이것이 이전 모델을 사용하는 개발자에게 중요한 변화라는 것을 알고 있습니다. 이러한 모델을 종료하는 것은 우리가 가볍게 내리는 결정이 아닙니다. 우리는 사용자가 이러한 새 모델로 콘텐츠를 다시 임베딩하는 재정적 비용을 충당할 것입니다. 앞으로 며칠 동안 영향을 받는 사용자에게 연락을 드릴 것입니다.

 

 

Deprecation of the Edits API

Users of the Edits API and its associated models (e.g., text-davinci-edit-001 or code-davinci-edit-001) will need to migrate to GPT-3.5 Turbo by January 4, 2024. The Edits API beta was an early exploratory API, meant to enable developers to return an edited version of the prompt based on instructions. We took the feedback from the Edits API into account when developing gpt-3.5-turbo and the Chat Completions API, which can now be used for the same purpose:

 

Edits API 및 관련 모델(예: text-davinci-edit-001 또는 code-davinci-edit-001) 사용자는 2024년 1월 4일까지 GPT-3.5 Turbo로 마이그레이션해야 합니다. Edits API 베타는 초기 버전이었습니다. 개발자가 지침에 따라 프롬프트의 편집된 버전을 반환할 수 있도록 하는 탐색 API. 우리는 gpt-3.5-turbo 및 Chat Completions API를 개발할 때 Edits API의 피드백을 고려했으며 이제 동일한 용도로 사용할 수 있습니다.

 

 

 

 

 

반응형