1 पॉइंट द्वारा GN⁺ 2023-08-23 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • OpenAI ने GPT-3.5 Turbo के लिए fine-tuning और API अपडेट्स की घोषणा की है, जिससे डेवलपर्स अपने खास use cases के मुताबिक मॉडल को customize कर सकेंगे.
  • GPT-4 के लिए fine-tuning शरद ऋतु में उपलब्ध होने की उम्मीद है.
  • शुरुआती परीक्षणों में यह दिखा कि fine-tuned GPT-3.5 Turbo कुछ खास कार्यों में बेस GPT-4 के प्रदर्शन के बराबर या उससे बेहतर प्रदर्शन कर सकता है.
  • fine-tuning API के ज़रिए भेजा गया डेटा ग्राहक के स्वामित्व में रहता है, और OpenAI या अन्य संगठन इसका उपयोग दूसरे मॉडलों को train करने के लिए नहीं करते.
  • fine-tuning का उपयोग बेहतर steerability, भरोसेमंद output formatting, और customized tone जैसे सामान्य use cases में मॉडल प्रदर्शन सुधारने के लिए किया गया है.
  • fine-tuning व्यवसायों को prompts छोटे करने के साथ-साथ समान प्रदर्शन सुनिश्चित करने में मदद करती है, और यह पहले fine-tuned मॉडलों की तुलना में दोगुने 4k tokens तक संभाल सकती है.
  • fine-tuning तब सबसे प्रभावी होती है जब इसे prompt engineering, information retrieval, function calling जैसी तकनीकों के साथ जोड़ा जाए.
  • fine-tuning की लागत दो हिस्सों में बंटी है: शुरुआती training cost और usage cost.
  • OpenAI ने babbage-002 और davinci-002 भी मूल GPT-3 base models के विकल्प के रूप में पेश किए हैं, और इन्हें नए API endpoints के माध्यम से fine-tune किया जा सकता है.
  • मौजूदा /v1/fine-tunes endpoint को 4 जनवरी 2024 को बंद किया जाना निर्धारित है.
  • OpenAI fine-tuned deployments की सुरक्षा सुनिश्चित करने पर काम कर रहा है, और fine-tuning training data को उसके Moderation API तथा GPT-4 आधारित moderation system के ज़रिए असुरक्षित training data का पता लगाने के लिए जांचा जाता है.
  • निकट भविष्य में fine-tuning UI जारी किया जाएगा, जिससे डेवलपर्स चल रहे fine-tuning jobs और पूर्ण हो चुके model snapshots की जानकारी तक अधिक आसानी से पहुँच सकेंगे.

1 टिप्पणियां

 
GN⁺ 2023-08-23
Hacker News की राय
  • OpenAI ने वादे के मुताबिक GPT-3.5 के fine-tuning को जारी किया, कुछ महीने पहले GPT-4 API access खोलने के बाद।
  • पर्याप्त रूप से open नहीं होने की आलोचना के बावजूद, OpenAI को Llama और Bard जैसे अन्य open source AI से आगे तेज innovation के लिए सराहा गया।
  • fine-tuned GPT-3.5 Turbo के साथ generation की लागत base model की तुलना में 8 गुना अधिक है, इसलिए यह केवल उन लोगों के लिए cost-effective है जो prompt size को काफी कम कर सकते हैं।
  • fine-tuned GPT-3.5 Turbo और Llama2 model के बीच तुलना की मांग की गई, क्योंकि बाद वाले के लिए rented infrastructure की जरूरत होती है।
  • कुछ users को लगता है कि GPT-3.5 Turbo दोहरावपूर्ण और inaccurate है, इसलिए writing और coding के लिए अनुपयुक्त है, जबकि अन्य users का मानना है कि GPT-4 कहीं बेहतर है और education या problem-solving assistant tool के रूप में उपयोगी है।
  • users के बीच एक वांछित feature built-in prompt splitting function है, जिससे third-party tools की जरूरत खत्म हो सके।
  • OpenAI के "unsafe" model उपलब्ध न कराने के फैसले पर ध्यान दिया गया, और davinci-002 व babbage-002 दोनों "unsafe" completions पर infinite loop में फंस जाते हैं।
  • fine-tuning training data, OpenAI के Moderation API और GPT-4-आधारित censorship system से गुजरता है, और अनुमान है कि इसे केवल तब इस्तेमाल किया जाता है जब ऊंची लागत के कारण "safety" अस्पष्ट हो।
  • fine-tuning job के लिए जरूरी tokens की गणना कैसे की जाए, और base model के behavior को प्रभावी रूप से प्रभावित करने के लिए आम तौर पर कितना fine-tuning data चाहिए, इस पर सवाल उठे।
  • "Chat" models की fine-tuning की संभावना रोचक मानी गई, और यह भी पूछा गया कि क्या fine-tuned models का उपयोग करके मौजूदा AI detectors को bypass किया जा सकता है।
  • privacy को लेकर चिंताएं उठाई गईं, और यह सवाल भी पूछा गया कि OpenAI या Microsoft API calls से मिले text को कितने समय तक store करते हैं।
  • कुल मिलाकर, GPT-3.5 Turbo fine-tuning का जारी होना एक सकारात्मक प्रगति माना गया, और 16k fine-tuning को लेकर उम्मीदें हैं।