6 पॉइंट द्वारा arxivgpt 2024-09-06 | 1 टिप्पणियां | WhatsApp पर शेयर करें

किसी प्रिय अस्तित्व को विदा करना, किसी के लिए भी गहरे खोने का एहसास और सीने को चीर देने वाला दुःख लेकर आता है.

खासकर जब वह फिर कभी न दिखने वाली अनंत यात्रा पर चला गया हो, तो यह और भी अधिक होता है.

यह बस कुछ ही दिन पहले की बात है.

10 साल से अधिक समय तक परिवार का सदस्य रहे पालतू बिल्ली 'Eric' (उपनाम 'Eric Go') ने, मन से तैयार होने का तो सवाल ही नहीं, कल्पना तक न की जा सकने वाली विदाई दे दी.

दुःख में डूबे अपने परिवार और अपने लिए, मैं 'Eric' को याद करना चाहता था और यह यथार्थपूर्ण एहसास बनाना चाहता था कि वह हमेशा हमारे साथ है. इस सोच के साथ कि 'Eric' हमेशा हमारे परिवार के साथ रह सके, मैंने 'AI' का उपयोग करने का निर्णय लिया.

सबसे पहले, उसके शुरुआती चरण के रूप में, मैंने 'Eric' की तस्वीरों का उपयोग करने का फैसला किया.

पहले चरण में मेरा लक्ष्य यह था कि परिवार का कोई भी सदस्य जब भी Eric को याद करे, तो उसे 'तस्वीरों और वीडियो' में फिर से देख सके.

अर्थात, Eric के जीवनकाल में ली गई तस्वीरों को पहले AI को सिखाया जाता है.

उसके बाद, जब भी Eric को देखना हो, तो टेक्स्ट या आवाज़ के ज़रिए AI को इनपुट दिया जाए. जैसे: "हवाई के समुद्र तट पर sunglasses और फूलों की सजावट पहने एक बिल्ली (बिल्कुल Eric के जीवित समय वाले रूप में) खुश चेहरे के साथ 'पापा, I love you' लिखा हुआ संदेश दिखा रही है — ऐसा दृश्य दिखाओ."

फिर थोड़ी ही देर में AI, Eric के जीवनकाल वाले रूप को बिल्कुल वैसा ही रखते हुए, मेरी इच्छानुसार image या video बनाकर मुझे दिखाता है.

इसके लिए मैंने कुछ प्रक्रियाएँ, तैयारी (development) और रणनीतियाँ तैयार कीं.

संदर्भ के लिए, लेखक के पास AI विशेषज्ञ development क्षमता और कई NVIDIA H100 GPU मौजूद थे, इसलिए यह पूरी तरह संभव चुनौती और प्रयोग था.

  1. सबसे पहले, मैंने Eric की लगभग 45 तस्वीरें चुनीं.

  2. training quality बढ़ाने के लिए एक automated preprocessing process विकसित किया और उसे लागू किया.

इसका उद्देश्य "object" को और अधिक स्पष्ट व साफ़ बनाना था, साथ ही AI के supervised learning की efficiency बढ़ाना भी था.

इनमें से एक तरीका यह था कि 'original photo' (जिसमें background शामिल है) से 'object' (बिल्ली) को अपने-आप अलग किया जाए और scale-up जैसी preprocessing की जाए.

  1. preprocessing पूरी हो चुकी 45 तस्वीरों पर LoRA तरीके से training की गई.

training default settings के आधार पर की गई, और A100 GPU के मानक पर इसमें लगभग 2 घंटे लगे.

  1. training पूरी हुई, और उसके बाद 'Hugging Face' पर Eric के लिए एक dedicated 'model' रजिस्टर किया गया.

  2. अब trained model को FLUX model से जोड़कर सर्वोत्तम quality में image generation की तैयारी की गई.

base FLUX model में Korean prompt input संभव हो, इसके लिए coding की गई, और अब trained परिणाम की पुष्टि की जा सकी.

यह हैरान कर देने वाली हद तक उसके जीवनकाल वाले रूप जैसा ही था.

इस परिणाम पर पूरा परिवार चकित भी हुआ और बहुत खुश भी; यह देखकर मुझे बहुत संतोष हुआ.

और मैं आशा करता हूँ कि इस प्रक्रिया को रिकॉर्ड के रूप में सार्वजनिक कर छोड़ने से यह किसी के लिए उपयोगी साबित होगी.

यदि कोई अपनी पालतू बिल्ली या पालतू कुत्ते के लिए भी ऐसा करना चाहता है, तो वह कभी भी संदेश भेजे; मैं मदद करना चाहूँगा.

1 टिप्पणियां

 
arxivgpt 2024-09-06

ज़्यादा जानकारी और इमेजेज़ मैंने Brunch पर अपलोड कर दी हैं.
संदर्भ: https://brunch.co.kr/@seawolf/16