2024 में Instruct-Korea community https://instruct.kr ने LogicKor लीडरबोर्ड लॉन्च होने के साथ करीब 700 शोधकर्ताओं के साथ मिलकर, जिन्होंने स्वेच्छा से अपने शोध परिणाम साझा किए, दक्षिण कोरिया के सबसे बड़े ओपन सोर्स भाषा मॉडल समुदायों में से एक का रूप ले लिया।

2025 के नए साल के अवसर पर, Instruct-Korea Discord समुदाय के सदस्यों को अपने शोध ट्रेंड्स और अपडेट साझा करने तथा नेटवर्किंग करने के लिए एक जगह देने का प्रयास किया गया है। इस meetup का विषय “भाषा मॉडल पर शोध करते समय मेरे आइडिया और चुनौतियाँ” है। हम अन्य लोगों के अनुभव भी सुनना चाहते हैं, अपने शोध आइडिया भी साझा करना चाहते हैं, और अलग-अलग राय वाले लोगों के बीच संवाद हो सके, यह अपेक्षा है।

कार्यक्रम 25 जनवरी 2025 (शनिवार), 14~18 बजे

स्थान: Gangnam Station के पास Nonce (Yeoksam-dong 624-17) है।

संपर्क: https://instruct.kr

स्थल प्रायोजन: Nonce Community (https://nonce.community/)

स्पीकर परिचय
और अधिक स्पीकर जल्द अपडेट किए जाएँगे।

Go Seok-hyeon (Sionic AI)
Scala JVM भाषा का उपयोग करके प्राकृतिक भाषा प्रोसेसिंग (NLP) में चल रहे काम के बारे में वे बताएँगे। खास तौर पर production level पर Python-आधारित deep learning code को JVM भाषा में port करके serving करने का अनुभव वे साझा करेंगे।

Kim Jisoo (kuotient, Olgonize): Qwen2.5 Korean Language Model Development
“Qwen2.5 Korean Language Model Development” के जरिए वे एक इनोवेटिव भाषा मॉडल निर्माण प्रक्रिया साझा करेंगे। खास तौर पर m-ArenaHard में 37.60 जैसी उल्लेखनीय performance boost देने वाली प्रक्रिया पर विशेष ध्यान है। वे SFT, Merging, Alignment आदि पूरे training pipeline को कवर करेंगे, और layer replacement तथा On-policy strategy अपनाने जैसी कोरिया में पहली बार की गई तकनीकी नवाचारों को भी दिखाएँगे। 8B से नीचे के मॉडल्स में शीर्ष प्रदर्शन हासिल करने का राज़ वे विस्तार से बताएँगे।

Lee Seung-yu (dopeornope, Marker AI): LLM Guidance और Quantization
“LLM Guidance और Quantization” के विषय पर, तेजी से विकसित हो रही LLM टेक्नोलॉजी की ताज़ा रुझानों पर नज़र डालते हैं। हाल में बहुत शोध किए जा रहे LLM guidance और quantization तकनीकों के concept और आगे के विकास दिशा-निर्देश पर वे गहरी insights देंगे।

Yoo Yong-sang: KRX Financial Language Model Competition Review
“KRX Financial Language Model Competition Review” के माध्यम से वे domain-specific मॉडल निर्माण की practical learnings साझा करते हैं। इसमें MCQA benchmark प्रदर्शन बढ़ाने के लिए domain adaptation और continual pretraining strategy, तथा safety auditing पर विस्तृत चर्चा शामिल होगी।

Choi Seon-woong: RAG Development Project Story
वे वास्तविक RAG development परियोजना के दौरान मिले वास्तविक अनुभव साझा करेंगे। खासकर प्रोजेक्ट में सामने आए मुद्दों को ईमानदारी से सामने रखकर, उससे मिली सीख और सुधार दिशा प्रस्तुत करेंगे।

Jang Young-jun (yjoonjang): Korean Embedding Models
“Korean Embedding Models” और huggingface.co/nlpai-lab को केंद्र में रखकर वे विभिन्न embedding मॉडलों की खासियतें तथा वास्तविक training प्रक्रिया के key points साझा करेंगे। Embedding मॉडल चुनने से लेकर training तक, काम में सीधे लागू होने वाले insights वे साझा करेंगे।

Jung Se-min (Sionic AI): Building Recsys with Graph RAG - Storm fooding
“Building Recsys with Graph RAG - Storm fooding” के जरिए वे graph-based RAG सिस्टम का इस्तेमाल करके recommendation system बनाने का अनुभव साझा करेंगे। सिस्टम डिजाइन से लेकर implementation तक की पूरी प्रक्रिया पर चर्चा की जाएगी।

Kim Dong-kyu (Jeffrey Kim, AutoRAG): Getting 3,000 GitHub Stars
“Getting 3,000 GitHub Stars” शीर्षक से वे AutoRAG ओपन सोर्स प्रोजेक्ट की growth story सुनाएँगे। शुरुआत से सफल ओपन सोर्स बनने तक की यात्रा और आगे के विकास दिशा को शेयर करेंगे।

maywell (instruct.kr, Wanot AI)
TBD

अभी कोई टिप्पणी नहीं है.

अभी कोई टिप्पणी नहीं है.