1 पॉइंट द्वारा GN⁺ 2023-12-19 | 1 टिप्पणियां | WhatsApp पर शेयर करें

कुशल शब्द प्रतिनिधित्वों का vector space में अनुमान

  • शोधकर्ताओं ने बहुत बड़े डेटा सेट्स में शब्दों के continuous vector representations की गणना करने के लिए दो नए model architectures प्रस्तावित किए हैं.
  • इन representations की गुणवत्ता को word similarity tasks पर मापा गया और इसकी तुलना पहले सर्वश्रेष्ठ प्रदर्शन दिखाने वाली विभिन्न प्रकार की neural network-आधारित तकनीकों से की गई.
  • शोधकर्ताओं ने देखा कि बहुत कम computational cost पर accuracy में बड़ा सुधार मिलता है. यानी, 1.6 अरब शब्दों वाले डेटा सेट में 10 लाख vocabulary के लिए उच्च-गुणवत्ता वाले 300-dimensional vectors को एक ही CPU पर एक दिन के भीतर निकाला जा सकता है.
  • साथ ही, यह भी दिखाया गया कि ये vectors word similarity के विभिन्न प्रकारों को मापने वाले test sets पर state-of-the-art प्रदर्शन देते हैं.
  • शोध समुदाय के उपयोग के लिए इस test set को सार्वजनिक करने की योजना है.

राय

  • reviewers ने指出 किया कि प्रस्तावित models मौजूदा models से कैसे अलग हैं और वे बेहतर क्यों हैं, इसके लिए स्पष्ट motivation की कमी है.
  • model का विवरण बहुत न्यूनतम है, इसलिए यह तय करना कठिन है कि यह पिछले शोध से कैसे अलग है.
  • reviewers ने ज़ोर दिया कि paper में अलग-अलग data sets और भिन्न dimensions पर trained models के बीच असंगत तुलना शामिल है, जबकि paper के दावों को विश्वसनीय बनाने के लिए यह आवश्यक है.

GN⁺ की राय

  • यह शोध word vectors का कुशल अनुमान लगाने की नई तकनीक प्रस्तावित करता है, जो natural language processing क्षेत्र में एक महत्वपूर्ण प्रगति है.
  • प्रस्तावित models मौजूदा जटिल neural network models की तुलना में बहुत तेज़ी से train किए जा सकते हैं, जो बड़े पैमाने के language data पर काम करने वाले शोध के लिए उपयोगी हो सकता है.
  • paper word vectors की गुणवत्ता का मूल्यांकन करने का एक नया तरीका प्रस्तुत करता है, जो भविष्य के शोध में word similarity को मापने के मानक के रूप में स्थापित हो सकता है.

1 टिप्पणियां

 
GN⁺ 2023-12-19
Hacker News राय
  • Tomas Mikolov की Facebook पोस्ट में word2vec के बारे में और अधिक विवरण देखे जा सकते हैं.

    • यह दिलचस्प और अर्थपूर्ण है कि विशेषज्ञ भी गलतियाँ करते हैं.
    • Geoff Hinton जैसे कुछ लोगों ने कहा, "हम पहले से जानते थे, लेकिन प्रकाशित करना भूल गए", जबकि Ian Goodfellow ने Twitter पर इस बारे में नाराज़गी जताई; यानी प्रतिक्रियाएँ अलग-अलग थीं.
  • मुझे लगता है कि reviewers ने अच्छा काम किया.

    • review का काम paper की quality को परखना है, यह नहीं कि भविष्य में उसका प्रभाव कितना होगा.
    • हर प्रभावशाली paper वास्तव में अच्छा paper नहीं होता.
  • reviewer f5bf की टिप्पणी दिलचस्प है.

    • आधुनिक models (GPT, image diffusion models आदि) में शब्दों के दोहरे अर्थ के साथ खेलने की क्षमता होती है.
    • इसे कभी केवल इंसानों की विशेषता माना जाता था, लेकिन अब यह generative models के toolbox का हिस्सा है.
    • यह स्पष्ट नहीं है कि word2vec की ambiguity इस तरह के शब्द-खेल में योगदान देती है या नहीं, लेकिन creative उद्देश्यों के लिए यह एक feature हो सकती है, जबकि meaning space को सख्त vector space के रूप में model करने की कोशिश में यह bug बन सकती है.
  • यह भी राय है कि review process नए विचारों के लिए प्रभावी नहीं है.

    • कोई भी व्यक्ति कुछ पूरी तरह नया समझने के लिए अनगिनत घंटे नहीं दे सकता.
  • paper का शुरुआती version reject हुआ था, लेकिन reviews के आधार पर बाद में updates और clarifications किए गए.

    • यह दिखाता है कि review process को कैसे काम करना चाहिए, और खासकर innovative work के लिए अधिक explanation की ज़रूरत होती है.
  • "Strong Reject" की चार राय दिख रही हैं, लेकिन लगता है कि वे सब एक ही reviewer से एक साथ आई थीं.

    • यह सवाल उठता है कि केवल उसी reviewer का score क्यों दिख रहा है.
  • यह जानने की जिज्ञासा है कि peer review के मूल्य पर बहुत मजबूत राय रखने वाले लोगों में से कितनों ने वास्तव में author, reviewer, या editor के रूप में peer review में भाग लिया है.

    • peer review के बिना भी research या ideas साझा करने के लिए कई जगहें हैं (जैसे: arXiv/bioRxiv).
  • यह भी कहा गया कि शीर्षक भ्रामक है.

    • "Strong Reject" चार बार एक ही author से आया था, और यह openreview की गलती हो सकती है.
  • review thread किसी नकारात्मक Show HN thread की तरह पढ़ी जाती है.

    • paper को शुरुआत में कुछ सवाल/नकारात्मक feedback मिला था, और authors ने reviewers से थोड़े revisions का अनुरोध किया.
  • विश्वविद्यालय के दिनों में, किसी ने एक साधारण text correction system बनाया और उस पर paper submit किया, लेकिन English grammar की समस्याओं के कारण reject कर दिया गया.

    • reviewers से feedback माँगा गया, लेकिन system द्वारा सुधारे गए "before/after" examples को ही गलती बताकर चिह्नित किया गया.
    • कुछ प्रयासों के बाद उन्होंने हार मान ली.