1 पॉइंट द्वारा GN⁺ 3 시간 전 | 1 टिप्पणियां | WhatsApp पर शेयर करें
  • यह सार्वजनिक आरोप सामने आया है कि Nico का dataroom product उसका खुद का बनाया हुआ न होकर Papermark के open source और enterprise license code से लिया गया लगता है
  • मुख्य विवाद copyright और license उल्लंघन को लेकर है, और आरोप लगाने वाले ने product को तुरंत हटाने की मांग की है
  • इस मामले को “तेज़ी से आगे बढ़ो और चीज़ें तोड़ो” वाला रवैया नहीं, बल्कि fraud के ज्यादा करीब बताया गया है
  • यह भी कहा गया है कि इस product विवाद की वजह से Nico के बाकी business पर भी शक फैल सकता है
  • Garry Tan, Jared Friedman, Y Combinator को साथ में tag किया गया, जिससे मामला YC community की reputation तक फैल गया

Papermark code चोरी का आरोप

  • सार्वजनिक रूप से यह आरोप लगाया गया है कि Nico का dataroom product in-house develop नहीं किया गया, बल्कि Papermark के open source और enterprise license code से लिया हुआ लगता है
  • आरोप लगाने वाले का कहना है कि इसे सिर्फ तेज़ product development या “vibe coding” मानना मुश्किल है, और इसमें copyright व license infringement की संभावना दिखती है
  • मांगें स्पष्ट हैं
    • इस product को तुरंत हटाया जाना चाहिए
    • अगर उल्लंघन सच है, तो इसे साधारण गलती से अधिक गंभीर कृत्य माना जा सकता है

आलोचना का फैलाव

  • आलोचना सिर्फ Nico के dataroom product तक सीमित नहीं है, बल्कि उसके बाकी business की विश्वसनीयता पर भी सवाल उठाती है
  • Garry Tan, Jared Friedman, Y Combinator को tag किए जाने से यह व्यक्तिगत विवाद से आगे बढ़कर YC community की reputation से भी जुड़ गया है
  • अभी सार्वजनिक जानकारी में मुख्य रूप से आरोप और मांगें ही सामने हैं; अतिरिक्त verification या rebuttal उपलब्ध नहीं है

1 टिप्पणियां

 
GN⁺ 3 시간 전
Hacker News प्रतिक्रियाएँ
  • अगर किसी वेबपेज का स्क्रीनशॉट Figma Make जैसे टूल में डालें, तो काफ़ी मिलता-जुलता क्लोन बनाया जा सकता है
    स्क्रीनशॉट से ठीक वैसा ही एहसास आता है, बहुत समान है लेकिन पूरी तरह एक जैसा नहीं। टेक्स्ट भी काफ़ी हद तक वही है, शायद इसी वजह से। कॉपी री-राइट तक generative text tool से न करवाना बस लापरवाही लगता है

  • दूसरे Twitter कमेंट्स देखें तो लगता है शायद AI से Papermark को कॉपी करने को कहा गया था
    AI कमेंट में ऐसे निशान हैं कि पेज को “reference” के हिसाब से align किया गया था
    https://xcancel.com/ffumarola/status/2070479755892371713#m

  • उनका जवाब यह था:

    The team that made dataroom has stated that they did not use any of papermark’s code and that dataroom was made from scratch with inspiration from existing document sharing softwares, and that this post’s allegations of us stealing code are false. [...]
    स्क्रीनशॉट देखें तो साफ़ है कि design और copy, दोनों में पूरे पेज को लगभग जैसा-का-तैसा कॉपी किया गया है। संस्थापक Nico Laqua का लगभग सिर्फ़ यह कहना कि “हमने code कॉपी नहीं किया” और कोई ज़िम्मेदारी न लेना, उसकी और कंपनी की नैतिक सीमाओं को अच्छी तरह दिखाता है। हो सकता है यह मुकदमे के लिए काफ़ी न हो, लेकिन इसका मतलब यह नहीं कि यह सही है
    https://x.com/nico_laqua/status/2070158170937581951

    • कुछ साल पहले जब Corgi अपना पहला engineer hire कर रही थी, तब मैंने इंटरव्यू दिया था। Nico के साथ बिल्कुल तालमेल नहीं बैठा, और सिर्फ़ फोन screening होने के बावजूद वह मेरे सबसे बेढंगे इंटरव्यू में से एक था
      अगर Nico सच में “हमने code कॉपी नहीं किया” को एक उचित बचाव मानता हो, तो मुझे ज़रा भी हैरानी नहीं होगी। यह उसके लिए किसी साफ़ नियम जैसा लगता होगा, और चरम किस्म के “shape rotator” लोग अक्सर क़ानून जैसे क्षेत्रों की धुंधलाहट से जूझते हैं। असल में copyright infringement भी अश्लीलता की पहचान वाले मानक जैसा है: देखकर अक्सर समझ आ जाता है
    • यह वही व्यक्ति है जो पहले weekend work का ढिंढोरा पीटता था और अपनी मामूली insurance company की तुलना Manhattan Project से करता था
      कहीं उसने यह भी दावा किया था कि यह कंपनी/industry दुनिया में AI का सबसे महत्वपूर्ण application area है। मुझे ज़रा भी शक नहीं कि इन्होंने कॉपी किया है, और कम से कम यह भरोसेमंद लोग नहीं हैं
      https://x.com/nico_laqua/status/2061130574358773852?s=20
    • “मुकदमे लायक़ शायद नहीं” का मतलब अक्सर सिर्फ़ यह होता है कि open source project आमतौर पर आसानी से मुकदमा नहीं करते
      अगर इन्होंने यह किसी ऐसी कंपनी के साथ किया होता जो मुकदमा करने में ज़्यादा आक्रामक हो, तो इन पर केस होने की संभावना काफ़ी होती, और जीत-हार भी शायद 50-50 रहती। इसे रचनात्मक/कलात्मक तत्वों की कॉपी माना जाएगा या सिर्फ़ काम करने के तरीके की नकल, यह कहना मुश्किल है, लेकिन functionality कॉपी करना भले ठीक हो, पूरा user experience उठा लेना जल्दी ही copyright infringement बन जाता है
    • झूठ पर झूठ चढ़ाते जाने से ही Nico कैसा इंसान है, यह काफ़ी समझ आ जाता है
    • design तो shadcn का है, जो MIT license वाला बहुत लोकप्रिय design system है
      और copy भी, अगर आप एक वास्तविक data room solution बना रहे हैं, तो काफ़ी हद तक अपेक्षित और मानक तरह की लगती है
  • क्या कोई इस थ्रेड का थोड़ा और बैकग्राउंड समझा सकता है? मुझे बिल्कुल नहीं पता Nico कौन है, Papermark क्या है और क्या करता है
    अलग बात यह है कि ऐसा लगता है लोग अब सिर्फ मौजूदा solutions या projects को vibe coding से दोहराने तक सीमित नहीं हैं, बल्कि open source code को “चुराकर” open source की नैतिक, ethical और कानूनी शर्तों का पालन किए बिना मनमाने ढंग से इस्तेमाल करने के और भी आदी होते जा रहे हैं। पहले से ज़्यादा जगहों पर open source उल्लंघन बढ़ते दिख रहे हैं, लेकिन कोई बड़ा कानूनी नतीजा नहीं दिखता

    • सही है। अब यह बहुत आसान हो गया है
      ऊपर से, सिर्फ AI के सहारे आए नए developers में से काफ़ी लोग यह या तो समझते नहीं हैं या परवाह नहीं करते कि FOSS का मतलब free as in beer नहीं, बल्कि freedom है।
      मैं hardware audio samplers की binary data files को parse करने वाली एक GPL3 library पर काम करता हूँ। किसी ने मेरी library के ऊपर एक app बनाया जो कई काम कर सकता था, और उसने GPL3 license का पालन भी किया।
      लेकिन हाल में किसी ने उस app की पूरी vibe-coded copy बना दी, और उसके साथ website और लगभग 60 dollar का खरीद लिंक भी डाल दिया। रंग अलग थे, लेकिन UI बिल्कुल वही था; यह इतनी बेशर्म copy थी, और GPL3 की शर्तों का ज़रा भी पालन नहीं किया गया था। Moderators ने पोस्ट को सूची से हटा दिया और copy app के developer को ban कर दिया, और forum community ने मूल app developer का साथ दिया। DMCA takedown request भी भेजी गई, और कुछ दिनों बाद वह copy site हट गई।
      मूल app developer किस्मत वाला था कि उस manufacturer से जुड़े posts के लिए असल में सिर्फ एक ही बड़ा forum है, और moderators को भी AI वाली चीज़ें पसंद नहीं थीं। विडंबना यह है कि मूल app developer ने भी अपना सारा काम vibe coding से ही किया था। अगर वह forum और उसके moderators न होते, तो मूल app developer भी और GPL3 library maintainer के रूप में मैं भी, सच कहूँ तो बर्बाद हो गए होते।
      केंद्रीकरण के अपने फ़ायदे हैं। उसके बिना, सबके private source की तरफ लौट जाने के अलावा, या फिर दूसरों के काम का सम्मान करने पर ज़ोर डालने वाला कोई बड़ा जन-आंदोलन खड़ा होने के अलावा, कोई और विकल्प नज़र नहीं आता। अब तक हम प्रतिष्ठा और community backlash वाली व्यवस्था पर टिके हुए थे
    • जज और सरकारें कंपनियों के पक्ष में हैं और consumers व नागरिकों के प्रति शत्रुतापूर्ण हैं
      कंपनियाँ अब हर चीज़ करके बच निकलने की आदी हो गई हैं। “move fast and break things” पहले tech के बारे में कहा जाता था, लेकिन अब यह क़ानून के प्रति रवैया बन गया है। Uber ने इस प्रवृत्ति को लोकप्रिय बनाया, और अब सब वही कर रहे हैं। AI का copyright law तोड़ना भी उसी प्रवाह का हिस्सा है।
      क़ानून हारने वालों के लिए होते हैं — इस सोच की वजह से लगता है कि आगे कठिन समय आने वाला है
    • अगर सबसे बड़े चोर ही खरबों की valuation वाली कंपनियाँ बन रहे हों, तो फिर और क्या उम्मीद करोगे
      अब तो मान लेना चाहिए कि इंटरनेट पर हर चीज़ व्यावहारिक रूप से सबके लिए मनमाने ढंग से उठा लेने लायक हो गई है
    • अगर यह मान लिया जाए कि यह AGI तक पहुँचने की winner-takes-all दौड़ है, और AGI सीधे दुनिया पर पूर्ण नियंत्रण तक ले जाएगी, तो फिर स्वाभाविक है कि कोई मौजूदा क़ानूनों, खासकर साधारण intellectual property rules, से बंधे रहने के बारे में नहीं सोचेगा
      क्योंकि निश्चित रूप से हारने का एकमात्र तरीका खेल में हिस्सा ही न लेना है
    • जो कंपनियाँ बाहरी ग्राहकों या partners के documents संभालती हैं, वे access control, analytics और audit features के साथ documents साझा करने और प्राप्त करने के लिए DocSend by Dropbox जैसे data room का इस्तेमाल करती हैं
      Papermark, DocSend का open source alternative है। इसे self-hosted या hosted दोनों तरह से इस्तेमाल किया जा सकता है, इसलिए यह DocSend की तुलना में बहुत ज़्यादा cost-effective है और काफ़ी लोकप्रिय है।
      Corgi, YC-backed insurance startup है, जो दूसरे YC startups को insurance बेचता है। Nico उसका founder है। हाल ही में उसने लगभग 3 billion dollar valuation पर 100 million dollar जुटाए, और इस समय वह उन कंपनियों में से है जिन्हें YC विशेष रूप से आगे बढ़ा रहा है।
      Insurance underwriting में बहुत सारे documents चाहिए होते हैं, इसलिए Corgi हर महीने DocSend पर हज़ारों dollars खर्च कर रहा था। किसी कारण से, लगता है Corgi ने 12 लोगों की टीम बनाकर अपना DocSend alternative, Dataroom, तैयार किया। और फिर Corgi ने इसे 10 dollar प्रति माह से शुरू होने वाले सस्ते DocSend के रूप में position करके, पहले से भरे हुए बाज़ार में एक SaaS product बनाने का फ़ैसला किया।
      Papermark ने तुरंत नोटिस किया कि Corgi का Dataroom उसके open source product जैसी ही बहुत-सी wording और structure इस्तेमाल कर रहा है। इसलिए Papermark ने निष्कर्ष निकाला कि Corgi ने बिना attribution दिए Papermark का काम उठा लिया। Corgi इससे इनकार करता है और कहता है कि दोनों products के बीच शब्द-स्तर तक मेल होना महज़ संयोग है।
      एक और YC startup, Delve, Corgi पर जिस चीज़ का शक है उससे भी कहीं ज़्यादा काम वास्तव में करते पकड़ा गया था, और उसे YC से निकाल दिया गया था
  • मेरी नज़र में उसकी दलील मोटे तौर पर दो बातें हैं

    1. developer ने manually code copy नहीं किया
    2. एक ही क्षेत्र के सारे software एक-दूसरे की नकल करते हैं
      लेकिन यहाँ सबसे बड़ा संकेत दोनों products का एक जैसा layout और wording है। LLM को “यह product लिखो और उसकी 1:1 copy बनाओ” कहना भी सामान्य समझ के हिसाब से अब भी copying ही है। यह कहना कि कुछ भी copy नहीं किया गया, समझ से परे है
    • ऊपर-ऊपर से दोनों ShadCN boilerplate जैसे दिखते हैं: https://ui.shadcn.com/blocks
      ShadCN सबसे लोकप्रिय design systems में से एक है, जिसे AI 90% से ज़्यादा बार अपने-आप चुन लेता है, और lovable जैसे platforms में भी यह लगभग default है
    • लगता है यही Google v. Oracle का मूल मुद्दा था
      Google ने API को copy किया, लेकिन implementation को clean room रखा, और अंत में इसे स्पष्ट रूप से fair use माना गया। अगर API reimplementation जैसे सख़्त मामले पर fair use लागू हो सकता है, तो UI या layout copying जैसे कहीं ज़्यादा धुंधले मामलों पर भी इसे लागू माना जा सकता है
    • उसका दावा यही है कि code copy नहीं किया गया
  • समझ नहीं आता लोग अभी भी पहले वाले Twitter को इतनी गंभीरता से क्यों इस्तेमाल करते हैं

  • भले ही उन्होंने जैसा कहा वैसा code copy-paste न किया हो, फिर भी असल में हो सकता है कि LLM ने repository crawl करने के नतीजों के आधार पर वही code दोबारा बना दिया हो और license का सम्मान न किया हो
    यह अदालत के फ़ैसले के लिए एक अच्छा civil case बन सकता है। उनका बचाव कुछ ऐसा लगता है: “हमने तो बस LLM से आपका काम reproduce करने को कहा था, इसलिए code ‘हमने’ copy नहीं किया।” इसमें बुरी गंध आती है

  • समस्या वाला लाइसेंस: https://github.com/papermark/papermark?tab=License-1-ov-file
    यह AGPL है, और मूल रूप से इसका मतलब है कि अगर यूज़र नेटवर्क के ज़रिए भी software के साथ interact करते हैं, तब भी source code सार्वजनिक करना पड़ता है। उस code का इस्तेमाल करने वाला project भी AGPL होना चाहिए।
    इसे अलग करके bypass करने के तरीके होते हैं। उदाहरण के लिए, सिर्फ AGPL auth server इस्तेमाल करने का मतलब यह नहीं कि business logic वाला code भी उससे प्रभावित होना ही चाहिए।
    खासकर अगर पहले के विवाद देखे गए हों, तो product को license के मुताबिक design करने का तरीका निकाला जा सकता था।
    लेकिन यह बात इस मानकर कही जा रही है कि सच में code copy किया गया था, और हमें यह पक्का नहीं पता। यह काफ़ी मिलता-जुलता दिखता है, लेकिन इसे कैसे enforce किया जाएगा, यह साफ़ नहीं है

    • enforce करने के लिए शायद मुकदमा करना पड़े, और यह शायद सिर्फ Corgi की समस्या से भी बड़ा मामला होगा
      ऐसे models से जुड़े copyright मुद्दे वाकई पूरी तरह बिखरे हुए हैं
  • tech industry चोरी को normal बनाकर उसे innovation कहने के लिए कुछ भी करेगी

  • बिल्कुल typical YC startup वाला रवैया