Nico के dataroom पर Papermark code की चोरी का आरोप
(twitter.com/mfts0)- यह सार्वजनिक आरोप सामने आया है कि Nico का dataroom product उसका खुद का बनाया हुआ न होकर Papermark के open source और enterprise license code से लिया गया लगता है
- मुख्य विवाद copyright और license उल्लंघन को लेकर है, और आरोप लगाने वाले ने product को तुरंत हटाने की मांग की है
- इस मामले को “तेज़ी से आगे बढ़ो और चीज़ें तोड़ो” वाला रवैया नहीं, बल्कि fraud के ज्यादा करीब बताया गया है
- यह भी कहा गया है कि इस product विवाद की वजह से Nico के बाकी business पर भी शक फैल सकता है
- Garry Tan, Jared Friedman, Y Combinator को साथ में tag किया गया, जिससे मामला YC community की reputation तक फैल गया
Papermark code चोरी का आरोप
- सार्वजनिक रूप से यह आरोप लगाया गया है कि Nico का dataroom product in-house develop नहीं किया गया, बल्कि Papermark के open source और enterprise license code से लिया हुआ लगता है
- आरोप लगाने वाले का कहना है कि इसे सिर्फ तेज़ product development या “vibe coding” मानना मुश्किल है, और इसमें copyright व license infringement की संभावना दिखती है
- मांगें स्पष्ट हैं
- इस product को तुरंत हटाया जाना चाहिए
- अगर उल्लंघन सच है, तो इसे साधारण गलती से अधिक गंभीर कृत्य माना जा सकता है
आलोचना का फैलाव
- आलोचना सिर्फ Nico के dataroom product तक सीमित नहीं है, बल्कि उसके बाकी business की विश्वसनीयता पर भी सवाल उठाती है
- Garry Tan, Jared Friedman, Y Combinator को tag किए जाने से यह व्यक्तिगत विवाद से आगे बढ़कर YC community की reputation से भी जुड़ गया है
- अभी सार्वजनिक जानकारी में मुख्य रूप से आरोप और मांगें ही सामने हैं; अतिरिक्त verification या rebuttal उपलब्ध नहीं है
1 टिप्पणियां
Hacker News प्रतिक्रियाएँ
अगर किसी वेबपेज का स्क्रीनशॉट Figma Make जैसे टूल में डालें, तो काफ़ी मिलता-जुलता क्लोन बनाया जा सकता है
स्क्रीनशॉट से ठीक वैसा ही एहसास आता है, बहुत समान है लेकिन पूरी तरह एक जैसा नहीं। टेक्स्ट भी काफ़ी हद तक वही है, शायद इसी वजह से। कॉपी री-राइट तक generative text tool से न करवाना बस लापरवाही लगता है
दूसरे Twitter कमेंट्स देखें तो लगता है शायद AI से Papermark को कॉपी करने को कहा गया था
AI कमेंट में ऐसे निशान हैं कि पेज को “reference” के हिसाब से align किया गया था
https://xcancel.com/ffumarola/status/2070479755892371713#m
उनका जवाब यह था:
अगर Nico सच में “हमने code कॉपी नहीं किया” को एक उचित बचाव मानता हो, तो मुझे ज़रा भी हैरानी नहीं होगी। यह उसके लिए किसी साफ़ नियम जैसा लगता होगा, और चरम किस्म के “shape rotator” लोग अक्सर क़ानून जैसे क्षेत्रों की धुंधलाहट से जूझते हैं। असल में copyright infringement भी अश्लीलता की पहचान वाले मानक जैसा है: देखकर अक्सर समझ आ जाता है
कहीं उसने यह भी दावा किया था कि यह कंपनी/industry दुनिया में AI का सबसे महत्वपूर्ण application area है। मुझे ज़रा भी शक नहीं कि इन्होंने कॉपी किया है, और कम से कम यह भरोसेमंद लोग नहीं हैं
https://x.com/nico_laqua/status/2061130574358773852?s=20
अगर इन्होंने यह किसी ऐसी कंपनी के साथ किया होता जो मुकदमा करने में ज़्यादा आक्रामक हो, तो इन पर केस होने की संभावना काफ़ी होती, और जीत-हार भी शायद 50-50 रहती। इसे रचनात्मक/कलात्मक तत्वों की कॉपी माना जाएगा या सिर्फ़ काम करने के तरीके की नकल, यह कहना मुश्किल है, लेकिन functionality कॉपी करना भले ठीक हो, पूरा user experience उठा लेना जल्दी ही copyright infringement बन जाता है
और copy भी, अगर आप एक वास्तविक data room solution बना रहे हैं, तो काफ़ी हद तक अपेक्षित और मानक तरह की लगती है
क्या कोई इस थ्रेड का थोड़ा और बैकग्राउंड समझा सकता है? मुझे बिल्कुल नहीं पता Nico कौन है, Papermark क्या है और क्या करता है
अलग बात यह है कि ऐसा लगता है लोग अब सिर्फ मौजूदा solutions या projects को vibe coding से दोहराने तक सीमित नहीं हैं, बल्कि open source code को “चुराकर” open source की नैतिक, ethical और कानूनी शर्तों का पालन किए बिना मनमाने ढंग से इस्तेमाल करने के और भी आदी होते जा रहे हैं। पहले से ज़्यादा जगहों पर open source उल्लंघन बढ़ते दिख रहे हैं, लेकिन कोई बड़ा कानूनी नतीजा नहीं दिखता
ऊपर से, सिर्फ AI के सहारे आए नए developers में से काफ़ी लोग यह या तो समझते नहीं हैं या परवाह नहीं करते कि FOSS का मतलब free as in beer नहीं, बल्कि freedom है।
मैं hardware audio samplers की binary data files को parse करने वाली एक GPL3 library पर काम करता हूँ। किसी ने मेरी library के ऊपर एक app बनाया जो कई काम कर सकता था, और उसने GPL3 license का पालन भी किया।
लेकिन हाल में किसी ने उस app की पूरी vibe-coded copy बना दी, और उसके साथ website और लगभग 60 dollar का खरीद लिंक भी डाल दिया। रंग अलग थे, लेकिन UI बिल्कुल वही था; यह इतनी बेशर्म copy थी, और GPL3 की शर्तों का ज़रा भी पालन नहीं किया गया था। Moderators ने पोस्ट को सूची से हटा दिया और copy app के developer को ban कर दिया, और forum community ने मूल app developer का साथ दिया। DMCA takedown request भी भेजी गई, और कुछ दिनों बाद वह copy site हट गई।
मूल app developer किस्मत वाला था कि उस manufacturer से जुड़े posts के लिए असल में सिर्फ एक ही बड़ा forum है, और moderators को भी AI वाली चीज़ें पसंद नहीं थीं। विडंबना यह है कि मूल app developer ने भी अपना सारा काम vibe coding से ही किया था। अगर वह forum और उसके moderators न होते, तो मूल app developer भी और GPL3 library maintainer के रूप में मैं भी, सच कहूँ तो बर्बाद हो गए होते।
केंद्रीकरण के अपने फ़ायदे हैं। उसके बिना, सबके private source की तरफ लौट जाने के अलावा, या फिर दूसरों के काम का सम्मान करने पर ज़ोर डालने वाला कोई बड़ा जन-आंदोलन खड़ा होने के अलावा, कोई और विकल्प नज़र नहीं आता। अब तक हम प्रतिष्ठा और community backlash वाली व्यवस्था पर टिके हुए थे
कंपनियाँ अब हर चीज़ करके बच निकलने की आदी हो गई हैं। “move fast and break things” पहले tech के बारे में कहा जाता था, लेकिन अब यह क़ानून के प्रति रवैया बन गया है। Uber ने इस प्रवृत्ति को लोकप्रिय बनाया, और अब सब वही कर रहे हैं। AI का copyright law तोड़ना भी उसी प्रवाह का हिस्सा है।
क़ानून हारने वालों के लिए होते हैं — इस सोच की वजह से लगता है कि आगे कठिन समय आने वाला है
अब तो मान लेना चाहिए कि इंटरनेट पर हर चीज़ व्यावहारिक रूप से सबके लिए मनमाने ढंग से उठा लेने लायक हो गई है
क्योंकि निश्चित रूप से हारने का एकमात्र तरीका खेल में हिस्सा ही न लेना है
Papermark, DocSend का open source alternative है। इसे self-hosted या hosted दोनों तरह से इस्तेमाल किया जा सकता है, इसलिए यह DocSend की तुलना में बहुत ज़्यादा cost-effective है और काफ़ी लोकप्रिय है।
Corgi, YC-backed insurance startup है, जो दूसरे YC startups को insurance बेचता है। Nico उसका founder है। हाल ही में उसने लगभग 3 billion dollar valuation पर 100 million dollar जुटाए, और इस समय वह उन कंपनियों में से है जिन्हें YC विशेष रूप से आगे बढ़ा रहा है।
Insurance underwriting में बहुत सारे documents चाहिए होते हैं, इसलिए Corgi हर महीने DocSend पर हज़ारों dollars खर्च कर रहा था। किसी कारण से, लगता है Corgi ने 12 लोगों की टीम बनाकर अपना DocSend alternative, Dataroom, तैयार किया। और फिर Corgi ने इसे 10 dollar प्रति माह से शुरू होने वाले सस्ते DocSend के रूप में position करके, पहले से भरे हुए बाज़ार में एक SaaS product बनाने का फ़ैसला किया।
Papermark ने तुरंत नोटिस किया कि Corgi का Dataroom उसके open source product जैसी ही बहुत-सी wording और structure इस्तेमाल कर रहा है। इसलिए Papermark ने निष्कर्ष निकाला कि Corgi ने बिना attribution दिए Papermark का काम उठा लिया। Corgi इससे इनकार करता है और कहता है कि दोनों products के बीच शब्द-स्तर तक मेल होना महज़ संयोग है।
एक और YC startup, Delve, Corgi पर जिस चीज़ का शक है उससे भी कहीं ज़्यादा काम वास्तव में करते पकड़ा गया था, और उसे YC से निकाल दिया गया था
मेरी नज़र में उसकी दलील मोटे तौर पर दो बातें हैं
लेकिन यहाँ सबसे बड़ा संकेत दोनों products का एक जैसा layout और wording है। LLM को “यह product लिखो और उसकी 1:1 copy बनाओ” कहना भी सामान्य समझ के हिसाब से अब भी copying ही है। यह कहना कि कुछ भी copy नहीं किया गया, समझ से परे है
ShadCN सबसे लोकप्रिय design systems में से एक है, जिसे AI 90% से ज़्यादा बार अपने-आप चुन लेता है, और lovable जैसे platforms में भी यह लगभग default है
Google ने API को copy किया, लेकिन implementation को clean room रखा, और अंत में इसे स्पष्ट रूप से fair use माना गया। अगर API reimplementation जैसे सख़्त मामले पर fair use लागू हो सकता है, तो UI या layout copying जैसे कहीं ज़्यादा धुंधले मामलों पर भी इसे लागू माना जा सकता है
समझ नहीं आता लोग अभी भी पहले वाले Twitter को इतनी गंभीरता से क्यों इस्तेमाल करते हैं
भले ही उन्होंने जैसा कहा वैसा code copy-paste न किया हो, फिर भी असल में हो सकता है कि LLM ने repository crawl करने के नतीजों के आधार पर वही code दोबारा बना दिया हो और license का सम्मान न किया हो
यह अदालत के फ़ैसले के लिए एक अच्छा civil case बन सकता है। उनका बचाव कुछ ऐसा लगता है: “हमने तो बस LLM से आपका काम reproduce करने को कहा था, इसलिए code ‘हमने’ copy नहीं किया।” इसमें बुरी गंध आती है
समस्या वाला लाइसेंस: https://github.com/papermark/papermark?tab=License-1-ov-file
यह AGPL है, और मूल रूप से इसका मतलब है कि अगर यूज़र नेटवर्क के ज़रिए भी software के साथ interact करते हैं, तब भी source code सार्वजनिक करना पड़ता है। उस code का इस्तेमाल करने वाला project भी AGPL होना चाहिए।
इसे अलग करके bypass करने के तरीके होते हैं। उदाहरण के लिए, सिर्फ AGPL auth server इस्तेमाल करने का मतलब यह नहीं कि business logic वाला code भी उससे प्रभावित होना ही चाहिए।
खासकर अगर पहले के विवाद देखे गए हों, तो product को license के मुताबिक design करने का तरीका निकाला जा सकता था।
लेकिन यह बात इस मानकर कही जा रही है कि सच में code copy किया गया था, और हमें यह पक्का नहीं पता। यह काफ़ी मिलता-जुलता दिखता है, लेकिन इसे कैसे enforce किया जाएगा, यह साफ़ नहीं है
ऐसे models से जुड़े copyright मुद्दे वाकई पूरी तरह बिखरे हुए हैं
tech industry चोरी को normal बनाकर उसे innovation कहने के लिए कुछ भी करेगी
बिल्कुल typical YC startup वाला रवैया