10 पॉइंट द्वारा xguru 2024-04-11 | 5 टिप्पणियां | WhatsApp पर शेयर करें
  • FFMPEG/QEMU बनाने वाले Bellard का नया प्रोजेक्ट
  • TSAC एक ऑडियो कंप्रेशन यूटिलिटी है, जो 44.1kHz पर mono 5.5kb/s या stereo 7.5kb/s जैसे बेहद कम bitrate तक पहुँचते हुए भी अच्छी ऑडियो गुणवत्ता प्रदान करती है
  • TSAC 3.5 मिनट लंबे stereo गाने को 192KiB आकार की फ़ाइल में कंप्रेस कर सकता है
  • तेज़ संचालन के लिए Nvidia GPU की आवश्यकता होती है, हालांकि केवल CPU भी समर्थित है, लेकिन इसकी गति धीमी रहती है

तकनीकी जानकारी

  • TSAC stereo तक विस्तारित Descript Audio Codec के एक संशोधित संस्करण और कंप्रेशन रेशियो को और बढ़ाने के लिए Transformer मॉडल पर आधारित है। दोनों मॉडलों को प्रति parameter 8-bit पर quantize किया गया है
  • Transformer मॉडल का मूल्यांकन deterministic और reproducible तरीके से किया जाता है, इसलिए परिणाम सटीक GPU या CPU मॉडल या कॉन्फ़िगर किए गए thread की संख्या पर निर्भर नहीं करते। यानी कंप्रेस की गई फ़ाइलों को अलग-अलग hardware या software configuration का उपयोग करके decompress किया जा सकता है.

5 टिप्पणियां

 
botplaysdice 2024-04-11

होमपेज देखकर लगा कि इन्होंने कुछ समय के लिए LLM में भी रुचि ली थी;;;; ऐसा व्यक्ति ऐसी latest तकनीक? यह सोचते हुए फिर लगा कि AI ही सच में मुख्यधारा है।

 
xguru 2024-04-11

पहले मैंने जिस राक्षसी प्रतिभा वाले शख्स Fabrice Bellard के बारे में लिखा था, उसका परिचय अपडेट करूं तो..

Fabrice Bellard

1989 में LZEXE विकसित किया

1996 में Harissa - Java Virtual Machine और Java to C code compiler

1997 में बाइनरी notation में π के किसी विशेष digit का मान निकालने का सूत्र प्रकाशित किया।
-> बिना शुरुआती अंकों की बिल्कुल भी गणना किए निकालने का तरीका। 1 ट्रिलियनवां अंक "1"
https://en.wikipedia.org/wiki/Bellard%27s_formula

1998 में TinyGL जारी किया - छोटा और embeddable OpenGL implementation

2000 में FFMpeg जारी किया। आज हम जो ज़्यादातर video players देखते हैं, वे इसका उपयोग करते हैं।

2000 में सबसे बड़ा prime number खोजने वाले 448-byte C code से IOCCC जीता। यह prime 2016 तक खोजा गया सबसे बड़ा prime था।

2001 में Tiny C Compiler जारी किया - अति-हल्का C compiler

2002 में QEmacs जारी किया - अति-हल्का Emacs clone। HTML/XML/CSS2 WYSIWYG rendering और editing संभव (अपना browser engine built-in)

2003 में QEMU जारी किया - hardware virtualization सुविधाओं वाला CPU emulator

2004 में TinyCC Boot Loader जारी किया - Linux kernel को सीधे compile करके boot करने वाला bootloader

2005 में DVB-T signal generator जारी किया : महंगे transmitter की जगह desktop पर digital TV transmission संभव। इसका source code सार्वजनिक नहीं किया गया

2009 में π के दशमलव के बाद 2.7 ट्रिलियन अंकों तक गणना करके विश्व रिकॉर्ड बनाया। कहा जाता है कि उसने अपने desktop पर 131 दिनों तक गणना की।
-> बड़े numbers में दिलचस्पी से ज़्यादा, यह सिर्फ computer programming challenge के लिए था।

2011 में JSLinux जारी किया। web browser में चलने वाला Linux जारी किया।

2019 में QuickJS JavaScript Engine छोटा, तेज़ और embeddable JavaScript engine जारी किया

2022 में gpt2tc(GPT-2) का उपयोग करके बनाया गया SaaS TextSynth सार्वजनिक किया

इसके अलावा JPG से बेहतर compression ratio वाला HEVC-आधारित image format BPG भी बनाया (JavaScript decoder दिया गया ताकि किसी भी browser में इस्तेमाल हो सके)

4G LTE/5G NR base station को PC-आधारित रूप में कम लागत पर implement किया, और इसे अपनी कंपनी Amarisoft के जरिए commercialize भी किया

ऐसा इंसान कि जो भी करता है, उसे देखकर बस यही हैरानी होती है कि ये सब एक ही व्यक्ति कैसे कर सकता है।

 
mdisprgm 2024-04-11

वाह..

 
botplaysdice 2024-04-11

कभी HN पर इस व्यक्ति के बनाए कोड के बारे में एक पोस्ट में...

किसी ने पूछा, 'क्या Bellard यहाँ (HN) पर पोस्ट नहीं करता?' तो जवाबों में कुछ ऐसा था, 'इतना productive आदमी क्या यहाँ आकर लिखता बैठेगा' ... हा हा

वाकई कमाल का इंसान है....

 
xguru 2024-04-11

Hacker News राय

सारांश:

  • Bellard के नए audio codec TSAC को लेकर काफी सकारात्मक प्रतिक्रियाएँ हैं। खासकर low bitrate पर इसका प्रदर्शन मौजूदा codecs की तुलना में बेहतर दिखता है।
  • TSAC की compressed files को नुकसान पहुँचाने पर दिलचस्प नतीजे सामने आते हैं। Fast mode और सामान्य mode की sound एक-दूसरे से अलग है।
  • real-time processing के लिए NVIDIA GPU की ज़रूरत होती है, और mobile devices पर decoding बोझिल हो सकती है। low-spec embedded systems में इसका उपयोग सीमित लग सकता है।
  • TSAC decoder की compressed file size 237MB होने पर हैरानी जताई गई। यह सवाल उठाया गया कि कहीं audio samples decoder में शामिल तो नहीं हैं।
  • Codec2 जैसे और भी कम bitrate को support करने वाले codecs के साथ तुलना जानने की उत्सुकता है।
  • DAC (TSAC का base codec) के developer की ओर से TSAC पर टिप्पणी आई। Transformer का इस्तेमाल कर किया गया सुधार दिलचस्प माना गया।
  • TSAC के काम करने का तरीका AI music generation models से मिलता-जुलता है। कुछ मॉडल tokens को language model में डालकर संगीत बनाते हैं, जबकि कुछ tokenization की जगह Diffusion models के लिए continuous representations देते हैं।
  • TSAC की deterministic और reproducible evaluation पद्धति को लेकर सवाल उठे। यह भी जिज्ञासा रही कि क्या इसमें Floating Point और concurrency का उपयोग होता है। AMD GPU पर port करने से deterministic behavior प्रभावित हो सकता है।
  • ज़्यादातर media compression तकनीकें low bitrate scenarios पर फोकस करती हैं। high bitrate पर सुधार कितना होगा, इसे लेकर जिज्ञासा है। उदाहरण के लिए 256kbps AAC की तुलना में 10Mbps पर AV1 का performance difference कितना है आदि.