TSAC - Low Bitrate ऑडियो कंप्रेशन तकनीक
(bellard.org)- FFMPEG/QEMU बनाने वाले Bellard का नया प्रोजेक्ट
- TSAC एक ऑडियो कंप्रेशन यूटिलिटी है, जो 44.1kHz पर mono 5.5kb/s या stereo 7.5kb/s जैसे बेहद कम bitrate तक पहुँचते हुए भी अच्छी ऑडियो गुणवत्ता प्रदान करती है
- TSAC 3.5 मिनट लंबे stereo गाने को 192KiB आकार की फ़ाइल में कंप्रेस कर सकता है
- तेज़ संचालन के लिए Nvidia GPU की आवश्यकता होती है, हालांकि केवल CPU भी समर्थित है, लेकिन इसकी गति धीमी रहती है
तकनीकी जानकारी
- TSAC stereo तक विस्तारित Descript Audio Codec के एक संशोधित संस्करण और कंप्रेशन रेशियो को और बढ़ाने के लिए Transformer मॉडल पर आधारित है। दोनों मॉडलों को प्रति parameter 8-bit पर quantize किया गया है
- Transformer मॉडल का मूल्यांकन deterministic और reproducible तरीके से किया जाता है, इसलिए परिणाम सटीक GPU या CPU मॉडल या कॉन्फ़िगर किए गए thread की संख्या पर निर्भर नहीं करते। यानी कंप्रेस की गई फ़ाइलों को अलग-अलग hardware या software configuration का उपयोग करके decompress किया जा सकता है.
5 टिप्पणियां
होमपेज देखकर लगा कि इन्होंने कुछ समय के लिए LLM में भी रुचि ली थी;;;; ऐसा व्यक्ति ऐसी latest तकनीक? यह सोचते हुए फिर लगा कि AI ही सच में मुख्यधारा है।
पहले मैंने जिस राक्षसी प्रतिभा वाले शख्स Fabrice Bellard के बारे में लिखा था, उसका परिचय अपडेट करूं तो..
Fabrice Bellard
1989 में LZEXE विकसित किया
1996 में Harissa - Java Virtual Machine और Java to C code compiler
1997 में बाइनरी notation में π के किसी विशेष digit का मान निकालने का सूत्र प्रकाशित किया।
-> बिना शुरुआती अंकों की बिल्कुल भी गणना किए निकालने का तरीका। 1 ट्रिलियनवां अंक "1"
https://en.wikipedia.org/wiki/Bellard%27s_formula
1998 में TinyGL जारी किया - छोटा और embeddable OpenGL implementation
2000 में FFMpeg जारी किया। आज हम जो ज़्यादातर video players देखते हैं, वे इसका उपयोग करते हैं।
2000 में सबसे बड़ा prime number खोजने वाले 448-byte C code से IOCCC जीता। यह prime 2016 तक खोजा गया सबसे बड़ा prime था।
2001 में Tiny C Compiler जारी किया - अति-हल्का C compiler
2002 में QEmacs जारी किया - अति-हल्का Emacs clone। HTML/XML/CSS2 WYSIWYG rendering और editing संभव (अपना browser engine built-in)
2003 में QEMU जारी किया - hardware virtualization सुविधाओं वाला CPU emulator
2004 में TinyCC Boot Loader जारी किया - Linux kernel को सीधे compile करके boot करने वाला bootloader
2005 में DVB-T signal generator जारी किया : महंगे transmitter की जगह desktop पर digital TV transmission संभव। इसका source code सार्वजनिक नहीं किया गया
2009 में π के दशमलव के बाद 2.7 ट्रिलियन अंकों तक गणना करके विश्व रिकॉर्ड बनाया। कहा जाता है कि उसने अपने desktop पर 131 दिनों तक गणना की।
-> बड़े numbers में दिलचस्पी से ज़्यादा, यह सिर्फ computer programming challenge के लिए था।
2011 में JSLinux जारी किया। web browser में चलने वाला Linux जारी किया।
2019 में QuickJS JavaScript Engine छोटा, तेज़ और embeddable JavaScript engine जारी किया
2022 में gpt2tc(GPT-2) का उपयोग करके बनाया गया SaaS TextSynth सार्वजनिक किया
इसके अलावा JPG से बेहतर compression ratio वाला HEVC-आधारित image format BPG भी बनाया (JavaScript decoder दिया गया ताकि किसी भी browser में इस्तेमाल हो सके)
4G LTE/5G NR base station को PC-आधारित रूप में कम लागत पर implement किया, और इसे अपनी कंपनी Amarisoft के जरिए commercialize भी किया
ऐसा इंसान कि जो भी करता है, उसे देखकर बस यही हैरानी होती है कि ये सब एक ही व्यक्ति कैसे कर सकता है।
वाह..
कभी HN पर इस व्यक्ति के बनाए कोड के बारे में एक पोस्ट में...
किसी ने पूछा, 'क्या Bellard यहाँ (HN) पर पोस्ट नहीं करता?' तो जवाबों में कुछ ऐसा था, 'इतना productive आदमी क्या यहाँ आकर लिखता बैठेगा' ... हा हा
वाकई कमाल का इंसान है....
Hacker News राय
सारांश:
Codec2जैसे और भी कम bitrate को support करने वाले codecs के साथ तुलना जानने की उत्सुकता है।