Claude Science सार्वजनिक बीटा
(claude.com)- Claude Science एक सार्वजनिक बीटा ऐप है, जिसे life sciences शोधकर्ताओं के लिए बनाया गया है ताकि वे analysis चलाने, database search, data preprocessing और results लिखने तक का काम एक ही workbench में जारी रख सकें
- चित्र, tables और notebooks generated code, execution environment और conversation history को साथ में रखते हैं, ताकि बाद में उन्हें reproduce, modify और verify किया जा सके
- यह local notebook, Linux मशीन, HPC login node और cloud VM पर चलता है, और SSH, Slurm व Modal के जरिए job submission और management को support करता है
- यह genomics, single-cell, proteomics, structural biology और cheminformatics के लिए है, और 60 से अधिक scientific databases व NVIDIA BioNeMo tools से connect हो सकता है
- macOS और Linux पर Pro, Max, Team, Enterprise plans के साथ उपलब्ध है, लेकिन beta app होने के कारण organization deployment से पहले documentation review और admin settings की जरूरत है
वैज्ञानिक शोध के लिए Claude workbench
- Claude Science नया model नहीं, बल्कि public beta app है, और यह user के plan में शामिल मौजूदा Claude models का उपयोग करता है
- नया जोड़ा गया हिस्सा Claude के आसपास scientific tools, database connections और compute integration है, जिससे user अपने infrastructure पर पूरा analysis चला सकता है
- यह macOS और Linux के लिए उपलब्ध है, और page पर हर operating system के लिए download की जानकारी दी गई है
- लक्ष्य scientific databases, research tools, ELN, protein और structure models, व HPC को एक research workbench में जोड़ना है
Reproducible outputs और review flow
- Claude Science proteins, structures, molecules आदि को natively देखने की सुविधा देता है, और results को generated code तक trace किया जा सकता है
- चित्रों, tables और notebooks के साथ यह जानकारी भी save होती है
- result बनाने वाला exact code
- execution environment
- result बनाने वाली conversation
- Save किए गए outputs को कई महीनों बाद भी reproduce, edit और defend किया जा सकता है
- proteins, alignments, genome tracks, chemical structures और PDFs को बिना अतिरिक्त installation के native format में देखा जा सकता है
- Background reviewer गलत citations, trace न किए जा सकने वाले numbers, और underlying code से मेल न खाने वाले figures को flag करता है
- User figure पर annotation लगाकर corrections या questions मांग सकता है, और agent उस figure को बनाने वाला code पढ़कर सीधे modification करता है
- Analysis results लिखते समय rendered Markdown और LaTeX preview देखा जा सकता है
Compute और execution environment
- हर analysis के लिए जरूरी execution environment को manage करता है, और execution location notebook, Linux मशीन या HPC login node हो सकता है
- Batch script लिखने के बाद user की machine या HPC cluster पर SSH से submit/manage कर सकता है, या Modal account से jobs चला सकता है
- Installation location को data वाली जगह के हिसाब से तय किया जा सकता है
- notebook
- lab की Linux मशीन
- HPC login node
- cloud VM
- Browser से connect करके इस्तेमाल किया जा सकता है
- Jobs local kernel, SSH के जरिए Slurm cluster, और Modal account पर चलती हैं
- Variables, dataframes और loaded models पूरे analysis के दौरान memory में बने रहते हैं, जिससे repetitive काम तेजी से हो पाते हैं
Life sciences domains के हिसाब से काम
- Claude Science genomics, single-cell, proteomics, structural biology, cheminformatics आदि को support करता है, literature पढ़ सकता है और 60 से अधिक scientific databases query कर सकता है
- प्रमुख उपयोग के उदाहरण ये हैं
- Single-cell RNA-seq analysis: पूरे tissue के लाखों cells को cluster और annotate करना, surface marker genes ढूंढना, और हर figure को generated code तक trace करना
- Phylogenetic और evolutionary analysis: ortholog alignment, maximum-likelihood tree inference, और functional residues की phylogenetic mapping को एक reproducible session में करना
- Protein structure और language model work: predicted structures लाना, domains और clinical variants overlay करना, फिर 3D में interactively explore करना
- Cheminformatics और molecular design: bioactivity data search करना, properties और similarity calculate करना, और 2D sketcher में structures draw या refine करना
- Pipelines को reusable skill के रूप में save किया जा सकता है, और lab के preferred tools को connector से जोड़कर बाद के sessions में automatically इस्तेमाल किया जा सकता है
- यह पूरी तरह sourced indication dossier देता है, और हर program के evidence को बनाने वाले skill sets को expand किया जा रहा है
मौजूदा lab stack से connection
- Connector internal APIs, ELN और custom pipelines को workflow में लाते हैं, ताकि Claude Science lab के मौजूदा tools के साथ काम करे
- मौजूदा Python, R, shell workflows को शुरू से दोबारा बनाने की जरूरत नहीं; उन्हें पढ़ा, चलाया और expand किया जा सकता है
- Scientific tools, platforms और domain-specific open models को skill या connector के रूप में plug in किया जा सकता है
- Claude Science किसी specific tool को replace करने के बजाय specialist tools को साथ काम कराने वाला integrated workbench है
Models, tools और data connections
- एक general AI assistant द्वारा biology पर चर्चा करने के स्तर से आगे बढ़कर, Claude Science pipeline execution, scientific database exploration, cluster jobs orchestration और पुराने session records tracking को support करता है
- App में genomics, single-cell, proteomics, structural biology, cheminformatics आदि के लिए analysis specialists शामिल हैं
- Domain-specific open models और 60 से अधिक scientific databases से natively connect किया जा सकता है
- NVIDIA के BioNeMo Agent Toolkit skill का उपयोग करके BioNeMo के life sciences models और libraries से connect करता है
- शामिल उदाहरण Evo 2, Boltz-2, OpenFold3 हैं
Data location और verification
- Claude Science app user के infrastructure पर चलता है, और raw datasets व compute local रहते हैं
- Prompts और model responses में शामिल content Anthropic की standard retention policy के अनुसार handle किया जाता है
- Team-specific requirements को sales inquiry के जरिए discuss किया जा सकता है
- सभी outputs में यह जानकारी शामिल होती है
- generation में इस्तेमाल किया गया exact code
- execution environment
- किए गए task का plain-language description
- result तक ले जाने वाली conversation
- Background reviewer result दिखाए जाने से पहले उन claims को flag करता है जिन्हें evidence तक trace नहीं किया जा सकता
Plans, lab discounts और enterprise deployment
- Claude Science macOS और Linux पर Pro, Max, Team, Enterprise plans में उपलब्ध beta app है
- Team और Enterprise users के लिए admin को पहले इसे activate करना होगा
- Labs के लिए discount Claude Team plan for research labs में Claude Science app access शामिल है
- Eligible users academic institutions और non-profit research institutions की active scientific labs हैं
- Biomedical और basic science labs के साथ chemistry, mathematics, computer science, physics जैसी hard sciences priority में शामिल हैं
- Eligibility lab principal investigator के जरिए verify की जाती है
- For-profit companies, contract research organizations और industrial R&D teams को Team and Enterprise plans देखना चाहिए
- Enterprise plan SSO, SCIM provisioning, custom roles और usage analytics देता है
- Beta status के कारण admins को deployment से पहले documentation review करना चाहिए
- Documentation installation, tools और compute connection, Team और Enterprise admin settings को cover करती है
1 टिप्पणियां
Hacker News की राय
मैंने Biomni HPC बनाया है, जो इस रिलीज़ में शामिल connected tools में से एक है, और मैं इस समस्या पर काफ़ी लंबे समय से लगा हुआ हूं। मैंने Anthropic में भी काम किया है, लेकिन इस product की ज़िम्मेदारी मेरी नहीं थी
बाकी comments की तरह, यह data science के लिए है, लेकिन यह सिर्फ़ graphs बनाने और papers लिखने से ज़्यादा काम कर सकता है। यह शोधकर्ता के institution cluster सहित कई databases और compute tools के साथ integrate होता है
सिर्फ़ यही अपने आप में बहुत valuable है। Bio startup में इस समस्या से जूझने के बाद मैंने startup शुरू किया था, और इस तरह के tools और database integration मुश्किल और समय लेने वाले होते हैं। अगर इस product का नतीजा सिर्फ़ LLMs के लिए बेहतरीन API बनाना भी हो, तो भी इसका बड़ा सकारात्मक असर होगा। Computational genomics में इस्तेमाल होने वाले कई databases आज भी सिर्फ़ FTP के ज़रिए accessible हैं
LLMs ऐसे tools और databases को explore करने के लिए खास तौर पर उपयुक्त हैं। बहुत specialized, लेकिन context में सीखी गई skills से handle किए जा सकने वाले कई simple tasks होते हैं। पुराने customers रहे bioinformaticians को LLMs से इस समस्या को हल करने की शुरुआती कोशिशें करते देखकर ही मैं 2024 में Anthropic से जुड़ा
साथ ही, यह pattern मूल रूप से सिर्फ़ data science तक सीमित नहीं है। कुछ science domains में इसे wet labs या CROs के साथ भी integrate किया जा सकता है, और अभी मैं इसी पर समय लगा रहा हूं
इस तरह की science हर चीज़ हल नहीं करेगी, लेकिन कुछ क्षेत्रों में उपयोगी है। उदाहरण के लिए, कई rare disease research में प्रगति मूल breakthrough की कमी से ज़्यादा researcher attention bottleneck की वजह से धीमी होती है
https://x.com/phylo_bio/article/2029233694775624096
तुलना के लिए, OpenAI का science product Prism असल में Crixet acquisition से मिला LaTeX editor जैसा ही था
Institutional policies, लागू laws, NIH data repositories जैसी data access और storage requirements को पूरा करना पड़ता है, और institution और AI provider के बीच legal agreements भी ज़रूरी हो सकते हैं। कम से कम अभी तो यह हाथ डालने में कठिन है
अगर रुचि हो तो बात कर सकते हैं
यहां सबसे दिलचस्प बात यह है कि Claude Science एक local server और browser में उस server से connect होने वाला web-based UI चलाता है
यह Claude Code या Cowork जैसी संरचना से काफ़ी अलग है, जहां UI host machine से ज़्यादा strongly coupled होता है और computer use जैसी capabilities संभव होती हैं
Strategy शायद समझी जा सकती है। Interesting data से जुड़े ज़्यादातर pharma environments बहुत tightly locked down होते हैं, इसलिए MacBook को source data से बस यूं ही connect नहीं किया जा सकता
इसी तरह UK Biobank या NIH All of Us जैसे बड़े genomic biobank datasets तक access सिर्फ़ Trusted Research Environment (TRE) नाम के remote data analysis platform के ज़रिए allowed होता है, और आम तौर पर internet access भी restricted होता है। Desktop app चलाना आसान नहीं है, लेकिन ऐसे environments अक्सर JupyterLab या VS Code चलाने और UI को end user तक tunnel करने के तरीके को support करते हैं। All of Us TRE बनाने वाली team को मैंने पहले lead किया था
Claude Science को सब कुछ करने वाले Claude mega app की बजाय, ऐसे restricted data environments के अंदर server चलाकर सिर्फ़ UI को user browser तक proxy करने के रूप में कल्पना करना आसान है। Pharma R&D environment में adoption के लिए यह बात अहम होगी
हालांकि RStudio, JupyterLab, VS Code रोज़ इस्तेमाल करने वाले mid-level computational scientists के लिए Claude Science काफ़ी अनजान तरह का product हो सकता है। यह existing data science workbench tools को replace करेगा, साथ में इस्तेमाल होगा, या आखिरकार उन्हें wrap करने वाला रूप लेगा—यह देखने लायक होगा
मैं एक geology company में data analyst हूं और interesting sensor data पर काम करता हूं। जब quick analysis या visualization चाहिए होता है, तो Claude वह code कुछ मिनटों में लिख देता है जिसे साफ़-सुथरा करने में मुझे लगभग एक घंटा लगता। Relevant libraries की पर्याप्त समझ होना ताकि code पढ़कर verify किया जा सके—यह black-box AI को आंख मूंदकर इस्तेमाल करने से एक अहम अंतर है
हालांकि अभी Claude Code और VS Code का Jupyter अच्छे से मेल नहीं खाते। Claude हर बार edit करते समय पूरे notebook को शुरू से फिर से चलाने पर मजबूर कर देता है। इसलिए मैं notebooks से थोड़ा पीछे हटकर Claude से independent scripts लिखवा रहा हूं, और बाद में उन्हें सुंदर notebooks में वापस जोड़ने में समय लगाता हूं
अगर Mac से connect नहीं किया जा सकता, तो server से agent के requests भेजने की अनुमति भी शायद नहीं होगी
मैंने इसे अपने क्षेत्र, RNAi-आधारित जैव-कीटनाशकों के computational design में आज़माकर देखा
मैंने इससे western corn rootworm के DvSnf7 transcript को target करने वाला design एक ही बार में बनवाया, और approach काफ़ी naive थी। यह PhD के पहले वर्ष के छात्र जैसी पद्धति थी, लेकिन काम उसने कर दिया
इसने सीमाएँ भी साथ में बताईं, जैसे mammalian design rules इस्तेमाल करना या off-target checking का सीमित होना। बहुत खराब नहीं, लेकिन शानदार भी नहीं। जब मैंने खामियाँ बताईं, तो AI ने माना कि वह बेहतर जानकारी के साथ approach कर सकता था। उसके बाद Opus 4.8 safety system ने session को flag कर दिया
मेरा सुझाव है कि इस विषय के 10 key papers और broad field की 10 textbooks इकट्ठा करें, उन्हें OCR या text extraction से plain text में बदलें, और omp.sh जैसे बेहतर agent harness के साथ वही काम करके देखें
/goal set create biopesticide targeting the DvSnf7 transcript of western corn rootwormगलती मत करना
“Science” सुनकर मैंने नहीं सोचा था कि इसका मतलब data science होगा, लेकिन pandas code और graphs से भरा UI वैसा ही दिखता है
भले ही focus scientific fields पर हो, यह Jupyter Notebook 2.0 जैसा दिखता है—इसे देखते हुए, घोषणा का यह शायद कम valuable हिस्सा हो सकता है
data visualization को image के रूप में समझने वाले use cases को अब तक नज़रअंदाज़ किया गया है, और नए LLMs सही exploratory data analysis में भी लगातार बेहतर हो रहे हैं। फिर भी शायद मुझे अपना résumé update करना पड़े
मैंने जो देखा है, उसके आधार पर math, physics, biology और linguistics वालों के लिखे code की तुलना में मैं किसी भी दिन Claude द्वारा generated code चुनूँगा। मैंने Claude को data analysis में बहुत बड़ी गलतियाँ करते भी देखा है, लेकिन यह शायद पहले से coding करने वाले अधिकांश academics से अधिक भरोसेमंद हो सकता है
कौन-सा science है, यह toolchain नहीं बल्कि किस चीज़ पर काम हो रहा है, उससे तय होता है
LLMs से पहले, जिन technical groups को मैं follow करता था, वे सक्रिय रूप से चर्चा करते थे कि किस विषय का कब और किस काम में उपयोग होना चाहिए, और मुझे लगता है कि ऐसी चर्चाओं ने “ठीक-ठाक idea लगता है, implement करने में नुकसान नहीं” वाले अंदाज़ में कई frameworks और tools को जन्म दिया
दुर्भाग्य से आजकल सब कुछ LLMs के इर्द-गिर्द घूमता है, और बात बस किसी न किसी तरह LLMs को चलाने की होती है। जिन विषयों पर चर्चा करने के लिए वे groups मूल रूप से बने थे, उन पर लगभग बात ही नहीं होती
डर है कि science के साथ भी जल्द यही होगा। जिन topics पर वास्तव में चर्चा होनी चाहिए, उनकी जगह LLM talk ले सकता है
अगर मौजूदा assets का किसी तरह इस्तेमाल नहीं हुआ, तो return on invested capital अच्छा दिखने वाला नहीं है
यह समर्थन में तर्क नहीं है; मतलब सिर्फ इतना है कि अंततः management को उन shareholders को जवाब देना होता है जो ऐसे return metrics देखते हैं
इस announcement की वजह से लगता है Claude Desktop for Linux खुल गया है: https://code.claude.com/docs/en/desktop-linux
मैंने मिलते-जुलते tools इस्तेमाल किए हैं और वे impressive तो हैं, लेकिन LLM बहुत बार fake लेकिन plausible data बना देता है और उसे असली की तरह पेश करता है
इसमें काफी गहरे स्तर की manipulation भी शामिल होती है—यह mock database connectors तक set up कर देता है ताकि लगे कि data सही जगह से आ रहा है, जबकि असल में synthetic data इस्तेमाल हो रहा होता है
जानना चाहूँगा कि यह product इसे कैसे रोकता है
bioscience की तरफ जाएँ तो क्या यही वह company नहीं थी जो LLM को depraved model जैसा बना रही थी?
क्या यह science के लिए Claude Cowork जैसा कुछ है, यानी तकनीक में कम familiar users के लिए product?
coding background वाले scientists शायद बस Claude Code को सामान्य रूप से इस्तेमाल करना और उसे अपनी चुनी हुई stack के साथ integrate करना पसंद करेंगे, लेकिन Claude Science की comfort और usability अंततः जीत सकती है
मैं आसानी से imagine कर सकता हूँ कि मेरी पुरानी national lab वाली team इसे systems में integrate कर ले और Claude Code इस्तेमाल करना बिल्कुल छोड़ दे
लगता है इसका नाम Claude-bio-big-bucks होना चाहिए
earth science, physics और engineering का क्या? connectors और tech सब biology और pharma side के ही हैं
Trump से पहले के मानक पर NSF का annual budget लगभग 6–8 billion dollars था, और NIH का annual budget लगभग 50 billion dollars था। फर्क यही है