AI के उपयोग और गणितीय क्षमता में गिरावट के बीच Berkeley CS कक्षाओं में फेल ग्रेड्स में तेज़ बढ़ोतरी
(dailycal.org)- Berkeley CS कक्षाओं में फेल रेट 2026 के वसंत में CS 10 में 35.3% और CS 61A में 10.6% रहा, जो पिछले सेमेस्टरों की तुलना में काफी अधिक था, और निचले-स्तर के कोर्सों में D·F अनुपात 7% तथा औसत GPA 2.8~3.3 वाली EECS गाइडलाइन से बाहर था
- Dan Garcia के अनुसार Claude, ChatGPT और Google Gemini जैसे LLM के उपयोग से शैक्षणिक बेईमानी बहुत बढ़ी, जो असामान्य फेल रेट का “primary driver” था; CS 10 में लगभग 30 छात्र take-home exam में चीटिंग करते पकड़े गए
- दोनों कक्षाओं में curve adjustment के बिना सार्वजनिक score thresholds के आधार पर ग्रेड दिए गए, इसलिए छात्रों के ग्रेड उनके साथियों के प्रदर्शन पर निर्भर नहीं थे; Garcia का मानना है कि curve adjustment समस्या को छिपाता है
- Gireeja Ranade की EECS 127 में भी गणितीय तैयारी की कमी और स्टाफ की कमी रही, और F अनुपात 16.8% दर्ज किया गया; पहले का final project TA की कमी के कारण हटाना पड़ा, और office hours में भागीदारी भी कम हो गई
- AI युग में Berkeley CS·EECS कक्षाओं की फिर से समीक्षा की जा रही है, ताकि छात्रों को कठिन समस्याओं और उलझन के साथ टिके रहकर critical और analytical thinking सीखने में अधिक मदद दी जा सके और अतिरिक्त सहायक समर्थन खोजा जा सके
फेल रेट में उछाल और ग्रेडिंग गाइडलाइन से विचलन
- Berkeleytime के अनुसार 2026 के वसंत में CS 10 के 35.3% और CS 61A के 10.6% छात्रों को F मिला
- 2025 के वसंत और 2024 के वसंत में दोनों कक्षाओं में F अनुपात 10% से ऊपर नहीं गया था
- EECS विभाग की ग्रेडिंग गाइडलाइन CS 10 और CS 61A जैसे निचले-स्तर के कोर्सों में D और F पाने वाले छात्रों का अनुपात 7% बताती है
- गाइडलाइन के अनुसार निचले-स्तर के कोर्सों के लिए सामान्य GPA रेंज 2.8~3.3 है, लेकिन 2026 के वसंत में दोनों कक्षाओं का औसत ग्रेड C+ था, जो GPA 2.3 के बराबर है
LLM पर निर्भरता और शैक्षणिक बेईमानी की समस्या
- Dan Garcia ने 2026 के वसंत में CS 10 “The Beauty and Joy of Computing” और CS 61A “The Structure and Interpretation of Computer Programs” दोनों पढ़ाए
- Garcia का मानना है कि Claude, ChatGPT और Google Gemini जैसे large language models के उपयोग से बढ़ी शैक्षणिक बेईमानी असामान्य रूप से ऊँचे फेल रेट का “primary driver” थी
- कुछ फेल ग्रेड्स चीटिंग पकड़े जाने और अनुशासनात्मक प्रक्रिया में भेजे जाने के कारण आए, जबकि अन्य मामलों में छात्रों ने LLM पर अत्यधिक निर्भरता के बाद परीक्षा में अपर्याप्त तैयारी दिखाई
- 2026 के वसंत के CS 10 में लगभग 30 छात्र take-home exam में चीटिंग करते पकड़े गए
curve adjustment के बिना ग्रेडिंग
- Garcia की दोनों कक्षाओं में grading curve के बजाय प्रत्येक letter grade के लिए score thresholds के आधार पर ग्रेडिंग की गई
- इस तरीके में छात्रों के ग्रेड अन्य छात्रों के प्रदर्शन पर निर्भर नहीं करते
- Garcia प्रत्येक letter grade के मानदंड सार्वजनिक करने और छात्रों को उन मानदंडों तक पहुँचने के कई मौके देने वाले तरीके को पसंद करते हैं
- Garcia Harvard जैसी उस पद्धति का कड़ा विरोध करते हैं जिसमें केवल कुछ छात्रों को ही A मिल सकता है, और उनका मानना है कि curve adjustment वास्तविक समस्या को छिपाता है
गणितीय तैयारी और EECS 127 की कठिनाइयाँ
- Garcia का कहना है कि AI पर अति-निर्भरता के अलावा बहुत से छात्र गणितीय रूप से पर्याप्त तैयार नहीं थे, और Gireeja Ranade ने भी यही चिंता साझा की
- Ranade की 2026 के वसंत की EECS 127 “Optimization Models in Engineering” में F अनुपात 16.8% रहा, जो EECS विभाग द्वारा ऊपरी-स्तर के कोर्सों के लिए बताए गए “typical” 5% D·F अनुपात से बहुत अधिक है
- EECS 127 के छात्रों से अपेक्षा थी कि वे linear algebra, vector calculus और mathematical proofs पढ़कर आएँगे, लेकिन Ranade ने office hours में देखा कि कई छात्र linear algebra में संघर्ष कर रहे थे
- एक छात्र ने Ranade को बताया कि UC Berkeley में उसने जो linear algebra class ली थी, उसके homework और exams में “open-internet, open-AI policy” थी
- Garcia और Ranade उन 1,300 से अधिक UC faculty में शामिल हैं जिन्होंने UC system के STEM admissions में ACT और SAT standardized test scores की बहाली की मांग करने वाली याचिका पर हस्ताक्षर किए हैं
स्टाफ की कमी और छात्र भागीदारी में गिरावट
- EECS 127 में पहले एक final project होता था, जिसमें professor और TA टीम मार्गदर्शन देती थी, और Ranade के अनुसार अधिकांश छात्रों को इस हिस्से में अच्छे अंक मिलते थे
- 2026 में स्टाफ की कमी के कारण Ranade ने इस final project को कक्षा से हटा दिया
- EECS विभागाध्यक्ष Jelani Nelson की X post के अनुसार, EECS TAs की ऊँची प्रति-घंटा दर के कारण campus को undergraduate CS enrollment और undergraduate TAs की संख्या दोनों कम करनी पड़ी
- Ranade के office hours पहले बहुत भरे रहते थे, लेकिन इस सेमेस्टर में छात्रों को बार-बार आने के लिए कहने के बावजूद भागीदारी बहुत कम रही
- Garcia ने भी पिछले दो सेमेस्टरों में office hours attendance की ऐसी ही कमी देखी, और पहली बार ऐसा office hour अनुभव किया जिसमें कोई भी नहीं आया
कक्षा का पुनर्रचना और सीखने का रवैया
- Garcia आगे कक्षा के पहले दिन 2026 के वसंत में हुई घटनाओं के बारे में बताएँगे और उन छात्रों की पहचान करने का तरीका खोजेंगे जिन्हें अतिरिक्त remedial support की जरूरत है
- Ranade का मानना है कि AI युग में professors को छात्रों को “कम नहीं, बल्कि अधिक” पढ़ाना चाहिए
- Ranade चाहती हैं कि छात्र उस critical thinking और analytical thinking से लैस हों जिसकी जरूरत एक प्रतिस्पर्धी दुनिया में leader बनने के लिए है
- दोनों professors का मानना है कि छात्रों को कठिन समस्याओं के साथ अधिक सहज होने की जरूरत है
- Garcia ने अपने एक सहकर्मी की पंक्ति “Confusion is the sweat of learning” उद्धृत करते हुए कहा कि कई छात्र वह “पसीना” पर्याप्त रूप से नहीं बहा रहे हैं
1 टिप्पणियां
Hacker News की रायें
अगर मेरे छात्र दिनों में LLM होता, तो शायद मैं होमवर्क “जल्दी खत्म करने” के लिए उसका इस्तेमाल करता और परीक्षा में पूरी तरह बर्बाद हो जाता, इसलिए आज के छात्रों के लिए कुछ हद तक सहानुभूति है
अब मैं ज़्यादातर PhD लोगों के साथ काम करता हूँ, लेकिन जो लोग हमेशा टॉप पर रहते थे उनमें भी सोचने की क्षमता तेज़ी से गिरती दिख रही है। अगर LLM 90% काम न कर दे, तो बहुत से लोग brainstorming, coding, गहरी सोच और writing नहीं कर पाते, और मौलिक सोच के लिए ज़रूरी 30 मिनट चुपचाप अकेले बैठकर सोचना भी मुश्किल होता जा रहा है
बड़ों के लिए कोई परीक्षा नहीं होती, और LLM की वजह से output बना रहता है, इसलिए cognitive decline को ठीक से मापा नहीं जाएगा, लेकिन मुझे लगता है कि यह पहले से ही चारों तरफ हो रहा है। मैं इसे नकारना चाहता था, लेकिन अब यह इतना साफ़ है कि नज़रअंदाज़ करना मुश्किल है
जो साधारण arithmetic और percentage मैं पहले दिमाग़ में तेज़ी से कर लेता था, अब उसके लिए calculator और spreadsheet पर निर्भर हो गया हूँ, और इधर-उधर की जानकारी जेब में पड़े internet RAM पर छोड़ दी है। “अरे, यह पहले पता था, अब देखना पड़ेगा” वाला एहसास अब परिचित है। शायद LLM से पहले ही मैं अपनी निजी मूर्खता की तह तक पहुँच चुका था
लेकिन आजकल communication की स्थिति बहुत बड़ा मानसिक बोझ लगती है। email, voicemail, chat, online, text, personal, work, home, kids, family, friends, Messages, Messenger, WhatsApp वगैरह—एक साथ अनगिनत बातचीत और threads संभालने पड़ते हैं। फिर भी मैं अपने आसपास के लोगों की तुलना में बहुत कम connected हूँ। संभाल नहीं पाता, इसलिए ज़्यादातर news और सारे sports छोड़ दिए हैं
मेरा दिमाग़ internet से पहले बना था, और analog से digital में बदलने की यह प्रक्रिया अब अपनी सीमा पर लगती है। कम-से-कम यह बहुत loss वाला conversion महसूस होता है
मैं नई नौकरी में नया codebase सीख रहा हूँ, और AI सचमुच दुधारी तलवार है। एक तरफ codebase के बारे में सवाल पूछने में यह बेहद उपयोगी है, लेकिन अगर सावधान न रहें और जाँच-पड़ताल से पहले ही इसे changes लागू करने दें, तो आप codebase को ठीक से सीख ही नहीं पाएँगे। समझ बनाए रखने के लिए खुद नया code लिखकर ज़रूरी मानसिक मांसपेशियों का इस्तेमाल करना पड़ता है
साथ ही, यह बड़ा codebase AI की सीमाएँ भी दिखाता है। बिना समझ के सिर्फ अंदाज़े से features ठेलने पर बहुत समस्याएँ पैदा होना तय है। targeted bug fix में भी कई unintended consequences होते हैं जिन्हें LLM देख नहीं पाता। यह खराब codebase नहीं है, लेकिन इसका scale ऐसा है कि frontier models भी जूझते हैं। इसलिए “AI की समस्या को और AI से हल कर लेंगे, codebase समझने की ज़रूरत नहीं” वाली बात अभी सही नहीं लगती
कुछ सख़्त कदम ज़रूरी लगते हैं। हाई स्कूल की math classes में अब भी “calculator मना है” जैसी पाबंदियाँ बहुत थीं, और लंबी arithmetic calculations मुझे पढ़ाई में बाधा लगती थीं, इसलिए समझ सकता हूँ कि छात्र सिर्फ कागज़ पर आधारित पढ़ाई का विरोध करें। लेकिन जब एक high-quality homework machine ठीक बगल में हो, तब वे वास्तव में क्या सीख पाएँगे, यह समझ नहीं आता
छात्रों को मनचाहे AI tools इस्तेमाल करने दें, लेकिन उन्हें पेशेवर तरीके से इस्तेमाल करना सिखाएँ, और जो skills व knowledge सचमुच सीखनी है, उसकी offline, face-to-face, शुरुआती चरण से ही बार-बार परीक्षा लें। और cheating पर F देने के बजाय suspension होना चाहिए
कुछ साल पहले मैंने एक हाई स्कूल teacher के बारे में पढ़ा था जिसने lectures को YouTube पर डाल दिया था ताकि छात्र उन्हें अपने-अपने समय पर देखें, और class time को interaction, questions और tests के लिए इस्तेमाल किया
संशोधन: Claude search से तेज़ निकला। यह 2007 में दो हाई स्कूल chemistry teachers का मामला था, और इसे flipped classroom कहा जाता है https://fltmag.com/the-flipped-classroom/
मैं इसे “cognitive decline” तो नहीं कहूँगा, लेकिन यह साफ़ दिखता है कि मैं बहुत ज़्यादा आलसी हो गया हूँ। coding शुरू करते समय जो चीज़ें रोज़मर्रा का हिस्सा थीं, वे अब भारी लगती हैं
शीर्षक जो इशारा करता है, उसके उलट असली वजह शायद लेख के एक पैराग्राफ़ में छिपी है। वह हिस्सा यह है: “Garcia और Ranade ने UC system में STEM admissions के लिए ACT और SAT standardized test scores की बहाली की माँग करने वाली याचिका पर 1,300 से अधिक UC faculty members के साथ हस्ताक्षर किए। याचिका और open letter छात्रों की math preparedness को लेकर ऐसी ही चिंताओं का विस्तार से उल्लेख करते हैं।”
COVID से पहले और बाद में कई top universities ने equity के नाम पर admission test requirements हटाने का प्रयोग किया, लेकिन लगभग हर जगह यह असफल रहा, और कई संस्थान अब पहले ही वापस लौट रहे हैं। Yale ने कहा था कि “महामारी से पहले और बाद के अध्ययनों में, application के सभी तत्वों में test scores भविष्य के Yale grades का सबसे मज़बूत एकल predictor थे, और यह family income तथा demographic variables को control करने के बाद भी सच था; यह सिर्फ ACT/SAT ही नहीं बल्कि AP·IB जैसे subject-based tests पर भी लागू होता है” https://archive.is/8zxfo
वह लिंक archive है क्योंकि मूल पेज हटा दिया गया था। Yale ने कुछ समय के लिए ‘test flexible’ रणनीति अपनाई थी, जिसमें score submit करना वैकल्पिक था, लेकिन जल्द ही उसे छोड़कर फिर test score requirement पर लौट आया
इसे SAT/ACT में सबसे ऊँचा average रखने वाले Asian छात्रों को कम दाख़िला देने के विकल्प के रूप में न देखना मुश्किल है। कुछ ही समय बाद उसी president से एक email आया जिसमें racial diversity बढ़ने पर इस बदलाव की तारीफ़ की गई थी, और पहले-पिछले आँकड़ों में Asian अनुपात घटा था जबकि बाकी बढ़े थे
CS प्रोफेसर के तौर पर, अभी कल ही मैंने parallel computing कोर्स के project discussion किए, और तीन groups में से एक group साफ़ तौर पर ChatGPT स्टाइल में गया था। वे LLM द्वारा architecture वगैरह पर किए गए चुनावों को भी समझ नहीं पाए
ऐसे students को पकड़ने का तरीका पहले दूसरे students से copy करने वाले मामलों जैसा ही है। यह “खुद अपने लिए फांसी का फंदा देना” जैसा होता है; आप explanation मांगते जाएं तो वे अनजाने में dead end तक पहुंच जाते हैं
जब शक हो, तो “ईमानदारी से बताओ, इस code में कितना तुम्हारा है और कितना ChatGPT का?” जैसी honesty की अपील करना, और यह empathy भी दिखाना कि उसी हफ्ते कई deadlines रही होंगी, मुझे ठीक लगता है। फिर भी, सही तरीके से काम करने का सबक देने का मौका नहीं छोड़ना चाहिए
बाकी दो groups ने भी LLM का इस्तेमाल किया, लेकिन high-level design और architecture सहायता के लिए। भले ही उन्होंने code 100% हाथ से न लिखा हो, फिर भी साफ़ था कि जिम्मेदारी उन्हीं की थी, और वे problem solving में इस्तेमाल किए गए अपने reasoning और strategy को समझा सकते थे
मैंने colleagues से कहा है कि अभी हमें और भी बहुत से projects review करने हैं, इसलिए ऐसे cases की गिनती करें; अभी तक 3 में 1, यानी 33% है
क्या library code copy-paste करके project बनाना भी स्वीकार किया जाता? अगर नहीं, तो LLM-generated code इस्तेमाल करना अलग क्यों है, यह जानना चाहूंगा
इंसान एक अजीब प्राणी है जो हर संकट में नींद में चलते हुए घुस जाता है, किसी बात पर सहमत नहीं हो पाता, और वहां पहुंच जाने के बाद कारण पर भी सहमत नहीं हो पाता
जब हम उस बिंदु पर पहुंच जाएंगे जहां “engineering” या “science” ठीक से करना संभव नहीं रहेगा, तब अगला दशक इस बहस में निकल जाएगा कि समस्या सच में AI थी या नहीं, अगर AI थी भी तो क्या वह अपरिहार्य थी, और जिम्मेदार कोई नहीं था या सभी थे। वही चक्र दोहराया जाएगा। और फिर भी हम आज यहां इस अंधेरे भविष्य को देखते हुए एक और कदम आगे बढ़ा रहे हैं
क्या हम मान लेते हैं कि समाज खुद को regulate कर लेगा। कुछ हद तक हां, लेकिन self-regulation की लागत सच में बहुत ऊंची और बहुत पीड़ादायक होती है। क्या हम यह मानकर उस लागत को स्वीकार कर रहे हैं कि शायद पहली चोट हमें नहीं लगेगी
यह cultural evolution है, और market भी ऐसे ही काम करता है। क्या आप central planning की उम्मीद कर रहे थे
grade data https://berkeleytime.com/grades से लिया गया है
मुझे चिंता थी कि कहीं narrative को support करने वाले courses ही चुनकर न दिखाए गए हों, इसलिए मैंने अभी चल रहे सभी CS courses के लिए F ratio को लाल रेखा में, और उस course के सबसे हाल में पढ़ाए गए semester में दिए गए grades की संख्या को हल्के नीले bars में दिखाकर descending order में sort किया
चिंता सही लगती है। शुरू के कुछ charts देखें तो हाल के कुछ semesters में F ratio में बड़ी बढ़ोतरी नहीं दिखती
https://x.com/rahimnathwani/status/2062431813143019525?s=61
professors के पास कम grades न देने का incentive होता है। कम grades आमतौर पर course evaluations को गिराते हैं, जिसका असर salary increase और promotion पर पड़ सकता है, और कम grades administration की अतिरिक्त scrutiny भी खींचते हैं, जो कोई professor नहीं चाहता
जनवरी में मेरी बेटी को math class में दिक्कत हो रही थी, इसलिए मैंने Claude से एक बहुत focused worksheet generation tool बनाया। यह उन concepts पर बार-बार practice के लिए questions बनाता था जिनमें उसे कठिनाई हो रही थी
इससे फायदा हुआ, और अगर मैं यह पारंपरिक तरीके से करता तो यह बहुत ज़्यादा मुश्किल होता
यह tool answer sheet और worked solutions set के साथ PDF बनाता था, और problems को कई तरीकों से solve करके दिखाता था, जिससे मेरी बेटी के काम को जांचना और तेजी से दोहराना आसान हो गया
यह एक शक्तिशाली tool है। आखिर बात फिर इसी पर आकर रुकती है कि आप tool का इस्तेमाल कैसे करते हैं। क्या आप इसे बेहतर बनने के लिए इस्तेमाल करते हैं, या shortcut लेने के लिए
अगर हर कोई “सही” तरीके से काम करे तो समस्या नहीं होगी, लेकिन सामाजिक incentives जटिल और विरोधाभासी हैं, इसलिए बहुत से लोगों को तत्काल shortcut ज़्यादा आकर्षक लगता है
यह तकनीकी समस्या जितनी है, उतनी ही सामाजिक समस्या भी है
यह अलग खबर जैसी लग सकती है, लेकिन “UC Berkeley के mathematicians के नेतृत्व में University of California के 600 से अधिक faculty members STEM applicants के लिए standardized testing requirement की बहाली की मांग कर रहे हैं। उनका कहना है कि 6 साल की test-free admissions नीति ने preparedness का भरोसेमंद आकलन नहीं किया, और professors को अक्सर freshmen को middle-school math पढ़ानी पड़ रही है”
https://archive.ph/18spS
और उससे संभावित फायदा क्या है
LLM को लेकर सच में बहुत चिंता है
मेरा 15 साल का बेटा है, और मैं Google Family Link से उसके फ़ोन के इस्तेमाल को मैनेज करता हूँ। ज़्यादातर चीज़ों में काफ़ी खुलापन है और बस इंस्टॉल नोटिफ़िकेशन मिलते हैं, लेकिन Gemini पर सख़्त रोक लगाई हुई है
मैं ख़तरों के बारे में उससे लंबे समय से विस्तार से बात करता आया हूँ
मेरा बेटा कहता है कि उसके दोस्त अक्सर LLM का इस्तेमाल करते हैं, और उसे शक है कि यही उनके टेस्ट स्कोर की वजह है। उसके कुछ दोस्तों के टेस्ट में 20~40% के बीच अंक आते हैं, जबकि मेरा बेटा पिछले वर्षों के प्रश्नपत्र पढ़ता है और रिविज़न के दौरान सवालों के जवाब देकर 80% से ज़्यादा लाता है
यह साफ़ है कि AI providers को इस बात की परवाह नहीं होगी कि छात्र LLM से होमवर्क के सवाल हल कर रहे हैं, इसलिए भविष्य को लेकर चिंता होती है
AI को सिर्फ़ ख़तरे की तरह मत देखिए, बल्कि यह भी देखिए कि आपका बेटा इसका इस्तेमाल अपनी पढ़ाई को तेज़ और मज़बूत करने में कैसे कर सकता है। बल्कि असली ख़तरा वह राजनीतिक माहौल है जो उन समूहों का डेटा छिपाने के लिए standardized tests को ख़त्म करना चाहता है जो परंपरागत रूप से असफल होते रहे हैं
“गाइडलाइन कहती है कि निचले डिविज़न के विषयों का सामान्य GPA 2.8~3.3 की रेंज में होना चाहिए। Berkeleytime के अनुसार 2026 के spring में इन दो क्लासों का औसत ग्रेड C+ था, जो GPA 2.3 के बराबर है”
Cal alum के तौर पर, grade inflation पर रोक लगाने की कोशिश देखकर सच में अच्छा लगा। जिस GPA को पाने के लिए मैंने बहुत मेहनत की थी, अगर Cal Yale की तरह A और A- को 79% की दर से बाँटने लगे, तो मेरी मेहनत का मूल्य बहुत घट जाएगा: https://yaledailynews.com/articles/professors-face-grading-dilemma-too-many-a-s-little-taste-for-limits
फिर भी उच्च grades + बहुत पहले graduation अब भी एक signal बने रहते हैं
जानबूझकर पढ़ाई की गुणवत्ता घटाना और परीक्षा में छात्रों को फँसाने की कोशिश करना किसी की भी शैक्षिक उपलब्धि नहीं बढ़ाता। grade inflation की शिकायत करने वाले लोग पूरी तरह भूल चुके हैं कि public education आख़िर मौजूद क्यों है
अफ़सोस की बात है। मैंने हाल ही में फिर से गणित को तराशने की एक मज़ेदार गतिविधि शुरू की है, जिसमें सवाल हल करते समय Gemini Live mode से जाँच और सुझाव माँगता हूँ, और कभी-कभी step by step आगे बढ़ता हूँ
यह काफ़ी मज़ेदार था, जैसे कोई बेहद धैर्यवान professor आपके बिलकुल बगल में खड़ा हो। अब तक के मेरे गणित सीखने के अनुभवों में यह लगभग सबसे अच्छा रहा है, और Gemini को अपने पक्ष में बनाए रखने के लिए उसे रिश्वत या उपहार भेजने की भी ज़रूरत नहीं पड़ती
दूसरी तरफ़, अगर आप ख़ुद सोचे बिना LLM से पूरा काम ही करवा लें, तो वह अपने ही साथ की गई cheating जैसी लगती है