हार्वर्ड अध्ययन: एआई ने आपातकालीन कक्ष निदान में दो डॉक्टरों से बेहतर प्रदर्शन किया

एआई बनाम आपातकालीन कक्ष के डॉक्टर
एक नया हार्वर्ड-नेतृत अध्ययन बताता है कि बड़े भाषा मॉडल नियंत्रित परीक्षणों में कुछ आपातकालीन कक्ष के रोगियों का निदान करने में मानव चिकित्सकों से बेहतर हो सकते हैं, कम से कम वास्तविक क्लिनिकल मामलों का उपयोग करके किए गए नियंत्रित प्रयोगों में।
इस सप्ताह साइंस में प्रकाशित शोध ने ओपनएआई के o1 और 4o मॉडल्स के प्रदर्शन का कई चिकित्सा सेटिंग्स में परीक्षण किया, जिसमें एक प्रयोग 76 मरीजों पर आधारित था जो बेथ इज़राएल के आपातकालीन कक्ष से आए थे। एआई सिस्टम की तुलना दो आंतरिक चिकित्सा के उपस्थित चिकित्सकों से की गई, और परिणामों की समीक्षा दो अन्य उपस्थित चिकित्सकों ने की जो नहीं जानते थे कि कोई निदान डॉक्टर ने दिया था या मॉडल ने।
अध्ययन के अनुसार, o1 "या तो नाममात्र बेहतर प्रदर्शन कर रहा था या दोनों उपस्थित चिकित्सकों और 4o के समकक्ष था" प्रत्येक निदान चरण पर। अंतर सबसे अधिक पहले चरण में स्पष्ट था, जब आपातकालीन कक्ष के स्टाफ के पास सबसे कम जानकारी थी और सही निर्णय लेने की सबसे अधिक तात्कालिकता थी।
ट्रायाज (प्राथमिक मूल्यांकन) पर सबसे बड़ी बढ़त
हार्वर्ड मेडिकल स्कूल ने कहा कि शोधकर्ताओं ने मॉडल का परीक्षण करने से पहले डेटा को पूर्व-संसाधित नहीं किया। इसके बजाय, एआई सिस्टम को वही जानकारी दी गई जो प्रत्येक निदान के समय इलेक्ट्रॉनिक मेडिकल रिकॉर्ड में उपलब्ध थी।
उस जानकारी का उपयोग करते हुए, o1 ने ट्रायाज मामलों में 67% मामलों में सटीक या बहुत निकट निदान दिया। एक चिकित्सक ने यह निशान 55% मामलों में हासिल किया, जबकि दूसरे ने 50% मामलों में ऐसा किया।
"हमने एआई मॉडल का लगभग हर बेंचमार्क के खिलाफ परीक्षण किया, और इसने दोनों पिछले मॉडलों और हमारे चिकित्सक बेंचमार्क को पीछे छोड़ दिया," ने कहा अर्जुन मनराय, जो हार्वर्ड मेडिकल स्कूल में एक एआई लैब का नेतृत्व करते हैं और अध्ययन के प्रमुख लेखकों में से एक हैं, स्कूल के प्रेस रिलीज़ में।
ये निष्कर्ष बढ़ते हुए सबूतों में एक और जोड़ हैं कि बड़े भाषा मॉडल कुछ परिस्थितियों में मजबूत निदान उपकरण हो सकते हैं, हालांकि अध्ययन यह कहने से हिचकता है कि वे वास्तविक विश्व की आपात स्थितियों में डॉक्टरों की जगह लेने के लिए तैयार हैं।
स्रोत:
Doppler VPN: 6 सर्वर स्थान, वीलेस प्रोटोकॉल, कोई ट्रैकिंग नहीं। मुफ्त में शुरू करें.