Utafiti wa Harvard unaonyesha AI ilizidi madaktari wawili katika utambuzi wa chumba cha dharura

AI dhidi ya madaktari wa chumba cha dharura
Utafiti mpya ulioongozwa na Harvard unaonyesha kwamba modeli kubwa za lugha zinaweza kuwa bora kuliko madaktari wa kibinadamu katika kutambua magonjwa ya baadhi ya wagonjwa wa chumba cha dharura, angalau katika majaribio ya kudhibitiwa yaliyotumia kesi halisi za kliniki.
Uliotangazwa wiki hii katika Science, utafiti ulitathmini jinsi modeli o1 na 4o za OpenAI zilivyoendeshwa katika mazingira mbalimbali ya tiba, ikiwa ni pamoja na jaribio moja lililotegemea wagonjwa 76 waliopita katika chumba cha dharura cha Beth Israel. Mifumo ya AI ililinganishwa na utambuzi kutoka kwa madaktari wawili wa magonjwa ya ndani waliokuwa wakiwajibika, na matokeo yalipitiwa na madaktari wawili wengine waliokuwa wakiwajibika ambao hawakujua kama utambuzi ulitoka kwa daktari au modeli.
Kulingana na utafiti, o1 “ilifanya vizuri kidogo kuliko au kwa kiwango sawa na madaktari wawili waliokuwa wakiwajibika na 4o” katika kila hatua ya utambuzi. Tofauti ilionekana zaidi katika hatua ya kwanza, wakati wafanyakazi wa chumba cha dharura walipokuwa na taarifa chache zaidi na msukumo mkubwa wa kufanya uamuzi sahihi.
Faida kubwa wakati wa triage
Chuo cha Tiba cha Harvard kilisema kuwa watafiti hawakufanya utayarishaji wa awali wa data kabla ya kujaribu modeli. Badala yake, mifumo ya AI ilipokea taarifa ile ile zilizopatikana kwenye rekodi ya matibabu ya kielektroniki wakati kila utambuzi ulipofanywa.
Kwa kutumia taarifa hiyo, o1 ilitoa utambuzi kamili au karibu kabisa katika asilimia 67 ya kesi za triage. Daktari mmoja alifikia kiwango hicho katika asilimia 55 ya nyakati, wakati mwingine alifanya hivyo katika asilimia 50 za kesi.
“Tuliijaribu modeli ya AI dhidi ya karibu vigezo vyote vya kumbukumbu, na iliwazidi modeli za awali pamoja na msingi wetu wa madaktari,” alisema Arjun Manrai, anayesimamia maabara ya AI katika Chuo cha Tiba cha Harvard na ni mmoja wa waandishi wakuu wa utafiti, katika tangazo la vyombo vya habari la chuo.
Matokeo hayo yanaongeza ushahidi unaokua kwamba modeli kubwa za lugha zinaweza kuwa zana madhubuti za utambuzi katika mazingira fulani, ingawa utafiti haufiki kusema kwamba tayari zinaweza kuchukua nafasi ya madaktari katika dharura halisi za ulimwengu.
Vyanzo:
Doppler VPN: maeneo 6 ya seva, itifaki ya VLESS, bila ufuatiliaji. Anza bure.