AI Chatbot ของ Harvard มีประสิทธิภาพเหนือกว่า GPT-4V ด้วยการตรวจจับเนื้องอก 90%

หมวดหมู่: AI Newsแท็ก: , , เผยแพร่เมื่อ: กรกฎาคม 12, 2024อ่านขั้นต่ำ 5.1
PathChat

เหนือกว่า GPT-4V! AI Chatbot ของ Harvard Medical School โดดเด่นด้วยธรรมชาติพร้อมความแม่นยำในการตรวจจับเนื้องอกเกือบ 90%

ปัจจุบัน มะเร็งได้กลายเป็นหนึ่งในสาเหตุสำคัญของการเสียชีวิตทั่วโลก โดยมีผู้เสียชีวิตหลายล้านคนในแต่ละปี องค์การอนามัยโลกระบุว่าหนึ่งในสามของมะเร็งสามารถรักษาให้หายขาดได้ด้วยการตรวจพบและการรักษาตั้งแต่เนิ่นๆ

อย่างไรก็ตาม การตรวจคัดกรองมะเร็งถือเป็นความท้าทายที่สำคัญในวงการแพทย์มาโดยตลอด โดยเฉพาะอย่างยิ่งการระบุและวินิจฉัยเนื้องอกที่แม่นยำมีความสำคัญอย่างยิ่งต่อการรักษาผู้ป่วยในการวิเคราะห์ทางพยาธิวิทยา การตรวจทางพยาธิวิทยาแบบดั้งเดิมขึ้นอยู่กับความเชี่ยวชาญและความรู้ทางวิชาชีพของผู้เชี่ยวชาญเป็นหลัก

ด้วยการพัฒนาโมเดลขนาดใหญ่ เช่น GPT-4 วิจัยการใช้งาน ปัญญาประดิษฐ์ (เอไอ) เพื่อช่วยในการวินิจฉัยทางพยาธิวิทยาได้ค่อยๆเกิดขึ้น อย่างไรก็ตาม ระบบ AI จำนวนมากยังคงเผชิญกับข้อบกพร่องด้านประสิทธิภาพและการโต้ตอบที่ไม่ดีในการใช้งานจริง

เมื่อเร็วๆ นี้ ทีมวิจัยจาก Harvard Medical School และผู้ร่วมงานได้พัฒนาผู้ช่วย AI ทั่วไปด้านภาษาภาพสำหรับพยาธิวิทยาของมนุษย์ที่เรียกว่า PathChat ระบบนี้สามารถระบุโรคจากสไลด์ชิ้นเนื้อได้อย่างถูกต้องในกรณีเกือบ 90% ซึ่งมีประสิทธิภาพเหนือกว่าโมเดล AI ทั่วไป เช่น GPT-4V และโมเดลทางการแพทย์มืออาชีพที่มีอยู่ในตลาดปัจจุบัน

บทความวิจัยที่เกี่ยวข้องมีชื่อว่า “นักบินอวกาศ AI แบบต่อเนื่องหลายรูปแบบสำหรับพยาธิวิทยาของมนุษย์” ได้รับการตีพิมพ์ในวารสารวิทยาศาสตร์ Nature

นักบินอวกาศ AI แบบต่อเนื่องหลายรูปแบบสำหรับพยาธิวิทยาของมนุษย์

นักบินอวกาศ AI แบบต่อเนื่องหลายรูปแบบสำหรับพยาธิวิทยาของมนุษย์

เป็นที่น่าสังเกตว่าเทคโนโลยีที่ก้าวล้ำนี้ไม่เพียงแต่สามารถระบุเนื้องอกเท่านั้น แต่ยังโต้ตอบกับผู้ใช้ ทำให้เกิดเครื่องมือและมุมมองใหม่สำหรับการวินิจฉัยและการวิจัยทางพยาธิวิทยา

PathChat: ผู้ช่วย AI การตรวจจับพยาธิวิทยาหลายรูปแบบ

หลายปีที่ผ่านมา พยาธิวิทยาเชิงคอมพิวเตอร์มีความก้าวหน้าอย่างมากในการวิเคราะห์ข้อมูลทางสัณฐานวิทยาทางพยาธิวิทยาและข้อมูลการตรวจจับระดับโมเลกุล สาขาการวิจัยเฉพาะกลุ่มนี้ก่อตั้งขึ้นจากการผสมผสานระหว่างพยาธิวิทยากับเทคโนโลยี AI และเทคโนโลยีคอมพิวเตอร์วิทัศน์ และกำลังค่อยๆ กลายเป็นจุดสนใจการวิจัยในการวิเคราะห์ภาพทางการแพทย์

พยาธิวิทยาทางคอมพิวเตอร์เกี่ยวข้องกับการใช้การประมวลผลภาพและเทคโนโลยี AI เพื่อสร้างแบบจำลองพยาธิวิทยาทางคอมพิวเตอร์ของ AI แบบจำลองเหล่านี้ได้รับภาพทางจุลพยาธิวิทยาและดำเนินการประเมินเบื้องต้นเกี่ยวกับลักษณะทางสัณฐานวิทยาของภาพเหล่านี้ เพื่อช่วยในการวินิจฉัย การประเมินเชิงปริมาณ และการตัดสินใจผ่านเทคนิคการวิเคราะห์ภาพอัตโนมัติ

ปัจจุบัน ด้วยการเติบโตอย่างรวดเร็วของเทคโนโลยี generative AI ที่ ChatGPT นำเสนอ โมเดลภาษาขนาดใหญ่หลายรูปแบบ (MLLM) จึงถูกนำไปใช้มากขึ้นในการวิจัยทางพยาธิวิทยาเชิงคำนวณและการปฏิบัติทางคลินิกในด้านพยาธิวิทยา อย่างไรก็ตาม ในสาขาย่อยที่มีความเชี่ยวชาญสูงด้านพยาธิวิทยาทางกายวิภาค การวิจัยเกี่ยวกับการสร้างผู้ช่วย AI ต่อเนื่องหลายรูปแบบสำหรับพยาธิวิทยายังอยู่ในช่วงเริ่มต้น

ในงานนี้ ทีมวิจัยได้ออกแบบ PathChat ซึ่งเป็นผู้ช่วย AI ที่สร้างหลายรูปแบบสำหรับการวิจัยทางพยาธิวิทยาของมนุษย์โดยเฉพาะ พวกเขาฝึกอบรมระบบล่วงหน้าผ่านการเรียนรู้แบบมีผู้ดูแลด้วยตนเองบนชิ้นส่วนภาพเนื้อเยื่อเซลล์มากกว่า 100 ล้านชิ้นจากสไลด์มากกว่า 1 ล้านสไลด์ ด้วยการรวมสิ่งนี้เข้ากับ UNI ตัวเข้ารหัสภาพที่ล้ำสมัย พวกเขาสร้าง MLLM ที่สามารถให้เหตุผลเกี่ยวกับการป้อนข้อมูลทั้งแบบภาพและภาษาธรรมชาติ หลังจากปรับแต่งชุดข้อมูลที่มีจุดข้อมูลคำสั่งมากกว่า 450,000 จุดแล้ว PathChat ก็ถูกสร้างขึ้น

การวิจัยพบว่า PathChat ไม่เพียงแต่สามารถจัดการอินพุตหลายรูปแบบเท่านั้น แต่ยังตอบสนองต่อการสอบถามที่เกี่ยวข้องกับพยาธิวิทยาที่ซับซ้อนได้อย่างแม่นยำ โดยสามารถระบุโรคจากสไลด์ชิ้นเนื้อได้อย่างถูกต้องในกรณีเกือบ 90%

PathCaht

PathCaht

เหนือกว่า GPT-4V ด้วยความแม่นยำเกือบ 90%

เพื่อทดสอบประสิทธิภาพการตรวจจับของ PathChat ทีมวิจัยได้เปรียบเทียบ PathChat กับโมเดลโอเพ่นซอร์ส LLaVA, LLaVA-Med เฉพาะทางชีวการแพทย์ และ GPT-4V

พวกเขาออกแบบการทดลองเปรียบเทียบ PathQABench โดยวิเคราะห์กรณีทางพยาธิวิทยาจากอวัยวะและการปฏิบัติต่างๆ เพื่อเปรียบเทียบประสิทธิภาพการตรวจจับของ PathChat กับ LLaVA, LLaVA-Med และ GPT-4V

ผลการวิจัยพบว่า หากไม่ให้บริบททางคลินิก ความแม่นยำในการวินิจฉัยของ PathChat ก็สูงกว่า LLaVA 1.5 และ LLaVA-Med อย่างมีนัยสำคัญ เมื่อประเมินรูปภาพเพียงอย่างเดียว PathChat ได้รับความแม่นยำ 78.1% จากเกณฑ์มาตรฐานรวมทั้งหมด ซึ่งสูงกว่า LLaVA 1.5 ถึง 52.4% และสูงกว่า LLaVA-Med 63.8%

เมื่อรวมบริบททางคลินิกเข้าด้วยกัน ความแม่นยำของ PathChat ก็เพิ่มขึ้นเป็น 89.5% ซึ่งสูงกว่า LLaVA 1.5 ถึง 39.0% และ 60.9% สูงกว่า LLaVA-Med

การทดลองเปรียบเทียบเผยให้เห็นว่า PathChat สามารถได้รับความสามารถในการคาดการณ์ที่สำคัญจากลักษณะการมองเห็นของภาพเพียงอย่างเดียว แทนที่จะอาศัยบริบททางคลินิกเพียงอย่างเดียว สามารถใช้ข้อมูลหลายรูปแบบได้อย่างมีประสิทธิภาพและยืดหยุ่นเพื่อวินิจฉัยภาพทางเนื้อเยื่อวิทยาได้อย่างแม่นยำ โดยการรวบรวมข้อมูลที่ไม่ใช่ภาพซึ่งให้ไว้ผ่านภาษาธรรมชาติทั่วไป

เพื่อประเมินความแม่นยำของการตอบคำถามปลายเปิดของแต่ละแบบจำลองอย่างเป็นกลาง ทีมวิจัยได้คัดเลือกนักพยาธิวิทยา 7 คนเพื่อจัดตั้งคณะกรรมการประเมิน โดยการเปรียบเทียบคำตอบของแบบจำลองทั้ง 4 ข้อกับคำถามปลายเปิด 260 ข้อ จึงสามารถวิเคราะห์ความแม่นยำของการตรวจจับของแบบจำลองได้

สุดท้ายนี้ สำหรับคำถามปลายเปิดที่ผู้เชี่ยวชาญทั้ง 7 คนสามารถบรรลุฉันทามติได้ ความแม่นยำโดยรวมของ PathChat อยู่ที่ 78.7% ซึ่งสูงกว่า GPT-4V, LLaVA 1.5 และ LLaVA-Med อยู่ที่ 26.4%, 48.9% และ 48.1% ตามลำดับ โดยรวมแล้ว PathChat แสดงให้เห็นถึงประสิทธิภาพที่เหนือกว่าเมื่อเปรียบเทียบกับรุ่นอื่นๆ สามรุ่น

นักวิจัยระบุว่า PathChat สามารถวิเคราะห์และอธิบายรายละเอียดทางสัณฐานวิทยาที่ละเอียดอ่อนในภาพเนื้อเยื่อทางพยาธิวิทยา นอกจากการป้อนข้อมูลรูปภาพแล้ว ยังสามารถตอบคำถามที่ต้องการพยาธิวิทยาและความรู้พื้นฐานทางชีวการแพทย์ทั่วไปได้ ทำให้เป็นเครื่องมือที่น่าหวังในการช่วยเหลือนักพยาธิวิทยาและนักวิจัย

แม้ว่า PathChat จะมีประสิทธิภาพดีเยี่ยมในการทดลอง แต่ก็ยังเผชิญกับความท้าทายบางประการในการใช้งานจริง ซึ่งรวมถึงการตรวจสอบให้แน่ใจว่าโมเดลสามารถระบุคำค้นหาที่ไม่ถูกต้องและหลีกเลี่ยงผลลัพธ์ที่ผิดพลาด รักษาการซิงโครไนซ์กับความรู้ทางการแพทย์ล่าสุด และจัดการกับข้อเท็จจริงที่ว่าข้อมูลการฝึกอบรมของ PathChat ส่วนใหญ่มาจากข้อมูลในอดีต ซึ่งอาจสะท้อนถึง "ฉันทามติทางวิทยาศาสตร์ในอดีต" มากกว่าข้อมูลล่าสุด

นักวิจัยระบุว่าการศึกษาในอนาคตอาจเพิ่มขีดความสามารถของ PathChat ต่อไป รวมถึงการรองรับ WSI ระดับกิกะพิกเซลทั้งหมดหรืออินพุต WSI หลายรายการ และบูรณาการการสนับสนุนเฉพาะงานมากขึ้น เช่น การนับที่แม่นยำหรือการแปลวัตถุเป็นภาษาท้องถิ่น นอกจากนี้ การรวม PathChat เข้ากับโปรแกรมดูสไลด์ดิจิทัลหรือเวชระเบียนอิเล็กทรอนิกส์อาจปรับปรุงการใช้งานจริงในการปฏิบัติงานทางคลินิกให้ดียิ่งขึ้น

เมื่อเร็วๆ นี้ PathChat 2 โมเดล AI เจนเนอเรชั่นหลายรูปแบบได้เปิดตัวแล้ว สามารถให้เหตุผลผ่านรูปภาพและข้อความทางพยาธิวิทยา โดยยอมรับอินพุตสลับของรูปภาพและข้อความความละเอียดสูงหลายรายการในโปรแกรมดูสไลด์แบบโต้ตอบ จึงให้การประเมินที่ครอบคลุมมากขึ้นสำหรับกรณีการให้คำปรึกษาแต่ละกรณี

เมื่อเปรียบเทียบกับ PathChat 1 พบว่ามีประสิทธิภาพที่ดีขึ้นอย่างมากในการวินิจฉัยแยกโรคและคำอธิบายทางสัณฐานวิทยา นอกจากนี้ยังมีความสามารถที่เพิ่มขึ้นในงานต่างๆ เช่น การทำตามคำแนะนำ การตอบคำถามปลายเปิด และการสรุปรายงาน

ตรวจสอบข่าวสารและกิจกรรมเทคโนโลยี AI อื่น ๆ ได้ทันที ที่นี่ใน AIfuturize!

ทิ้งข้อความไว้