เป็นที่น่าสังเกตว่าเทคโนโลยีที่ก้าวล้ำนี้ไม่เพียงแต่สามารถระบุเนื้องอกเท่านั้น แต่ยังโต้ตอบกับผู้ใช้ ทำให้เกิดเครื่องมือและมุมมองใหม่สำหรับการวินิจฉัยและการวิจัยทางพยาธิวิทยา
PathChat: ผู้ช่วย AI การตรวจจับพยาธิวิทยาหลายรูปแบบ
หลายปีที่ผ่านมา พยาธิวิทยาเชิงคอมพิวเตอร์มีความก้าวหน้าอย่างมากในการวิเคราะห์ข้อมูลทางสัณฐานวิทยาทางพยาธิวิทยาและข้อมูลการตรวจจับระดับโมเลกุล สาขาการวิจัยเฉพาะกลุ่มนี้ก่อตั้งขึ้นจากการผสมผสานระหว่างพยาธิวิทยากับเทคโนโลยี AI และเทคโนโลยีคอมพิวเตอร์วิทัศน์ และกำลังค่อยๆ กลายเป็นจุดสนใจการวิจัยในการวิเคราะห์ภาพทางการแพทย์
พยาธิวิทยาทางคอมพิวเตอร์เกี่ยวข้องกับการใช้การประมวลผลภาพและเทคโนโลยี AI เพื่อสร้างแบบจำลองพยาธิวิทยาทางคอมพิวเตอร์ของ AI แบบจำลองเหล่านี้ได้รับภาพทางจุลพยาธิวิทยาและดำเนินการประเมินเบื้องต้นเกี่ยวกับลักษณะทางสัณฐานวิทยาของภาพเหล่านี้ เพื่อช่วยในการวินิจฉัย การประเมินเชิงปริมาณ และการตัดสินใจผ่านเทคนิคการวิเคราะห์ภาพอัตโนมัติ
ปัจจุบัน ด้วยการเติบโตอย่างรวดเร็วของเทคโนโลยี generative AI ที่ ChatGPT นำเสนอ โมเดลภาษาขนาดใหญ่หลายรูปแบบ (MLLM) จึงถูกนำไปใช้มากขึ้นในการวิจัยทางพยาธิวิทยาเชิงคำนวณและการปฏิบัติทางคลินิกในด้านพยาธิวิทยา อย่างไรก็ตาม ในสาขาย่อยที่มีความเชี่ยวชาญสูงด้านพยาธิวิทยาทางกายวิภาค การวิจัยเกี่ยวกับการสร้างผู้ช่วย AI ต่อเนื่องหลายรูปแบบสำหรับพยาธิวิทยายังอยู่ในช่วงเริ่มต้น
ในงานนี้ ทีมวิจัยได้ออกแบบ PathChat ซึ่งเป็นผู้ช่วย AI ที่สร้างหลายรูปแบบสำหรับการวิจัยทางพยาธิวิทยาของมนุษย์โดยเฉพาะ พวกเขาฝึกอบรมระบบล่วงหน้าผ่านการเรียนรู้แบบมีผู้ดูแลด้วยตนเองบนชิ้นส่วนภาพเนื้อเยื่อเซลล์มากกว่า 100 ล้านชิ้นจากสไลด์มากกว่า 1 ล้านสไลด์ ด้วยการรวมสิ่งนี้เข้ากับ UNI ตัวเข้ารหัสภาพที่ล้ำสมัย พวกเขาสร้าง MLLM ที่สามารถให้เหตุผลเกี่ยวกับการป้อนข้อมูลทั้งแบบภาพและภาษาธรรมชาติ หลังจากปรับแต่งชุดข้อมูลที่มีจุดข้อมูลคำสั่งมากกว่า 450,000 จุดแล้ว PathChat ก็ถูกสร้างขึ้น
การวิจัยพบว่า PathChat ไม่เพียงแต่สามารถจัดการอินพุตหลายรูปแบบเท่านั้น แต่ยังตอบสนองต่อการสอบถามที่เกี่ยวข้องกับพยาธิวิทยาที่ซับซ้อนได้อย่างแม่นยำ โดยสามารถระบุโรคจากสไลด์ชิ้นเนื้อได้อย่างถูกต้องในกรณีเกือบ 90%
PathCaht
เหนือกว่า GPT-4V ด้วยความแม่นยำเกือบ 90%
เพื่อทดสอบประสิทธิภาพการตรวจจับของ PathChat ทีมวิจัยได้เปรียบเทียบ PathChat กับโมเดลโอเพ่นซอร์ส LLaVA, LLaVA-Med เฉพาะทางชีวการแพทย์ และ GPT-4V
พวกเขาออกแบบการทดลองเปรียบเทียบ PathQABench โดยวิเคราะห์กรณีทางพยาธิวิทยาจากอวัยวะและการปฏิบัติต่างๆ เพื่อเปรียบเทียบประสิทธิภาพการตรวจจับของ PathChat กับ LLaVA, LLaVA-Med และ GPT-4V
ผลการวิจัยพบว่า หากไม่ให้บริบททางคลินิก ความแม่นยำในการวินิจฉัยของ PathChat ก็สูงกว่า LLaVA 1.5 และ LLaVA-Med อย่างมีนัยสำคัญ เมื่อประเมินรูปภาพเพียงอย่างเดียว PathChat ได้รับความแม่นยำ 78.1% จากเกณฑ์มาตรฐานรวมทั้งหมด ซึ่งสูงกว่า LLaVA 1.5 ถึง 52.4% และสูงกว่า LLaVA-Med 63.8%
เมื่อรวมบริบททางคลินิกเข้าด้วยกัน ความแม่นยำของ PathChat ก็เพิ่มขึ้นเป็น 89.5% ซึ่งสูงกว่า LLaVA 1.5 ถึง 39.0% และ 60.9% สูงกว่า LLaVA-Med
การทดลองเปรียบเทียบเผยให้เห็นว่า PathChat สามารถได้รับความสามารถในการคาดการณ์ที่สำคัญจากลักษณะการมองเห็นของภาพเพียงอย่างเดียว แทนที่จะอาศัยบริบททางคลินิกเพียงอย่างเดียว สามารถใช้ข้อมูลหลายรูปแบบได้อย่างมีประสิทธิภาพและยืดหยุ่นเพื่อวินิจฉัยภาพทางเนื้อเยื่อวิทยาได้อย่างแม่นยำ โดยการรวบรวมข้อมูลที่ไม่ใช่ภาพซึ่งให้ไว้ผ่านภาษาธรรมชาติทั่วไป
เพื่อประเมินความแม่นยำของการตอบคำถามปลายเปิดของแต่ละแบบจำลองอย่างเป็นกลาง ทีมวิจัยได้คัดเลือกนักพยาธิวิทยา 7 คนเพื่อจัดตั้งคณะกรรมการประเมิน โดยการเปรียบเทียบคำตอบของแบบจำลองทั้ง 4 ข้อกับคำถามปลายเปิด 260 ข้อ จึงสามารถวิเคราะห์ความแม่นยำของการตรวจจับของแบบจำลองได้
สุดท้ายนี้ สำหรับคำถามปลายเปิดที่ผู้เชี่ยวชาญทั้ง 7 คนสามารถบรรลุฉันทามติได้ ความแม่นยำโดยรวมของ PathChat อยู่ที่ 78.7% ซึ่งสูงกว่า GPT-4V, LLaVA 1.5 และ LLaVA-Med อยู่ที่ 26.4%, 48.9% และ 48.1% ตามลำดับ โดยรวมแล้ว PathChat แสดงให้เห็นถึงประสิทธิภาพที่เหนือกว่าเมื่อเปรียบเทียบกับรุ่นอื่นๆ สามรุ่น
นักวิจัยระบุว่า PathChat สามารถวิเคราะห์และอธิบายรายละเอียดทางสัณฐานวิทยาที่ละเอียดอ่อนในภาพเนื้อเยื่อทางพยาธิวิทยา นอกจากการป้อนข้อมูลรูปภาพแล้ว ยังสามารถตอบคำถามที่ต้องการพยาธิวิทยาและความรู้พื้นฐานทางชีวการแพทย์ทั่วไปได้ ทำให้เป็นเครื่องมือที่น่าหวังในการช่วยเหลือนักพยาธิวิทยาและนักวิจัย
แม้ว่า PathChat จะมีประสิทธิภาพดีเยี่ยมในการทดลอง แต่ก็ยังเผชิญกับความท้าทายบางประการในการใช้งานจริง ซึ่งรวมถึงการตรวจสอบให้แน่ใจว่าโมเดลสามารถระบุคำค้นหาที่ไม่ถูกต้องและหลีกเลี่ยงผลลัพธ์ที่ผิดพลาด รักษาการซิงโครไนซ์กับความรู้ทางการแพทย์ล่าสุด และจัดการกับข้อเท็จจริงที่ว่าข้อมูลการฝึกอบรมของ PathChat ส่วนใหญ่มาจากข้อมูลในอดีต ซึ่งอาจสะท้อนถึง "ฉันทามติทางวิทยาศาสตร์ในอดีต" มากกว่าข้อมูลล่าสุด
นักวิจัยระบุว่าการศึกษาในอนาคตอาจเพิ่มขีดความสามารถของ PathChat ต่อไป รวมถึงการรองรับ WSI ระดับกิกะพิกเซลทั้งหมดหรืออินพุต WSI หลายรายการ และบูรณาการการสนับสนุนเฉพาะงานมากขึ้น เช่น การนับที่แม่นยำหรือการแปลวัตถุเป็นภาษาท้องถิ่น นอกจากนี้ การรวม PathChat เข้ากับโปรแกรมดูสไลด์ดิจิทัลหรือเวชระเบียนอิเล็กทรอนิกส์อาจปรับปรุงการใช้งานจริงในการปฏิบัติงานทางคลินิกให้ดียิ่งขึ้น
เมื่อเร็วๆ นี้ PathChat 2 โมเดล AI เจนเนอเรชั่นหลายรูปแบบได้เปิดตัวแล้ว สามารถให้เหตุผลผ่านรูปภาพและข้อความทางพยาธิวิทยา โดยยอมรับอินพุตสลับของรูปภาพและข้อความความละเอียดสูงหลายรายการในโปรแกรมดูสไลด์แบบโต้ตอบ จึงให้การประเมินที่ครอบคลุมมากขึ้นสำหรับกรณีการให้คำปรึกษาแต่ละกรณี
เมื่อเปรียบเทียบกับ PathChat 1 พบว่ามีประสิทธิภาพที่ดีขึ้นอย่างมากในการวินิจฉัยแยกโรคและคำอธิบายทางสัณฐานวิทยา นอกจากนี้ยังมีความสามารถที่เพิ่มขึ้นในงานต่างๆ เช่น การทำตามคำแนะนำ การตอบคำถามปลายเปิด และการสรุปรายงาน