5 Sự Thật Gây Ngỡ Ngàng Về AI Trong Y Tế Mà Bạn Chưa Biết


Chắc hẳn bạn đã nghe rất nhiều về Trí tuệ nhân tạo (AI) và cách nó sắp thay đổi hoàn toàn ngành y tế. Các mô hình ngôn ngữ lớn (LLM) như ChatGPT đang tạo ra một làn sóng phấn khích, hứa hẹn sẽ cách mạng hóa mọi thứ, từ việc ghi chép hồ sơ bệnh án đến chẩn đoán bệnh. Là một nhà phân tích, tôi nhận thấy khoảng cách giữa lời hứa hẹn và thực tế triển khai là nơi các dự án AI thành công hay thất bại.

Nhưng liệu AI có thực sự thông minh như chúng ta nghĩ? Những ứng dụng thực tế của nó trong bệnh viện là gì, ngoài những lời quảng cáo hào nhoáng? Để tìm câu trả lời, chúng tôi đã tìm đến cuốn sách mới của chuyên gia Jeremy Harper, "Large Language Models (LLMs) for Healthcare". Bài viết này sẽ chắt lọc 5 sự thật gây ngạc nhiên nhất từ cuốn sách, tiết lộ những điều trái ngược với suy nghĩ thông thường về vai trò của AI trong y tế.

1. AI không thông minh như bạn tưởng—và điều đó không sao cả

Trái ngược với những lời đồn đoán về một Trí tuệ nhân tạo tổng quát (AGI) sắp xuất hiện, các LLM hiện tại thực chất thiếu đi sự hiểu biết thực sự. Chúng là những cỗ máy dự đoán từ ngữ cực kỳ tinh vi, nhưng chúng không "suy nghĩ" theo cách con người vẫn làm.

Harper đưa ra những ví dụ rất rõ ràng để chứng minh điều này. Một nghiên cứu của Apple cho thấy khi các nhà nghiên cứu chỉ thay đổi tên người và đồ vật trong các bài kiểm tra logic đơn giản (ví dụ, đổi "quả cam" thành "quả lê"), hiệu suất của LLM giảm mạnh. Nếu chúng thực sự thông minh, những thay đổi nhỏ này sẽ không thành vấn đề.

Một ví dụ khác còn trực quan hơn là khi yêu cầu LLM chơi cờ vua. Nó có thể thực hiện những nước đi vô lý, chẳng hạn như tạo ra các quân cờ không tồn tại trên bàn cờ hoặc di chuyển quân xe theo đường chéo như quân tượng.

Tại sao sự thật này lại quan trọng? Nó giúp chúng ta đặt ra những kỳ vọng thực tế. Thay vì tìm kiếm một bộ óc nhân tạo để thay thế con người, chúng ta nên tập trung vào điểm mạnh của LLM: chúng là những công cụ hỗ trợ đắc lực, có khả năng tự động hóa các tác vụ lặp đi lặp lại và xử lý lượng lớn dữ liệu, nhưng vẫn cần sự giám sát và tư duy phản biện của con người. Harper tóm gọn hạn chế này một cách hoàn hảo khi ông mô tả nỗ lực của chính mình trong việc sử dụng LLM cho các tác vụ sáng tạo phức tạp như viết một cuốn tiểu thuyết:

Theo kinh nghiệm của tôi, nó sẽ không thể tạo ra một câu chuyện đáng đọc; hai phần đầu tiên sẽ không có những sai sót rõ ràng nhưng khi bạn đi sâu hơn, nó sẽ quên mất những gì nó đã tạo ra trước đó, ngay cả khi bạn nhắc nhở nó, vẫn có quá nhiều vấn đề về ngữ cảnh mà nó không thể xử lý.

2. Một mẹo trị giá 600 đô la có thể nâng cấp một AI "cũ" ngang tầm với các mô hình hàng triệu đô

Một trong những khám phá đáng ngạc nhiên nhất trong cuốn sách là câu chuyện về mô hình "Alpaca" của Stanford. Các nhà nghiên cứu tại đây đã thực hiện một thử nghiệm khéo léo: họ sử dụng một mô hình hàng đầu lúc bấy giờ (GPT-3) để tạo ra 50.000 ví dụ về các cặp hỏi-đáp chất lượng cao.

Điều đặc biệt là họ đã dùng 50.000 ví dụ "tổng hợp" này để tinh chỉnh (fine-tune), tức là điều chỉnh lại mô hình dựa trên dữ liệu mới, cho một mô hình cũ hơn, mã nguồn mở. Kết quả thật đáng kinh ngạc: mô hình cũ sau khi được "huấn luyện" đã đạt được hiệu suất tương đương với các mô hình độc quyền đắt đỏ, vốn tốn hàng triệu đô la để xây dựng.

Phát hiện này cho thấy sức mạnh không nằm hoàn toàn ở quy mô của mô hình, mà còn ở chất lượng dữ liệu và kỹ thuật tinh chỉnh. Nó mở ra một hướng đi mới cho các tổ chức y tế nhỏ hơn, cho thấy họ có thể tạo ra các công cụ AI chuyên biệt, hiệu quả cao mà không cần đầu tư những khoản chi phí khổng lồ. Điều này không chỉ dân chủ hóa việc phát triển AI, mà còn cho thấy cuộc chơi không còn chỉ dành cho các gã khổng lồ công nghệ với ngân sách vô hạn. Giờ đây, chìa khóa chiến thắng có thể nằm ở dữ liệu chuyên biệt và kỹ thuật tinh chỉnh thông minh.

Điều đáng kinh ngạc là Stanford đã làm được điều này với chi phí điện toán khoảng 600 đô la.

3. Lời hứa "tiết kiệm thời gian" của AI trong y tế không hề đơn giản

Một trong những ứng dụng được quảng cáo rầm rộ nhất của AI trong y tế là công nghệ "ambient listening" (lắng nghe môi trường xung quanh), tự động ghi lại và tóm tắt cuộc trò chuyện giữa bác sĩ và bệnh nhân thành ghi chú lâm sàng. Lời hứa hẹn là công nghệ này sẽ giải phóng bác sĩ khỏi gánh nặng ghi chép hồ sơ, giúp họ tiết kiệm hàng giờ mỗi ngày.

Tuy nhiên, Harper chỉ ra rằng các nghiên cứu ban đầu lại cho thấy một kết quả khác. Công nghệ này không thực sự làm giảm đáng kể tổng thời gian mà các bác sĩ dành cho việc ghi chép.

Vậy giá trị của nó nằm ở đâu? Câu trả lời nằm ở một khía cạnh tinh tế hơn: nó làm giảm "gánh nặng nhận thức". Thay vì phải viết một ghi chú hoàn toàn mới từ đầu, các bác sĩ chỉ cần xem lại và chỉnh sửa văn bản do AI tạo ra. Quá trình này ít mệt mỏi về mặt tinh thần hơn, và kết quả là các bác sĩ cho biết họ cảm thấy hài lòng hơn với công việc của mình. Trong bối cảnh kiệt sức y tế đang là một cuộc khủng hoảng, một công cụ không chỉ giúp 'tiết kiệm thời gian' mà còn 'bảo tồn năng lượng tinh thần' có thể mang lại lợi tức đầu tư (ROI) lớn hơn nhiều so với các chỉ số hiệu suất truyền thống.

nghiên cứu về công nghệ ambient listening đã không cho thấy sự thay đổi đáng kể về thời gian ghi chép, nhưng nó đã làm giảm gánh nặng nhận thức đối với các bác sĩ lâm sàng, những người cho biết tỷ lệ hài lòng cao hơn.

4. Bí quyết cho các câu lệnh (prompt) tốt hơn là... lịch sự, dài dòng và một chút kỳ lạ

Chất lượng đầu ra của một LLM phụ thuộc rất nhiều vào chất lượng của câu lệnh (prompt) bạn đưa vào. Kỹ thuật tạo câu lệnh (prompt engineering) là một nghệ thuật và khoa học, và cuốn sách của Harper tiết lộ một vài bí quyết khá kỳ lạ.

Ví dụ, việc thêm các từ lịch sự như "làm ơn" vào câu lệnh của bạn thực sự có thể mang lại kết quả tốt hơn. Lý do là những từ này thường xuất hiện trong các văn bản chuyên nghiệp, chất lượng cao trong bộ dữ liệu đào tạo của AI. Bằng cách sử dụng chúng, bạn đang tinh tế "hướng" mô hình đến những ví dụ tốt hơn đó.

Một phát hiện thú vị khác: nếu bạn nói với LLM rằng đang là tháng 12, nó có xu hướng tạo ra các phản hồi ngắn gọn và "lười biếng" hơn. Điều này phản ánh các mẫu hành vi của con người trong dữ liệu đào tạo—nhiều người có xu hướng làm việc ít hơn vào cuối năm. Về mặt chiến lược, điều này cho thấy việc làm chủ LLM không chỉ là một kỹ năng kỹ thuật, mà còn là một dạng 'trí tuệ cảm xúc' khi tương tác với máy móc.

Harper cũng đưa ra một quy tắc thực tế để các nhà quản lý hoặc chuyên gia đánh giá xem liệu đội ngũ của họ có thực sự nỗ lực để tạo ra một câu lệnh tốt hay chưa.

Quy tắc của tôi là nếu câu lệnh kỹ thuật dưới 500 từ, họ chưa thử một bộ thử nghiệm đủ mạnh mẽ để biết chắc chắn.

5. Có lẽ bạn đang sử dụng AI sai cách (Đây là một cách tốt hơn)

Thay vì chỉ yêu cầu LLM "viết một cái gì đó", Harper chia sẻ hai mẹo sử dụng công cụ này một cách thông minh và sáng tạo hơn.

Mẹo 1: Biến AI thành kỹ sư tạo câu lệnh cho chính bạn. Thay vì cố gắng tự mình hoàn thiện câu lệnh, hãy yêu cầu LLM làm điều đó. Bạn có thể đưa ra một yêu cầu đơn giản và sau đó chỉ thị cho LLM "đóng vai một kỹ sư tạo câu lệnh" để viết lại và cải thiện chính câu lệnh đó. Điều này tận dụng chính sức mạnh của LLM để tối ưu hóa các tương tác với nó.

Mẹo 2: Dùng AI làm người biên tập, không phải người viết. Harper tiết lộ rằng ông không dùng LLM để viết nội dung cho cuốn sách của mình. Thay vào đó, ông sử dụng phần mềm chuyển giọng nói thành văn bản để ghi lại suy nghĩ của mình, sau đó yêu cầu LLM dọn dẹp các lỗi chính tả và ngữ pháp từ bản ghi đó. Cách làm này giúp ông duy trì giọng văn gốc của mình trong khi vẫn tiết kiệm được rất nhiều thời gian chỉnh sửa.

Những mẹo này cho thấy việc sử dụng LLM một cách sáng tạo có thể mang lại nhiều lợi ích hơn là chỉ coi nó như một cỗ máy tạo văn bản tự động.

Kết luận

Từ sự thật rằng AI không 'thông minh' theo cách chúng ta nghĩ, đến sức mạnh bất ngờ của một thử nghiệm trị giá 600 đô la, cuốn sách của Harper cho thấy con đường đến với AI hiệu quả không phải là chạy theo sức mạnh tính toán thô, mà là sự thấu hiểu sâu sắc và ứng dụng khéo léo. AI không phải là một cây đũa thần, nhưng nó là một công cụ cực kỳ mạnh mẽ khi được sử dụng một cách thông minh và có chủ đích.

Khi AI tiếp tục phát triển, làm thế nào chúng ta có thể phân biệt giữa sự cường điệu và thực tế để thực sự cải thiện việc chăm sóc bệnh nhân? Đó là câu hỏi mà mỗi nhà lãnh đạo, bác sĩ và nhà công nghệ trong ngành y tế cần phải trăn trở.

Dr. Hoang Van Tho

Post a Comment

Previous Post Next Post