Chắc hẳn bạn đã nghe rất
nhiều về Trí tuệ nhân tạo (AI) và cách nó sắp thay đổi hoàn toàn ngành y tế.
Các mô hình ngôn ngữ lớn (LLM) như ChatGPT đang tạo ra một làn sóng phấn khích,
hứa hẹn sẽ cách mạng hóa mọi thứ, từ việc ghi chép hồ sơ bệnh án đến chẩn đoán
bệnh. Là một nhà phân tích, tôi nhận thấy khoảng cách giữa lời hứa hẹn và thực
tế triển khai là nơi các dự án AI thành công hay thất bại.
Nhưng liệu AI có thực sự
thông minh như chúng ta nghĩ? Những ứng dụng thực tế của nó trong bệnh viện là
gì, ngoài những lời quảng cáo hào nhoáng? Để tìm câu trả lời, chúng tôi đã tìm
đến cuốn sách mới của chuyên gia Jeremy Harper, "Large Language Models
(LLMs) for Healthcare". Bài viết này sẽ chắt lọc 5 sự thật gây ngạc nhiên
nhất từ cuốn sách, tiết lộ những điều trái ngược với suy nghĩ thông thường về
vai trò của AI trong y tế.
1. AI không thông minh
như bạn tưởng—và điều đó không sao cả
Trái ngược với những lời
đồn đoán về một Trí tuệ nhân tạo tổng quát (AGI) sắp xuất hiện, các LLM hiện tại
thực chất thiếu đi sự hiểu biết thực sự. Chúng là những cỗ máy dự đoán từ ngữ cực
kỳ tinh vi, nhưng chúng không "suy nghĩ" theo cách con người vẫn làm.
Harper đưa ra những ví dụ
rất rõ ràng để chứng minh điều này. Một nghiên cứu của Apple cho thấy khi các
nhà nghiên cứu chỉ thay đổi tên người và đồ vật trong các bài kiểm tra logic
đơn giản (ví dụ, đổi "quả cam" thành "quả lê"), hiệu suất của
LLM giảm mạnh. Nếu chúng thực sự thông minh, những thay đổi nhỏ này sẽ không
thành vấn đề.
Một ví dụ khác còn trực
quan hơn là khi yêu cầu LLM chơi cờ vua. Nó có thể thực hiện những nước đi vô
lý, chẳng hạn như tạo ra các quân cờ không tồn tại trên bàn cờ hoặc di chuyển
quân xe theo đường chéo như quân tượng.
Tại sao sự thật này lại
quan trọng? Nó giúp chúng ta đặt ra những kỳ vọng thực tế. Thay vì tìm kiếm một
bộ óc nhân tạo để thay thế con người, chúng ta nên tập trung vào điểm mạnh của
LLM: chúng là những công cụ hỗ trợ đắc lực, có khả năng tự động hóa các tác vụ
lặp đi lặp lại và xử lý lượng lớn dữ liệu, nhưng vẫn cần sự giám sát và tư duy
phản biện của con người. Harper tóm gọn hạn chế này một cách hoàn hảo khi ông
mô tả nỗ lực của chính mình trong việc sử dụng LLM cho các tác vụ sáng tạo phức
tạp như viết một cuốn tiểu thuyết:
Theo kinh nghiệm của tôi,
nó sẽ không thể tạo ra một câu chuyện đáng đọc; hai phần đầu tiên sẽ không có
những sai sót rõ ràng nhưng khi bạn đi sâu hơn, nó sẽ quên mất những gì nó đã tạo
ra trước đó, ngay cả khi bạn nhắc nhở nó, vẫn có quá nhiều vấn đề về ngữ cảnh
mà nó không thể xử lý.
2. Một mẹo trị giá 600 đô
la có thể nâng cấp một AI "cũ" ngang tầm với các mô hình hàng triệu
đô
Một trong những khám phá
đáng ngạc nhiên nhất trong cuốn sách là câu chuyện về mô hình
"Alpaca" của Stanford. Các nhà nghiên cứu tại đây đã thực hiện một thử
nghiệm khéo léo: họ sử dụng một mô hình hàng đầu lúc bấy giờ (GPT-3) để tạo ra
50.000 ví dụ về các cặp hỏi-đáp chất lượng cao.
Điều đặc biệt là họ đã
dùng 50.000 ví dụ "tổng hợp" này để tinh chỉnh (fine-tune), tức là điều
chỉnh lại mô hình dựa trên dữ liệu mới, cho một mô hình cũ hơn, mã nguồn mở. Kết
quả thật đáng kinh ngạc: mô hình cũ sau khi được "huấn luyện" đã đạt
được hiệu suất tương đương với các mô hình độc quyền đắt đỏ, vốn tốn hàng triệu
đô la để xây dựng.
Phát hiện này cho thấy sức
mạnh không nằm hoàn toàn ở quy mô của mô hình, mà còn ở chất lượng dữ liệu và kỹ
thuật tinh chỉnh. Nó mở ra một hướng đi mới cho các tổ chức y tế nhỏ hơn, cho
thấy họ có thể tạo ra các công cụ AI chuyên biệt, hiệu quả cao mà không cần đầu
tư những khoản chi phí khổng lồ. Điều này không chỉ dân chủ hóa việc phát triển
AI, mà còn cho thấy cuộc chơi không còn chỉ dành cho các gã khổng lồ công nghệ
với ngân sách vô hạn. Giờ đây, chìa khóa chiến thắng có thể nằm ở dữ liệu
chuyên biệt và kỹ thuật tinh chỉnh thông minh.
Điều đáng kinh ngạc là
Stanford đã làm được điều này với chi phí điện toán khoảng 600 đô la.
3. Lời hứa "tiết kiệm
thời gian" của AI trong y tế không hề đơn giản
Một trong những ứng dụng
được quảng cáo rầm rộ nhất của AI trong y tế là công nghệ "ambient
listening" (lắng nghe môi trường xung quanh), tự động ghi lại và tóm tắt
cuộc trò chuyện giữa bác sĩ và bệnh nhân thành ghi chú lâm sàng. Lời hứa hẹn là
công nghệ này sẽ giải phóng bác sĩ khỏi gánh nặng ghi chép hồ sơ, giúp họ tiết
kiệm hàng giờ mỗi ngày.
Tuy nhiên, Harper chỉ ra
rằng các nghiên cứu ban đầu lại cho thấy một kết quả khác. Công nghệ này không
thực sự làm giảm đáng kể tổng thời gian mà các bác sĩ dành cho việc ghi chép.
Vậy giá trị của nó nằm ở
đâu? Câu trả lời nằm ở một khía cạnh tinh tế hơn: nó làm giảm "gánh nặng
nhận thức". Thay vì phải viết một ghi chú hoàn toàn mới từ đầu, các bác sĩ
chỉ cần xem lại và chỉnh sửa văn bản do AI tạo ra. Quá trình này ít mệt mỏi về
mặt tinh thần hơn, và kết quả là các bác sĩ cho biết họ cảm thấy hài lòng hơn với
công việc của mình. Trong bối cảnh kiệt sức y tế đang là một cuộc khủng hoảng,
một công cụ không chỉ giúp 'tiết kiệm thời gian' mà còn 'bảo tồn năng lượng
tinh thần' có thể mang lại lợi tức đầu tư (ROI) lớn hơn nhiều so với các chỉ số
hiệu suất truyền thống.
nghiên cứu về công nghệ
ambient listening đã không cho thấy sự thay đổi đáng kể về thời gian ghi chép,
nhưng nó đã làm giảm gánh nặng nhận thức đối với các bác sĩ lâm sàng, những người
cho biết tỷ lệ hài lòng cao hơn.
4. Bí quyết cho các câu lệnh
(prompt) tốt hơn là... lịch sự, dài dòng và một chút kỳ lạ
Chất lượng đầu ra của một
LLM phụ thuộc rất nhiều vào chất lượng của câu lệnh (prompt) bạn đưa vào. Kỹ
thuật tạo câu lệnh (prompt engineering) là một nghệ thuật và khoa học, và cuốn
sách của Harper tiết lộ một vài bí quyết khá kỳ lạ.
Ví dụ, việc thêm các từ lịch
sự như "làm ơn" vào câu lệnh của bạn thực sự có thể mang lại kết quả
tốt hơn. Lý do là những từ này thường xuất hiện trong các văn bản chuyên nghiệp,
chất lượng cao trong bộ dữ liệu đào tạo của AI. Bằng cách sử dụng chúng, bạn
đang tinh tế "hướng" mô hình đến những ví dụ tốt hơn đó.
Một phát hiện thú vị
khác: nếu bạn nói với LLM rằng đang là tháng 12, nó có xu hướng tạo ra các phản
hồi ngắn gọn và "lười biếng" hơn. Điều này phản ánh các mẫu hành vi của
con người trong dữ liệu đào tạo—nhiều người có xu hướng làm việc ít hơn vào cuối
năm. Về mặt chiến lược, điều này cho thấy việc làm chủ LLM không chỉ là một kỹ
năng kỹ thuật, mà còn là một dạng 'trí tuệ cảm xúc' khi tương tác với máy móc.
Harper cũng đưa ra một
quy tắc thực tế để các nhà quản lý hoặc chuyên gia đánh giá xem liệu đội ngũ của
họ có thực sự nỗ lực để tạo ra một câu lệnh tốt hay chưa.
Quy tắc của tôi là nếu
câu lệnh kỹ thuật dưới 500 từ, họ chưa thử một bộ thử nghiệm đủ mạnh mẽ để biết
chắc chắn.
5. Có lẽ bạn đang sử dụng
AI sai cách (Đây là một cách tốt hơn)
Thay vì chỉ yêu cầu LLM
"viết một cái gì đó", Harper chia sẻ hai mẹo sử dụng công cụ này một
cách thông minh và sáng tạo hơn.
Mẹo 1: Biến AI thành kỹ
sư tạo câu lệnh cho chính bạn. Thay vì cố gắng tự
mình hoàn thiện câu lệnh, hãy yêu cầu LLM làm điều đó. Bạn có thể đưa ra một
yêu cầu đơn giản và sau đó chỉ thị cho LLM "đóng vai một kỹ sư tạo câu lệnh"
để viết lại và cải thiện chính câu lệnh đó. Điều này tận dụng chính sức mạnh của
LLM để tối ưu hóa các tương tác với nó.
Mẹo 2: Dùng AI làm người
biên tập, không phải người viết. Harper tiết lộ rằng
ông không dùng LLM để viết nội dung cho cuốn sách của mình. Thay vào đó, ông sử
dụng phần mềm chuyển giọng nói thành văn bản để ghi lại suy nghĩ của mình, sau
đó yêu cầu LLM dọn dẹp các lỗi chính tả và ngữ pháp từ bản ghi đó. Cách làm này
giúp ông duy trì giọng văn gốc của mình trong khi vẫn tiết kiệm được rất nhiều
thời gian chỉnh sửa.
Những mẹo này cho thấy việc
sử dụng LLM một cách sáng tạo có thể mang lại nhiều lợi ích hơn là chỉ coi nó
như một cỗ máy tạo văn bản tự động.
Kết luận
Từ sự thật rằng AI không
'thông minh' theo cách chúng ta nghĩ, đến sức mạnh bất ngờ của một thử nghiệm
trị giá 600 đô la, cuốn sách của Harper cho thấy con đường đến với AI hiệu quả
không phải là chạy theo sức mạnh tính toán thô, mà là sự thấu hiểu sâu sắc và ứng
dụng khéo léo. AI không phải là một cây đũa thần, nhưng nó là một công cụ cực kỳ
mạnh mẽ khi được sử dụng một cách thông minh và có chủ đích.
Khi AI tiếp tục phát triển,
làm thế nào chúng ta có thể phân biệt giữa sự cường điệu và thực tế để thực sự
cải thiện việc chăm sóc bệnh nhân? Đó là câu hỏi mà mỗi nhà lãnh đạo, bác sĩ và
nhà công nghệ trong ngành y tế cần phải trăn trở.
Dr. Hoang Van Tho

Post a Comment