1. Giới thiệu
1.1 Sự trỗi dậy của học sâu
trong y tế và tin sinh học
Trong vài thập kỷ qua, ngành y tế
đã chứng kiến sự bùng nổ dữ liệu. Hồ sơ sức khỏe điện tử (EHR), hình ảnh y tế
(X-quang, CT, MRI), dữ liệu di truyền (genomics, proteomics) và dữ liệu cảm biến
từ thiết bị đeo (wearables) tạo nên một nguồn thông tin khổng lồ. Tuy nhiên, khối
lượng và tính phức tạp của dữ liệu này vượt xa khả năng xử lý thủ công của con
người.
Song song, học sâu (deep
learning) – một nhánh của trí tuệ nhân tạo (AI) – đã đạt được thành công vang dội
trong các lĩnh vực như thị giác máy tính, xử lý ngôn ngữ tự nhiên, dịch tự động,
và đặc biệt là y sinh. Các mô hình như Convolutional Neural Networks (CNNs),
Recurrent Neural Networks (RNNs), Long Short-Term Memory (LSTMs),
và gần đây là Transformers đã chứng minh khả năng trích xuất đặc trưng mạnh
mẽ từ dữ liệu phi cấu trúc.
Điểm mạnh cốt lõi của học sâu
trong y tế:
- Khả năng học đặc trưng tự động: không cần
thiết kế thủ công, mô hình tự học được đặc điểm quan trọng từ dữ liệu.
- Khả năng mở rộng với dữ liệu lớn: càng nhiều
dữ liệu, mô hình càng chính xác.
- Tính ứng dụng đa dạng: từ chẩn đoán hình ảnh,
dự đoán bệnh, khám phá thuốc, cho đến phân tích gen.
Nhờ vậy, học sâu không chỉ hỗ trợ
bác sĩ trong việc ra quyết định mà còn mở ra triển vọng y học chính xác
(precision medicine), nơi chẩn đoán và điều trị được cá nhân hóa cho từng bệnh
nhân.
1.2 So sánh với các phương
pháp truyền thống
Trước khi có học sâu, nhiều kỹ
thuật trong tin học y tế dựa trên machine learning cổ điển như Support
Vector Machine (SVM), Random Forest, Naïve Bayes. Các mô hình này yêu cầu feature
engineering – tức là chuyên gia phải thủ công thiết kế đặc trưng (ví dụ:
hình dạng khối u trong MRI, tần số tim trong EHR). Điều này tốn công, hạn chế
khả năng mở rộng và dễ sai lệch khi áp dụng cho dữ liệu mới.
Ngược lại, học sâu:
- Giảm phụ thuộc vào đặc trưng thủ công.
- Có khả năng phát hiện mối quan hệ phi tuyến, phức
tạp trong dữ liệu.
- Cho phép đa phương thức (multimodal learning),
tức là học từ nhiều loại dữ liệu (ảnh, văn bản, tín hiệu sinh học) cùng
lúc.
Điểm yếu của học sâu cũng đáng
lưu ý:
- Yêu cầu dữ liệu lớn để huấn luyện.
- Thiếu khả năng giải thích (black-box), khiến
bác sĩ khó tin tưởng.
- Chi phí tính toán cao (GPU, HPC).
Những thách thức này chính là động
lực để nhiều chương trong cuốn sách tìm cách giải quyết: từ mạng lai (hybrid
models), deep transfer learning, cho đến explainable AI trong y tế.
1.3 Cấu trúc tổng quan của cuốn
sách
Cuốn Deep Learning Techniques
for Biomedical and Health Informatics được biên soạn như một tuyển tập
chuyên khảo, tập trung vào:
- Các kiến trúc deep learning và vai trò trong
y tế.
- Ứng dụng trong tin học y tế: phân tích EHR,
hỗ trợ chẩn đoán, dự đoán nguy cơ.
- Ứng dụng trong xử lý ảnh y tế: từ phát hiện
khối u đến phân vùng cơ quan.
- Ứng dụng trong tin sinh học và dược học tính
toán.
- Thách thức và xu hướng tương lai: dữ liệu, đạo
đức, pháp lý, Explainable AI.
Điểm đặc biệt: thay vì chỉ lý
thuyết, sách trình bày nhiều nghiên cứu tình huống (case studies) và mô
hình thực nghiệm, giúp người đọc không chỉ hiểu mà còn hình dung được triển
khai thực tế.
2. Cơ sở lý thuyết về học sâu trong y tế
2.1 Khái quát về mạng nơ-ron
nhân tạo (Artificial Neural Networks – ANN)
Mạng nơ-ron nhân tạo mô phỏng cơ
chế hoạt động của não bộ: thông tin đi qua các lớp (layers) gồm nơ-ron
(neurons), mỗi nơ-ron thực hiện phép tính tuyến tính có trọng số và một hàm
kích hoạt (activation function).
- Đầu vào (input layer): dữ liệu y tế, ví dụ ảnh
MRI, chuỗi gen, tín hiệu ECG.
- Các lớp ẩn (hidden layers): trích xuất đặc
trưng, từ các mẫu đơn giản (cạnh, hình khối) đến phức tạp (khối u, cơ
quan).
- Đầu ra (output layer): kết quả dự đoán, chẳng
hạn “ung thư phổi” hay “không ung thư”.
Ưu điểm của ANN là khả năng biểu
diễn phi tuyến. Trong y tế, dữ liệu hiếm khi tuyến tính (một dấu hiệu bệnh
có thể phụ thuộc vào nhiều yếu tố kết hợp).
2.2 Convolutional Neural
Networks (CNNs)
CNNs là nền tảng của xử lý ảnh y
tế. Chúng sử dụng bộ lọc (filter/kernels) để quét qua hình ảnh và phát
hiện đặc trưng cục bộ.
- Conv layer: học các đặc trưng hình học như cạnh,
góc, kết cấu mô.
- Pooling layer: giảm kích thước, giữ thông
tin quan trọng.
- Fully connected layer: tổng hợp để phân loại
bệnh.
📌 Ví dụ y sinh:
- Chẩn đoán X-quang phổi: CNN phát hiện tổn
thương viêm phổi, COVID-19.
- MRI não: CNN phân vùng khối u não, giúp bác
sĩ lập kế hoạch xạ trị.
- Nhũ ảnh (mammogram): phát hiện vi vôi hóa –
dấu hiệu sớm của ung thư vú.
Điểm mạnh: CNN khai thác được cấu
trúc không gian của ảnh y tế. Điểm yếu: cần nhiều dữ liệu gán nhãn
(annotated medical images).
2.3 Recurrent Neural Networks
(RNNs) và Long Short-Term Memory (LSTMs)
Dữ liệu y tế không chỉ là ảnh
tĩnh, mà còn là chuỗi thời gian (time-series): ECG, EEG, nhịp tim, đường
huyết, hoặc chuỗi văn bản trong EHR.
- RNN: giữ trạng thái ẩn để nhớ thông tin trước
đó.
- Vấn đề: RNN gặp hiện tượng vanishing
gradient, khó học phụ thuộc dài hạn.
- LSTM: khắc phục bằng cơ chế cửa (gates)
– input, forget, output – giúp ghi nhớ thông tin quan trọng và bỏ qua nhiễu.
📌 Ví dụ y sinh:
- ECG: LSTM phát hiện rối loạn nhịp tim.
- EEG: RNN nhận dạng sóng não trong chẩn đoán
động kinh.
- EHR: LSTM dự đoán nguy cơ tử vong ICU dựa
trên chuỗi ghi chép y tế.
Ưu điểm: mạnh trong xử lý dữ liệu
tuần tự. Nhược điểm: tính toán chậm, khó mở rộng cho chuỗi siêu dài (đã được cải
thiện bởi Transformers, xem phần 2.6).
2.4 Autoencoders (AE)
Autoencoder là mạng nơ-ron dùng để
giảm chiều dữ liệu và trích xuất đặc trưng tiềm ẩn (latent features).
- Encoder: nén dữ liệu thành biểu diễn nhỏ
hơn.
- Latent space: lưu giữ đặc trưng quan trọng.
- Decoder: tái tạo dữ liệu đầu vào.
📌 Ứng dụng trong y tế:
- Nén ảnh y tế khối lượng lớn (CT, MRI) mà vẫn giữ đặc
trưng cần thiết.
- Phát hiện bất thường (anomaly detection) trong tín
hiệu sinh học.
- Trích xuất đặc trưng gen để phân cụm bệnh nhân
(clustering).
Autoencoder còn được dùng trong denoising
autoencoder để khử nhiễu trong tín hiệu y sinh, hoặc variational
autoencoder (VAE) để mô hình hóa phân phối dữ liệu sinh học.
2.5 Generative Adversarial
Networks (GANs)
GANs gồm Generator (tạo dữ
liệu giả) và Discriminator (phân biệt thật/giả).
📌 Ứng dụng y tế:
- Tạo ảnh y tế giả lập: giúp huấn luyện mô
hình khi dữ liệu thật ít (ví dụ: tạo ảnh MRI của khối u hiếm).
- Tăng cường dữ liệu (data augmentation).
- Chuyển đổi ảnh (image-to-image translation):
chuyển ảnh CT thành MRI để tránh phải chụp lại cho bệnh nhân.
Thách thức: GAN dễ sinh ra
“artifact” (nhiễu giả tạo), có thể gây nhầm lẫn trong chẩn đoán. Do đó, việc sử
dụng GAN trong lâm sàng đòi hỏi quy chuẩn kiểm định khắt khe.
2.6 Transformers và
Self-Attention
Gần đây, Transformer trở thành kiến
trúc đột phá trong cả NLP và y tế. Khác với RNN, Transformer không xử lý tuần
tự mà dùng cơ chế attention để tập trung vào phần quan trọng của dữ liệu.
📌 Ứng dụng trong y tế:
- Xử lý EHR: mô hình như Med-BERT học từ
hàng triệu hồ sơ bệnh án.
- Phân tích báo cáo lâm sàng: trích xuất bệnh,
thuốc, triệu chứng từ văn bản.
- Chuỗi gen và protein: sử dụng mô hình ngôn
ngữ sinh học (BioBERT, ESM) để dự đoán cấu trúc protein.
Điểm mạnh: song song hóa tốt, học
phụ thuộc dài hạn. Điểm yếu: yêu cầu tài nguyên tính toán cực lớn.
2.7 Các khái niệm then chốt
trong huấn luyện học sâu
- Trích chọn đặc trưng tự động (feature learning):
khác với machine learning truyền thống, học sâu học đặc trưng trực tiếp từ
dữ liệu.
- Tối ưu hóa (optimization): sử dụng thuật
toán Adam, SGD để cập nhật trọng số.
- Regularization: dropout, weight decay nhằm
tránh overfitting.
- Transfer learning: tận dụng mô hình huấn luyện
trước (pre-trained model) trên tập lớn, sau đó fine-tune cho dữ liệu y tế.
- Ví dụ: dùng ImageNet-trained CNN để phân tích
X-quang.
- Explainable AI (XAI): saliency map,
Grad-CAM, attention heatmap giúp bác sĩ hiểu mô hình dựa vào đâu để chẩn
đoán.

Post a Comment