Nghiên cứu y học ở Việt Nam - đặc điểm, thiếu sót,
và sai sót
Nguyễn Văn Tuấn
Sự có mặt của y học
Việt Nam trên trường quốc tế c̣n rất khiêm tốn, bởi v́ phần lớn các nghiên cứu y
học ở Việt Nam được công bố trong các tạp chí y học trong nước. Trong một phân
tích tổng hợp gần đây của tác giả Phạm Duy Hiển, trong thời gian 1995 đến 2004,
trung b́nh hàng năm giới nghiên cứu y khoa Việt Nam công bố khoảng 1000 bài báo
y sinh học trong các tập san y học trong và ngoài nước; trong số này chỉ có 5
bài trong các tập san y học quốc tế [1]. Nói cách khác, chỉ có khoảng 0,5%
nghiên cứu y học từ Việt Nam có mặt trên các diễn đàn y học quốc tế. Con số này
c̣n rất khiêm tốn nếu so với các nước lân cận như Thái Lan hay Mă Lai.
Có nhiều lí do
tại sao các nghiên cứu chỉ công bố trên các tạp chí địa phương, kể cả sự liên
quan của nghiên cứu đối với t́nh h́nh và bối cảnh Việt Nam, soạn thảo bằng tiếng
Việt, hay không được chấp nhận cho công bố trên các tập san quốc tế. Nhưng hoạt
động khoa học là một lĩnh vực phi biên giới, cho nên dù là nghiên cứu từ Việt
Nam, nhưng nếu các nghiên cứu có chất lượng tốt (như ư tưởng mới hay phương pháp
nghiên cứu đúng tiêu chuẩn khoa học) th́ các nghiên cứu đó vẫn có giá trị khoa
học, và vẫn có thể xuất hiện trong các tập san y học quốc tế. Do đó, vấn đề
chất lượng các nghiên cứu đă công bố trong các tạp chí y học ở Việt Nam cần được
đặt ra để t́m một hướng đi tích cực hơn.
Người viết bài này
đă điểm qua một số bài báo khoa học xuất hiện trong các tạp chí y học thuộc
trường Đại học Y Hà Nội, Đại học Y Dược Thành phố Hồ Chí Minh, Tạp chí Y học
thực hành, Tạp chí Nghiên cứu Y học, và Tạp chí Dược học. Các
bài báo này được công bố trong khoảng thời gian từ 2001 đến 2006. Trong mỗi số
và mỗi tạp chí, tôi ngẫu nhiên chọn ra 3 bài ở mục “nghiên cứu y học” (hay tương
tự). Tất cả có 56 bài được chọn, và tôi đọc tất cả và ghi chú những điểm cần
lưu ư về ư tưởng, phương pháp và cách tŕnh bày kết quả nghiên cứu.
Điểm qua các
bài báo này, tôi thấy nhiều nhà nghiên cứu trong nước đă có những công tŕnh
nghiên cứu có ích với ư tưởng hay, có thể ứng dụng vào việc chăm sóc bệnh nhân.
Chẳng hạn như những công tŕnh nghiên cứu về HIV và so sánh phương pháp xét
nghiệm sinh hóa (do các nhà nghiên cứu thuộc Đại học Y Dược TPHCM tiến hành) hay
nghiên cứu về độ tuổi măn kinh và các yếu tố liên quan đến măn kinh (Đại học Y
Hà Nội) mà kết quả rất thú vị và có thể khai triển thêm thành một nghiên cứu có
ích cho bệnh nhân. Ngoài ra, c̣n có một số nghiên cứu mang tính phát triển
phương pháp xét nghiệm và chẩn đoán mới với kết quả rất đáng khích lệ. Trong
điều kiện hạn hẹp kinh phí và cơ sở vật chất mà các đồng nghiệp trong nước đă
tiến hành những nghiên cứu qui mô lớn và công phu như thế quả là một nỗ lực đáng
trân trọng. Tôi thiết nghĩ những công tŕnh như thế đáng lẽ phải có mặt trong
các tập san y học uy tín trên thế giới, nhưng rất tiếc điều đó chưa xảy ra.
Vấn đề đặt ra là tại
sao các nghiên cứu như thế không có mặt trên các diễn đàn y học quốc tế? Điểm
qua các nghiên cứu này một cách cẩn thận, tôi cho rằng nguyên nhân là do thiết
kế nghiên cứu chưa được thỏa đáng và chưa có hệ thống. Ngoài ra, c̣n có rất
nhiều nghiên cứu với khá nhiều thiếu sót và sai lầm, v́ khiếm khuyết trong
phương pháp nghiên cứu và do đó chất lượng không mấy cao. Có khi những thiếu
sót và sai lầm này rất nghiêm trọng đến độ kết quả nghiên cứu rất khó diễn dịch,
và có thể nói là không có giá trị khoa học ǵ cả. Trong bài viết này, tôi sẽ
nêu lên một số thiếu sót phổ biến nhất và sẽ đưa ra một số đề nghị để nâng cao
chất lượng nghiên cứu y học ở trong nước.
Ư tưởng: thiếu cái mới
Giá trị một nghiên
cứu y học có thể đánh giá qua bốn câu hỏi chính: tại sao nghiên cứu (ư
tưởng hay vấn đề nghiên cứu), đă làm ǵ (phương pháp), phát hiện cái
ǵ (kết quả), và kết quả đó có ư nghĩa ǵ (thảo luận về kết
quả). Về phần ư tưởng nghiên cứu, có thể nói ngắn gọn rằng gần như tất cả các
nghiên cứu xuất hiện trong các tập san y học trong nước xoay quanh 4 chủ đề
chính như sau:
- Nghiên cứu mô tả thuần
túy ở một nhóm bệnh nhân hay quần thể, như chỉ số sinh hóa ở bệnh nhân
tai biến mạch máu năo, chỉ số lipid ở bệnh nhân cao huyết áp, tế bào lymphô
và CD4 ở bệnh nhân AIDS/HIV, mật độ xương ở đàn ông, v.v… V́ tính chất mô
tả, cho nên các nghiên cứu này chưa thể đào sâu và phân tích các vấn đề bệnh
lí, lâm sàng.
- Nghiên cứu t́m hiểu các
yếu tố nguy cơ cũng chiếm một phần khá lớn trong các nghiên cứu lâm sàng
ở Việt Nam. Các nghiên cứu này có mục tiêu chính là phát hiện các yếu tố có
thể liên quan đến bệnh. Một số nghiên cứu tiêu biểu như yếu tố miễn dịch ở
bệnh nhân viêm cầu thận, nguyên nhân của t́nh trạng thiếu máu ở trẻ em, mối
liên hệ giữa homocysteine và nhồi máu năo, yếu tố dự đoán phù năo tử vong,
v.v… Nhưng các nghiên cứu này đáng lẽ phải được tiến hành theo thời gian
(tức theo dơi đối tượng một thời gian để xác định các yếu tố nguy cơ ban đầu
và phát triển bệnh về sau), nhưng rất tiếc các nghiên cứu ở Việt Nam chỉ
giới hạn ở dạng “cắt ngang”, thành ra, giá trị khoa học không cao; thậm
chí, mục tiêu đề ra cũng không đạt được. Một số nghiên cứu, tuy mục đích
là t́m “nguyên nhân” của bệnh, nhưng v́ cách thiết kế, cho nên tác giả báo
chỉ có thể kết luận là “yếu tố nguy cơ” chứ không thể là “nguyên nhân” được.
- Nghiên cứu về chẩn đoán
như tiêu chuẩn chẩn đoán ung thư phế quản bằng cách sử dụng tế bào học, chẩn
đoán màng năo trẻ em bằng kĩ thuật PCR, so sánh kết quả chẩn đoán, hay giá
trị chẩn đoán của siêu âm ở các bệnh nhân với sỏi đường mật. Đọc qua các
nghiên cứu này, tôi thấy rất nhiều tác giả hiểu không đúng (hoặc quá đơn
giản) về giá trị chẩn đoán, cho nên có những kết luận quá lạc quan. Thật
ra, phần lớn nghiên cứu đều khó mà ứng dụng trong thực tế lâm sàng, bởi v́
phương án nghiên cứu chỉ, một lần nữa, dừng lại ở dạng “nghiên cứu cắt
ngang”. Đáng lẽ ra, các nghiên cứu này phải là những nghiên cứu theo thời
gian (prospective study) để kết quả có thể ứng dụng trong việc tiên đoán
bệnh tật cho một cá nhân.
- Nghiên cứu dược thảo
thường tập trung vào các phân tích sinh hóa và độc tính của một số dược
thảo như độc tính của cây trâm bầu. Các nghiên cứu này nói chung là khá đơn
giản về kĩ thuật, và v́ cách mô tả nghiên cứu không rơ ràng nên rất khó đánh
giá giá trị khoa học của chúng.
Đại đa số các
nghiên cứu trên cũng chỉ dừng lại ở mức độ đơn giản, chứ chưa đi sâu vào lĩnh
vực phân tích (analytical research). Phần lớn các nghiên cứu chỉ giải quyết các
vấn đề mang tính địa phương, những vấn đề mang tính vi mô, chứ chưa nhằm trả lời
những câu hỏi lớn của y học. Một số lớn nghiên cứu mang tính [mà tiếng Anh
hay gọi là] “me too”, tức là nghiên cứu lặp lại ư tưởng của người khác, hoàn
toàn không có một phát kiến ǵ mới. (Xin nói thêm, đó chỉ là một nhận xét
thực tế, chứ không phải một phê phán).
Giá trị khoa học: dưới trung
b́nh
Ngoài ư tưởng mới,
giá trị khoa học của một nghiên cứu y học thường được đánh giá qua phương pháp,
nhất là phương pháp thiết kế và thu thập dữ liệu. Theo y học thực chứng, có 7
loại thiết kế nghiên cứu chính như sau (xếp theo thứ bậc giá trị khoa học từ
thấp nhất đến cao nhất):
- Nghiên cứu cơ bản trên
chuột và động vật cấp thấp trong pḥng thí nghiệm về một phân tử hay tác
nhân cụ thể;
- Báo cáo lâm sàng (case
reports) trong thực tế là những kinh nghiệm điều trị về một hay vài trường
hợp lâm sàng đặc biệt và hiếm thấy;
- Nghiên cứu đối chứng
(case-control study) là những nghiên cứu nhằm mục đích t́m hiểu mối liên hệ
giữa một yếu tố nguy cơ và bệnh tật bằng cách xem xét và so sánh sự phân
phối một yếu tố nguy cơ giữa nhóm bệnh nhân và nhóm không mắc bệnh (đối
chứng);
- Nghiên cứu tiêu biểu tại
một thời điểm (cross-sectional study) là những nghiên cứu cắt ngang, mà mục
đích thường là ước tính tỉ lệ hiện hành của bệnh (prevelance) và các yếu tố
liên quan đến bệnh trong một quần thể;
- Nghiên cứu theo thời gian
(prospective / longitudinal study) là những nghiên cứu theo dơi một nhóm đối
tượng, kể cả bệnh nhân, một thời gian nhằm ước tính tỉ lệ phát sinh của bệnh
(incidence) và các yếu tố liên quan đến bệnh trong một quần thể;
- Thử nghiệm lâm sàng đối
chứng ngẫu nhiên (randomized controlled clinical trial - RCT) là những thí
nghiệm công phu hơn thường được sử dụng trong việc thẩm định mức độ hiệu
nghiệm của một thuật điều trị lâm sàng trong một nhóm đối tượng cụ thể; và
- Phân tích tổng hợp
(meta-analysis), như tên gọi, là những nghiên cứu tổng hợp các kết quả
nghiên cứu RCT, cross-section, longitudinal và case-control để đi đến một
kết luận chính xác và đáng tin cậy hơn.
Đại đa số các
nghiên cứu y học công bố trong các tạp chí y học ở Việt Nam là những nghiên cứu
đối chứng và nghiên cứu cắt ngang. Chưa thấy một nghiên cứu cơ bản, RCT hay một
phân tích tổng hợp nào trong các tạp chí ở Việt Nam. Như vậy, các tạp chí y học
ở trong nước chỉ công bố những công tŕnh nghiên cứu có giá trị khoa học thấp
dưới trung b́nh.
Ngay cả những nghiên
cứu đối chứng và nghiên cứu cắt ngang, các đối tượng thường là bệnh nhân trong
các bệnh viện, chứ không được tiến hành trong một quần thể dân số được lấy mẫu
một cách có hệ thống. Một ví dụ tiêu biểu là nghiên cứu về mối liên hệ giữa
homocysteine huyết tương và chứng nhồi máu năo được tiến hành bằng cách so sánh
một nhóm bệnh nhân nhồi máu năo với một nhóm bệnh nhân ngoại trú. V́ cách chọn
đối tượng nghiên cứu từ bệnh viện (tức là những người đă có nguy cơ bệnh cao)
cho nên kết quả không mang tính khách quan cao, và rất khó mà ứng dụng cho một
quần thể lớn hơn.
Có một số nghiên cứu
nhằm mục đích chẩn đoán bệnh, nhưng v́ chủ yếu là nghiên cứu cắt ngang hay
nghiên cứu đối chứng (mà đối tượng thường là bệnh nhân từ bệnh viện), cho nên
kết quả rất khó diễn dịch, nếu không muốn nói là chẳng áp dụng vào thực hành lâm
sàng được. Tiêu biểu cho nghiên cứu dạng này là một nghiên cứu thẩm định giá
trị siêu âm trong việc chẩn đoán sỏi đường mật, các nhà nghiên cứu chỉ xem xét
các bệnh nhân đă được giải phẫu mà không có nhóm đối chứng (không bệnh), cho nên kết
quả chẳng có ư nghĩa ǵ dù các tác giả kết luận rằng “Siêu âm là một phương pháp
hữu hiệu trong chẩn đoán sỏi đường mật chính nói chung Sn=95,9%.” (Chú ư Sn là
tỉ lệ dương tính thật). Nhưng tác giả “quên” đề cập tỉ lệ âm tính thật, bởi v́
tỉ lệ này không thể ước tính được!
Một số nghiên
cứu nhằm mục đích phát triển chẩn đoán nhưng v́ thiết kế không phù hợp (như
nghiên cứu cắt ngang, hay dựa vào bệnh nhân nội trú), cho nên các kết quả và kết
luận chẳng có ư nghĩa ǵ và chẳng đáp ứng được mục đích đặt ra.
Một nghiên cứu
có giá trị khoa học phải được thiết kế sao cho tuân thủ ba nguyên tắc: ngẫu
nhiên hóa (randomization), có nhóm đối chứng (control), lặp lại nhiều lần
(replication) hoặc phân nhóm (blocking). Một số lớn nghiên cứu trong bệnh viện
thậm chí không có nhóm đối chứng (một “vi phạm” cơ bản trong phương pháp nghiên
cứu), cho nên kết quả dù được tŕnh bày ở dạng nào vẫn rất khó diễn dịch và
chẳng có giá trị khoa học ǵ đáng kể.
Phương pháp nghiên cứu: quá
nhiều sai sót
Một công tŕnh
nghiên cứu y học được xem là một cống hiến mới nếu công tŕnh đó nêu lên được
một vấn đề mới, một ư tưởng mới, hay sử dụng một phương pháp mới cho một vấn đề
cũ. Do đó, phương pháp nghiên cứu đóng một vai tṛ then chốt về chất lượng của
một nghiên cứu. Phương pháp ở đây là cách thiết kế nghiên cứu, phương pháp phân
tích vấn đề, kể cả phân tích số liệu, và phương pháp đo lường hay thu thập dữ
liệu.
Theo một thống kê
những nguyên nhân mà các bài báo không được chấp nhận cho công bố trên các tạp
chí y học quốc tế, 70% là do có vấn đề về phương pháp, và trong số này hơn 50%
là do phân tích số liệu sai phương pháp, và phần c̣n lại là vấn đề đo lường.
Những ai có kinh nghiệm nghiên cứu khoa học đều có thể đánh giá giá trị của một
bài báo qua phần phương pháp.
Phân tích dữ liệu
bằng các mô h́nh thống kê đóng một vai tṛ then chốt trong các nghiên cứu y
khoa. Thống kê cung cấp cho nhà nghiên cứu một cách suy nghĩ về dữ liệu, để
hiểu và diễn dịch ư nghĩa của dữ kiện. Giá trị khoa học của kết luận từ một
nghiên cứu không chỉ tùy thuộc vào phương án (thiết kế) của nghiên cứu mà c̣n
tùy thuộc một phần lớn vào việc áp dụng đúng phương pháp thống kê. Để áp dụng
đúng phương pháp thống kê, người phân tích chẳng những phải hiểu rơ các giả định
đằng sau những phương pháp này, mà c̣n phải nắm vững mục đích nghiên cứu, am
hiểu phương pháp đo lường và cách thu thập dữ liệu. Chẳng hạn như kiểm định t
hay phân tích phương sai (analysis of variance) chỉ có thể áp dụng phân tích các
biến số tuân theo luật phân phối chuẩn (normal distribution); nhưng nếu các
phương pháp này được ứng dụng cho các biến số không theo phân phối chuẩn hay các
biến số không liên tục (discrete variable) th́ kết quả sẽ trở nên vô nghĩa và
kết luận cũng sai.
Các nghiên cứu y học
xuất hiện trong các tạp chí y học trong nước có quá nhiều sai sót về phương pháp
phân tích. Có thể nói không ngoa rằng 100% các bài báo mà tôi đọc qua đều có ít
nhất là một sai sót, một sai lầm về phương pháp phân tích số liệu. Có khi sai
sót rất nghiêm trọng, có lẽ xuất phát từ việc hiểu sai mô h́nh thống kê, cho nên
kết quả và kết luận sai. Những sai sót trong phần này có thể chia thành 5 nhóm
sau đây:
Ứng dụng sai
phương pháp. Như đề cập trên, mỗi phương pháp phân tích thống kê đều có
những giả định đằng sau và chỉ thích hợp cho một số dạng nghiên cứu hay một số
loại số liệu cụ thể. Chẳng hạn như phương pháp kiểm định thống kê cho các
“nghiên cứu trước – sau” (before-after study, tức các nghiên cứu mà một nhóm đối
tượng được thẩm định trước và sau khi điều trị) không thể áp dụng để so sánh hai
nhóm bệnh nhân độc lập.
Trong một nghiên cứu
về tác dụng điều trị viêm dạ dày, các tác giả so sánh t́nh trạng viêm (5 thứ
bậc: viêm nông, viêm teo nhẹ, viêm teo vừa, viêm teo nặng, và niêm mạc b́nh
thường) trong một nhóm bệnh nhân trước và sau điều trị. Kết quả nghiên cứu được
phân tích bằng kiểm định Chi b́nh phương (Chi square test) với 3 bậc tự do
(degrees of freedom). Ứng dụng phương pháp phân tích Chi b́nh phương rất sai
trong dạng nghiên cứu này, bởi v́ số liệu thu thập trước và sau điều trị không
độc lập với nhau. Con số bậc tự do cũng sai!
Vi phạm và bất
chấp giả định. Các phương pháp kiểm định thông thường nhất như kiểm
định t (t-test) tuy rất dễ tính toán, nhưng kết quả có khi cũng rất dễ sai lầm
nếu không xem xét đến sự phân phối của số liệu. Nếu hai biến không có cùng
phương sai th́ kiểm định t không thể áp dụng. Ấy thế mà nhầm lẫn này thường rất
phổ biến trong các nghiên cứu y học từ Việt Nam. Một ví dụ về sai lầm tiêu biểu
là trong một nghiên cứu mô tả về bệnh AIDS, các tác giả viết “số lượng tuyệt
đối tế bào CD4 của các bệnh nhân AIDS là 229 ± 35 tb/ml so với số TCD4 ở nhóm
người b́nh thường khỏe mạnh là 879 ± 232 tb/ml … giảm có ư nghĩa thống kê với
p<0,001”! Tuy tác giả không cho biết con số đằng sau dấu “±” là ǵ, nhưng
chắc chắn đó là chỉ số phản ánh độ dao động của số lượng tế bào CD4, và qua báo
cáo trên, có thể thấy rằng nhóm đối tượng b́nh thường có độ dao động rất cao so
với nhóm bệnh nhân (232 so với 35 tb/ml), và do đó hai nhóm này không có cùng
dạng phân phối, cho nên kết quả từ kiểm định t có vấn đề.
Nhưng cũng có trường
hợp tác giả biến đổi số liệu một cách vô lí do. Chẳng hạn như một nghiên cứu về
homocysteine (một loại axít trong máu nghi ngờ là có liên hệ đến bệnh tim), các
nhà nghiên cứu biến đổi đo lường homocysteine qua đơn vị logarít: “Do
homocysteine huyết tương có độ lệch là 1,11 nên tính biến đổi log và trung vị”.
Nhưng khi đọc kĩ bài báo, tôi thấy độ homocysteine trung b́nh là 9,67 mmol/L và
độ lệch chuẩn là 3,07 mmol/L (chứ không phải 1,1 mmol/L), và nh́n vào biểu đồ
phân phối của homocysteine tôi thấy việc biến đổi số liệu này không cần thiết,
nếu không muốn nói là làm cho kết quả khó hiểu hơn (một người b́nh thường đă khó
hiểu đơn vị mmol/L, và càng cảm thấy rối rắm hơn trước đơn vị như log của
mmol/L!)
Phân nhóm tùy
tiện. Trong phần lớn các bài báo khoa học, các tác giả có xu hướng chia
một biến số liên tục (như độ tuổi, lymphocyte, thời gian, v.v…) thành nhiều nhóm
một cách cực ḱ tùy tiện. Chẳng hạn như có tác giả chi độ tuổi thành từng nhóm
theo 10-tuổi như 40 đến 49, 50 đến 59, và 60 đến 70, nhưng một nghiên cứu khác
có tác giả chia thành nhóm tuổi lẻ như 35 đến 45, 46 đến 55, và trên 55! Có khi
ngay trong một nghiên cứu, tác giả lại tự ḿnh mâu thuẫn: lúc đầu th́ chia thành
4 nhóm độ tuổi (1 đến 12 tháng, 1 - 5 tuổi, 6-10, 10-15) nhưng ngay sau đó lại
chia thành 3 nhóm (1 – 12 tháng, 13 tháng đến 5 tuổi, và 6 đến 15 tuổi)! Ngay
cả các biến như huyết áp cũng bị cắt thành từng nhóm như thế, và cách chia cắt
đó hoàn toàn không có một lí do lâm sàng nào.
Đứng trên phương
diện lí thuyết đo lường và phân tích thống kê, việc biến đổi một một biến số
liên tục thành một biến số không liên tục (như cách chia cắt trên) là một sai
sót, bởi v́ việc biến đổi đó làm cho thông tin bị mất (loss of information) của
biến. Chẳng hạn như một phân tích tiên đoán xác suất mắc bệnh dựa vào hai biến
liên tục như độ tuổi và trọng lượng của bệnh nhân lúc nào cũng cần ít thông số
hơn là một phân tích dựa vào nhóm tuổi và nhóm trọng lượng.
Ngoài ra, đứng
trên phương diện logic và thực tế lâm sàng, không có lí do ǵ để chia hai bệnh
nhân với áp suất máu 110 mmHg và 111 mmHg thành hai nhóm khác nhau cả. Chính v́
thế mà các tập san y khoa và nhà thống kê khuyến cáo nên tránh cách phân chia
một biến số liên tục một cách tùy tiện.
Phân tích theo
kiểu “câu cá”, thiếu kế hoạch. Cũng như người câu cá, nếu chịu khó kiên
tŕ câu cá hết nơi này sang nơi khác và tháng này sang tháng nọ, th́ thể nào
cũng câu được một con cá (dù con cá này không nằm trong dự tính ban đầu), nhà
nghiên cứu cũng có thể kiên tŕ t́m cách phân tích hết nhóm này sang nhóm nọ đến
khi “phát hiện” được một khác biệt nào đó mà nhà nghiên cứu không nghĩ đến lúc
khởi đầu nghiên cứu. Đó là những phát hiện mà giới khoa học gọi là “fishing
expedition” (chuyến câu cá). Một công tŕnh nghiên cứu thông thường đo lường
nhiều biến số phản ánh t́nh trạng của bệnh nhân. Với nhiều biến số như thế và
nhiều cách phân nhóm bệnh nhân theo giới tính, độ tuổi hay các chỉ tiêu lâm sàng
khác, nhà nghiên cứu có thể có hàng trăm, thậm chí hàng ngàn, nhóm nhỏ đối tượng
để phân tích. Trong trường hợp đó, một số kết quả phân tích sẽ có “ư nghĩa
thống kê” chỉ v́ yếu tố ngẫu nhiên mà chẳng có ư nghĩa sinh học nào cả.
Rất nhiều
nghiên cứu y khoa từ Việt Nam mà tôi đọc qua mang tính câu cá như mô tả trên.
Chẳng hạn như một nghiên cứu về mối liên hệ giữa lipid và chứng cao huyết áp,
các nhà nghiên cứu đo lường 4 chỉ số lipid như tổng số cholesterol, LDL
cholesterol, HDL cholesterol, và triglycerides trong hai nhóm đối tượng nam và
nữ (nhóm cao huyết áp và nhóm b́nh thường) tuổi từ 40 đến 70 tuổi. Họ chia các
đối tượng thành 3 nhóm tuổi theo giới, cộng với hai nhóm đối tượng, các nhà
nghiên cứu có đến 12 nhóm nhỏ khác nhau. Với 12 nhóm nhỏ, các nhà nghiên cứu có
thể làm 66 phân tích so sánh. Và, mỗi so sánh, họ có thể lặp lại 4 lần (cho 4
chỉ số lipid). Sau khi phân tích nhiều như thế, các nhà nghiên cứu phát hiện
rằng chỉ có triglycerides là khác biệt giữa nam và nữ, và sự khác biệt này chỉ
t́m thấy trong nhóm đối tượng tuổi từ 40 đến 49 và chỉ trong nữ giới thuộc nhóm
b́nh thường. Nói cách khác, các nhà nghiên cứu đă đi ra ngoài mục đích ban đầu
của nghiên cứu, và phát hiện được một khác biệt mà câu hỏi “tại sao” vẫn chưa
thể trả lời bằng lí giải sinh học.
Để cho máy
tính làm việc. Ngày nay, rất nhiều phần mềm cho phân tích thống kê được
phát triển, giúp cho nhà nghiên cứu có thể tiến hành những phân tích phức tạp
một cách nhanh gọn và hữu hiệu. Nhiều mô h́nh phân tích mà chỉ vài thập niên
trước đây không ai dám mơ đến (v́ có thể tốn đến hàng tháng, hay thậm chí bất
khả thi) nay có thể thực hiện trong ṿng vài phút. Nhưng các phần mềm này là
những con dao hai lưỡi: một mặt, chúng giúp cho nhà nghiên cứu giải quyết vấn đề
tính toán; mặt khác, chúng có thể bị lạm dụng để tiến hành những phân tích sai,
vô duyên, vô ư thức và vô nguyên tắc. Người ta có thể sử dụng các phần mềm này
để tính số trung b́nh của hàng triệu số điện thoại, nhưng tất nhiên kết quả đó
vẫn chỉ là một con số ngẫu nhiên, chẳng có ư nghĩa ǵ trong thực tế.
Tiêu biểu t́nh trạng
này là để cho các phần mềm phân tích thống kê làm cái việc mà đáng lẽ nhà nghiên
cứu phải làm: phân tích và suy nghĩ. Trong một nghiên cứu về mối liên hệ
giữa homocysteine và chứng nhồi máu năo, các nhà nghiên cứu viết: “Phương tŕnh
hồi qui bội log được xây dựng nhồi máu năo như biến phụ thuộc, homocysteine và
các yếu tố nguy cơ như biến độc lập. Bằng phương pháp loại dần, kết quả các
biến dự đoán quan trọng nguy cơ nhồi máu năo gồm: homocysteine, cao huyết áp, và
hút thuốc lá”. Nhưng khi xem kĩ bảng kết quả phân tích dưới đây th́ người đọc
sẽ có một “bức tranh” rất khác với nhận xét đó:
|
Yếu tố |
Hệ số
b |
Hệ số
tương quan |
Sai số |
P |
|
Homocysteine>15 mmol/L |
1,66 |
-0,19 |
0,40 |
<0,001 |
|
Cao huyết áp |
-1,84 |
-0,42 |
0,22 |
<0,001 |
|
Hút thuốc |
-1,11 |
-0,92 |
0,43 |
0,01 |
|
Nhồi máu năo |
1,92 |
1,00 |
0,46 |
<0,001 |
Theo bảng kết
quả này (dù tác giả không giải thích “hệ số b”
là ǵ, nhưng tôi có thể biết được ư nghĩa của nó), th́ quả là cá nhân với độ
homocysteine cao có nguy cơ bị chứng nhồi máu năo gia tăng, nhưng điều lạ lùng
là kết quả trên c̣n cho thấy người với cao huyết áp và hút thuốc lá có nguy cơ
nhồi máu năo thấp! (Bảng số liệu này c̣n có một vấn đề khác: đó là cột “Hệ số
tương quan”, không rơ tác giả ước tính hệ số tương quan giữa cao huyết áp và
nhồi máu năo bằng cách nào, bởi v́ nhồi máu năo là một biến thể loại, làm sao
ước tính tương quan với một biến liên tục như cao huyết áp? Ngay cả việc tŕnh
bày trong một bảng số cũng gây ra không ít lẫn lộn!)
Thật ra, đây là
một sai sót rất phổ biến trong phân tích thống kê đa biến mà nếu người phân tích
không chịu khó suy nghĩ rất dễ bị sai lầm. Trong trường hợp mà các biến độc lập
có tương quan (correlation) với nhau, và khi các biến này được phân tích trong
một mô h́nh, t́nh trạng đa tương quan (multicollinearity) sẽ xảy ra, và các
thông số từ mô h́nh này có thể không c̣n ư nghĩa thực tế nữa.
Trong nhiều
nghiên cứu với mục đích tiên đoán khả năng mắc bệnh, việc xây dựng một mô h́nh
tiên đoán bằng thống kê rất phức tạp. Trong hàng chục, thậm chí hàng trăm, yếu
tố lâm sàng, vấn đề đặt ra là yếu tố nào có liên quan đến khả năng mắc bệnh. Để
trả lời câu hỏi này nhà nghiên cứu phải xây dựng một mô h́nh tiên đoán
(predictive model) đơn giản nhưng chính xác dựa vào các yếu tố nguy cơ. V́ có
nhiều yếu tố nguy cơ, cho nên con số mô h́nh tiên đoán có thể lên đến hàng ngàn,
thậm chí hàng triệu mô h́nh, và chọn mô h́nh nào tối ưu nhất là một việc làm
không đơn giản chút nào. Khoa học thống kê cung cấp nhiều mô h́nh để giải quyết
vấn đề, nhưng nó đ̣i hỏi nhà nghiên cứu phải am hiểu mô h́nh, chứ không phải để
cho máy tính quyết định mô h́nh.
Có thể nói rằng
không có một nghiên cứu nào mà người viết đọc qua ứng dụng các mô h́nh phân tích
đa biến đúng cả. Các nhà nghiên cứu Việt Nam vẫn c̣n quá tùy thuộc vào phần mềm
phân tích thống kê và để cho các phần mềm này “chỉ thị”. Đó là một điều rất
đáng tiếc, v́ rất dễ dẫn đến sai lầm nghiêm trọng trong kết quả nghiên cứu.
Chẳng hạn như một nghiên cứu nhằm t́m các yếu tố nguy cơ (risk factors) để dự
đoán khả năng phù năo tử vong ở các bệnh nhân nhồi máu năo, và tác giả viết như
sau: “Các biến có liên quan với tử vong do thần kinh trong phân tích đơn biến
với mức ư nghĩa p<0,05 sẽ được đưa vào phân tích hồi qui đa biến logistic”.
Nói cách khác, các tác giả tiến hành phân tích hai giai đoạn: giai đoạn 1 họ
phân tích từng biến một và chỉ lưu lại các biến nào có ư nghĩa thống kê
(p<0,05); trong giai đoạn 2, tất cả các biến có ư nghĩa thống kê trong giai đoạn
1 được đưa vào phân tích đa biến. Đây cũng là một sai lầm khá phổ biến, không
những trong các nghiên cứu ở Việt Nam mà c̣n ở nước ngoài, v́ cách phân tích như
thế sẽ loại bỏ các biến có thể có liên quan đến phù năo tử vong tuy không có ư
nghĩa thống kê trong giai đoạn 1 nhưng lại có ư nghĩa thống kê trong giai đoạn 2
khi mà các biến được xem xét cùng một lúc trong một mô h́nh. Sai lầm này có lẽ
phản ánh sự thiếu am hiểu về mô h́nh hồi qui logistic và phương pháp xây dựng mô
h́nh trong thống kê học.
Hiểu sai khái
niệm. Trong một nghiên cứu khác, tác giả tỏ ra chưa am hiểu các khái
niệm về đo lường trong chẩn đoán y khoa nên viết: “Kết quả siêu âm được đối
chiếu với kết quả phẫu thuật và rút ra 4 khả năng có thể xảy ra của từng dấu
hiệu trên siêu âm: dương tính thật, dương tính giả, âm tính thật, âm tính giả.
Từ đó tính các giá trị: độ nhạy, độ đặc hiệu, giá trị dự báo dương tính, giá trị
dự báo âm tính.” Thật ra, không có chuyện tính toán độ nhạy, độ đặc hiệu từ
các giá trị dương tính thật hay âm tính thật, bởi v́ độ nhạy (sensitivity) chính
là dương tính thật, và độ đặc hiệu (specificity) chính là âm tính thật! C̣n các
giá trị dự báo dương tính và giá trị dự báo âm tính cũng sai, v́ thiết kế nghiên
cứu không cho phép tác giả ước tính các chỉ số này.
Một nghiên cứu về
mối tương quan giữa tế bào lymphocyte và CD4 ở các bệnh nhân AIDS kết luận rằng
“môi tương quan giữa tế bào lympho T CD4+ và tế bào lympho toàn phần ở 517
bệnh nhân ngoại trú cho thấy mối tương quan này theo tỉ lệ thuận với hệ số tương
quan r=0.66 (p<0,001). Tương quan này yếu đi khi phân tầng theo tế bào lympho”.
Phát biểu trên khá khó hiểu, nhưng thật ra bảng thống kê số 5 của bài báo
cho thấy kết quả rơ hơn:
|
Lymphocyte |
N |
Hệ số tương quan lympho
CD4 |
P |
|
Tất cả bệnh nhân |
517 |
0,66 |
<0,001 |
|
<1000 |
60 |
0,36 |
0,005 |
|
1000 – 2000 |
208 |
0,49 |
<0,001 |
|
>5000 |
249 |
0,35 |
<0,001 |
(Một lần nữa,
tác giả không giải thích “N” là ǵ, và trị số P đề cập đến cái ǵ! Tuy nhiên
những ai có kinh nghiệm nghiên cứu có thể đoán biết N là số đối tượng và trị số
P đề cập đến ư nghĩa thống kê của hệ số tương quan.) Vấn đề đặt ra là tại sao
hệ số tương quan của cả nhóm (517 bệnh nhân) là 0,66, nhưng khi phân từng nhóm
nhỏ th́ các hệ số tương quan chỉ dao động từ 0,35 đến 0,49 ? Tác giả không giải
thích, mà c̣n xem đó là một phát hiện y học! Thật ra, đây là một sai lầm khá
phổ biến trong các phân tích tương quan khi một biến số bị chia cắt thành từng
mảnh nhỏ. Bởi v́ khi một biến được chia thành từng nhóm th́ toàn cự của dăy số
(range) trong từng nhóm nhỏ bị hạn chế, và phương sai (variance) trở nên thấp,
và hệ quả của phương sai thấp là hệ số tương quan trong các nhóm nhỏ này cũng
giảm. Hệ số tương quan tính toán trong từng nhóm nhỏ như thế không phản ánh
chính xác độ tương quan của một quần thể. Đây là một hiện tượng số học, chứ
chẳng phải làm một phát hiện có ư nghĩa sinh học ǵ cả.
Báo cáo: quá sơ sài và nhiều
thiếu sót
Báo cáo khoa học
(hay bài báo khoa học – papers) là một “sản phẩm” của nghiên cứu khoa học, một
loại “tiền tệ” trong hoạt động khoa học, bởi v́ báo cáo khoa học không chỉ là
một bản báo cáo về một công tŕnh nghiên cứu, mà c̣n là một đóng góp cho kho
tàng tri thức của thế giới. Y học tiến bộ cũng nhờ một phần lớn vào thông tin
từ những bài báo khoa học, bởi v́ qua chúng mà các nhà khoa học có dịp trao đổi,
chia sẻ và học hỏi kinh nghiệm lẫn nhau. Chính v́ tính trao đổi thông tin này,
các báo cáo khoa học phải tuân theo một cấu trúc đặc thù và được viết bằng một
văn phong ngắn gọn nhưng phải đầy đủ. Cấu trúc một bài báo khoa học thường là
cấu trúc IMRAD (Introduction – Dẫn nhập, Methods – Phương pháp, Results – Kết
quả, và Discussion – Thảo luận.
Một báo cáo khoa học hay có thể thu hút người đọc “nhập cuộc”. Do đó, tác giả
phải suy nghĩ rất cẩn thận (và có khi khá lâu – một bài báo khoa học có khi viết
đi viết lại đến 3 tháng trời). Nếu không tiếp cận vấn đề một cách có việc hệ
thống, tất cả những nỗ lực cho một bài báo khoa học có thể trở nên vô dụng, thậm
chí đem lại ảnh hưởng xấu v́ một công tŕnh nghiên cứu sẽ không có cơ hội xuất
hiện trên các tập san chuyên môn. Mặc dù
ở các
nước phương Tây, người ta đă có nhiều
bài viết
chỉ dẫn
– thậm chí cả sách dạy – cách viết một bài báo khoa học, nhưng ở nước ta, h́nh
như vẫn chưa có một tài liệu chỉ dẫn như thế. Có lẽ v́ lí do này mà rất nhiều
bài báo khoa học tôi đọc qua đều có quá nhiều vấn đề về cách tŕnh bày cũng như
văn phong rất khó hiểu (giống như thách đố người đọc!) Không thể nêu tất cả các
vấn đề ở đây, v́ 100% những bài tôi đọc qua thành thật mà nói, đều cần phải viết
lại. Ở đây, tôi chỉ nêu các vấn đề nổi cộm mà thôi:
Dẫn nhập:
lí do mù mờ. Thông thường trong phần này, tác giả phải trả lời
cho được câu hỏi “Tại sao làm nghiên cứu này?” và để trả lời câu hỏi đó, tác
giả phải điểm qua các nghiên cứu liên quan trong quá khứ ở Việt Nam và trên thế
giới, chỉ ra những thiếu sót hay khía cạnh chưa giải quyết, và nêu lên mục đích
cụ thể của nghiên cứu của tác giả. Ngoài ra, tác giả c̣n phải thuyết phục người
đọc vấn đề mà tác giả quan tâm là một vấn đề lớn, có ư nghĩa xă hội, có liên
quan đến việc nâng cao chất lượng chăm sóc bệnh nhân hay quần chúng. Nhưng rất
tiếc, không có một bài báo nào tôi đọc qua đáp ứng được các yêu cầu căn bản
trên. Các tác giả Việt Nam thường viết phần dẫn nhập rất ngắn (không đầy 1 phần
tư trang giấy), ngắn đến nổi người đọc không hiểu tác giả muốn làm ǵ, và công
tŕnh nghiên cứu có xứng đáng hay không. Các tác giả có cố gắng điểm qua các
nghiên cứu trước, nhưng quá hạn chế (trung b́nh chỉ có 2 tài liệu tham khảo).
Thậm chí, có nhiều bài báo, tác giả chẳng điểm qua các nghiên cứu trước!
Đối tượng
nghiên cứu: mô tả quá sơ sài. Kết quả nghiên cứu có thể khái quát hóa
hay không tùy thuộc một phần lớn vào thành phần đối tượng nghiên cứu. Chẳng hạn
một nghiên cứu mà đối tượng là bệnh nhân nội trú trong bệnh viện khó mà áp dụng
cho các quần thể lớn hơn trong dân số. Do đó, mô tả đặc tính các đối tượng
nghiên cứu rất quan trọng để người đọc có thể lượng xét giá trị khoa học của kết
quả và kết luận. Rất tiếc là trong các bài báo về nghiên cứu y khoa ở Việt Nam,
các tác giả có vẻ không coi trọng khía cạnh này. Phần lớn đối tượng nghiên cứu
chỉ được mô tả bằng một đoạn văn ngắn. Chẳng hạn như nghiên cứu về t́nh h́nh suy
dinh dưỡng, các tác giả viết vỏn vẹn một câu văn như sau: “Đối tượng nghiên
cứu là trẻ em dưới 5 tuổi sinh từ ngày 1/1/1996 đến 31/12/2000 tại hai huyện
Đông Sơn và Nga Sơn tỉnh Thanh Hóa”. Đáng lẽ ở đây, tác giả nên cho người
đọc và đồng nghiệp biết tại sao chọn hai huyện này, cách tuyển chọn đối tượng ra
sao, ai là người liên lạc, có kế hoạch lấy mẫu hay không, v.v… nhưng rất tiếc
các thông tin này không có, nên khó mà đánh giá giá trị khoa học của nghiên cứu
này.
Cở mẫu: thiếu
lí do. Một nghiên cứu có hệ thống phải là một nghiên cứu có kế hoạch và
được tiến hành đúng với qui tŕnh khoa học từ khâu phát triển giả thiết, chọn
phương án nghiên cứu, ước tính cỡ mẫu, đến phân tích và diễn dịch. Trong các
khâu này, ước tính cỡ mẫu (tức ước tính số đối tượng cần thiết cho nghiên cứu)
đóng vai tṛ rất quan trọng. Nếu số lượng đối tượng quá ít, kết quả nghiên cứu
sẽ không có giá trị ǵ và không thể đi đến kết luận; ngược lại, nếu nghiên cứu
có quá nhiều đối tượng hơn cần thiết th́ vi phạm y đức. Do đó, một báo cáo khoa
học có giá trị phải giải thích rơ tại sao nghiên cứu được tiến hành trên số đối
tượng đă ấn định. Nhưng tất cả các bài báo y học từ Việt Nam mà tôi xem qua
hoàn toàn không có một lời giải thích ǵ về cỡ mẫu. Do đó, rất khó mà hiểu các
nghiên cứu này có quả thật được lên kế hoạch và thiết kế nghiêm chỉnh, hay chỉ
là những nghiên cứu cho có bằng cách sử dụng bệnh nhân sẵn có trong bệnh viện.
Phương
pháp đo lường: quá tiết kiệm chữ nghĩa. Trong giới nghiên cứu khoa học,
người ta có câu “rác vào, ra rác” (garbage in, garbage out), tức là nếu một
nghiên cứu mà phương pháp đo lường thiếu chính xác, không có độ tin cậy cao, th́
kết quả của nghiên cứu đó cũng chỉ là một khối rác con số. Do đó, kết quả của
nghiên cứu tùy thuộc rất nhiều vào phương pháp đo lường, và tác giả phải có
trách nhiệm mô tả chi tiết về các phương pháp thu thập số liệu, phân tích sinh
hóa, đo lường các chỉ số lâm sàng, v.v… trong một bài báo khoa học.
Điểm qua các nghiên
cứu y học từ Việt Nam, tôi có thể nói đây là một phần yếu nhất, mù mờ nhất.
Không như các bài báo khoa học trên các tập san y học quốc tế mà phần phương
pháp chiếm một phần lớn của nội dung bài báo, các bài báo y học từ Việt Nam rất
“tiết kiệm” về phần này. Hầu như nghiên cứu nào cũng mô tả phần phương pháp cực
ḱ sơ sài, chỉ trong ṿng nửa trang giấy A4. Một số nghiên cứu mà các tác giả
chỉ mô tả chi tiết đo lường không đầy 50 chữ! Thậm chí c̣n có một số nghiên cứu
về huyết học, lipid mà các tác giả không có đến một chữ để mô tả phương pháp đo
lường cholesterol ra sao, hay không một chữ về các chi tiết phân tích hồng cầu,
bạch cầu và hematocrit!
Kết quả nghiên
cứu: không theo sát mục đích. Thông thường trong phần báo cáo kết quả,
tác giả phải đi thẳng vào vấn đề nêu ra trong phần dẫn nhập, tức phải trả lời
cho được câu hỏi “Đă phát hiện cái ǵ?” Nhưng các bài báo y học ở Việt Nam
thường mang tính “ṿng vo tam quốc” về đối tượng nghiên cứu (mà đáng lẽ phải
tŕnh bày trong phần phương pháp) rồi mới đi vào kết quả chính. Ngay cả báo cáo
các kết quả chính, tác giả không chịu theo sát mục đích đặt ra lúc ban đầu hay
trong phần dẫn nhập. Tiêu biểu cho t́nh trạng này là thay v́ báo cáo kết quả
toàn bộ đối tượng nghiên cứu, tác giả lại nhấn mạnh đến các nhóm nhỏ mà kết quả
có khi chẳng có ư nghĩa ǵ đáng kể (nếu không muốn nói là kết quả ngẫu nhiên)!
Một xu hướng
đáng chú ư khác là có rất nhiều tác giả thay v́ chỉ tŕnh bày kết quả th́ họ lại
diễn dịch luôn kết quả (đáng lẽ phải dành cho phần thảo luận). Có nhiều khi tác
giả lặp lại những con số trong bảng số liệu và biểu đồ, tức là một cách phí phạm
chữ nghĩa. Cũng như phần dẫn nhập, nội dung phần kết quả thường rất ngắn (trung
b́nh là 2,5 đoạn văn, khoảng 1/4 trang giấy A4).
Tŕnh bày số
liệu: chính xác đến độ không cần thiết. Một trong những xu hướng khá
phổ biến trong các bài báo y học ở trong nước là các chỉ số thống kê thường được
tŕnh bày với sự chính xác một cách ... thừa thải. Chẳng hạn như một báo cáo
mô tả về các đối tượng tham gia vào công tŕnh nghiên cứu, các tác giả viết: “Tuổi
trung b́nh của 194 bệnh nhân là 47,89 tuổi (17,95). Số bệnh nhân nữ là 132 bệnh
nhân (68,04%), số bệnh nhân nam là 62 bệnh nhân (31,96%).” Chú ư con số
trong ngoặc (17,95) không rơ đó là con số ǵ? Có thể tác giả muốn đề cập đến độ
lệch chuẩn (standard deviation), nhưng cũng có thể là sai số chuẩn (standard
error), nhưng dù sao đi nữa, một cách viết như thế không thể chấp nhận trong một
bài báo khoa học.
Biểu đồ: nghèo
nàn ư nghĩa. Yếu tố thị giác rất quan trọng. Người Trung Hoa từng nói
“Một biểu đồ có giá trị bằng một vạn chữ viết.” Mục đích của biểu đồ là
cung cấp một ấn tượng về phát hiện chính của công tŕnh nghiên cứu. Biểu đồ có
khi được dùng làm tài liệu giảng dạy. V́ thế biểu đồ là một phương tiện hữu
hiệu nhất để nhấn mạnh thông điệp của bài báo. Biểu đồ thường được sử dụng để
thể hiện xu hướng và kết quả cho từng nhóm, nhưng cũng có thể dùng để tŕnh bày
dữ kiện một cách gọn gàng. Các biểu đồ dễ hiểu, nội dung phong phú là những
phương tiện vô giá. Do đó, nhà nghiên cứu cần phải suy nghĩ một cách sáng tạo
cách thể hiện số liệu quan trọng bằng biểu đồ.
Rất nhiều biểu
đồ trong các bài báo y học ở Việt Nam chỉ xoay quanh các biểu đồ mô tả như
histogram, biều đồ pie, biểu đồ tần số. Rất hiếm thấy các biểu đồ mang tính
phân tích. Các biểu đồ mô tả cũng rất nghèo nàn về ư nghĩa, đơn sơ trong tŕnh
bày chẳng khác ǵ cách vẽ biểu đồ trong các bài tập dành cho sinh viên. Có
nhiều biểu đồ lặp lại những ǵ tŕnh bày trong các bảng số liệu, tức là chẳng
cung cấp thêm thông tin ǵ cho người đọc, chẳng gây một ấn tượng ǵ đáng nhớ.
Cách làm việc như thế cho người đọc ấn tượng rằng tác giả h́nh như chưa đầu tư
suy nghĩ về việc tŕnh bày kết quả sao cho có ư nghĩa và dễ hiểu.
Bảng số: khô
khan và thiếu ư nghĩa. Trong một bài báo khoa học, các bảng thống kê số
liệu thường được dùng để tŕnh bày những số liệu mang tính trang trọng, tính
chính xác cao, tính chính thức. Các bảng thống kê có thể dùng để (a) mô tả bằng
con số những đặc điểm chính của các đối tượng nghiên cứu; (b) tŕnh bày kết quả
phân tích mối liên hệ giữa các yếu tố trong nghiên cứu; và (c) so sánh giữa các
nhóm bệnh và đối chứng. Thiết kế một bảng thống kê có ư nghĩa không phải là
việc làm đơn giản, mà đ̣i hỏi kinh nghiệm và một chút “nghệ thuật” trong việc
tŕnh bày.
Rất tiếc là những
bảng số liệu trong các bài báo khoa học từ Việt Nam chẳng những không hấp dẫn mà
c̣n chứa rất nhiều thiếu sót. Phần lớn các bảng số này chỉ dừng lại ở tính mô
tả, một phần nhỏ là những bảng tŕnh bày hệ số tương quan, thông số từ các phân
tích hồi quy nhưng v́ chẳng có ghi chú cẩn thận, cho nên chẳng ai có thể hiểu
nổi ư nghĩa của những bảng số liệu này.
Điều đáng nói là có
một số bài báo thậm chí chẳng có một bảng số liệu và biểu đồ nào! C̣n phần mô
tả kết quả bằng chữ th́ cũng rất khó theo dơi.
Thảo luận: quá
chủ quan. Đối với phần lớn nhà nghiên cứu, đây là phần khó viết nhất v́
nó không có một cấu trúc cố định nào cả. Nói một cách ngắn gọn, trong phần này,
tác giả phải trả lời câu hỏi “Những kết quả này có nghĩa ǵ?”. Tuy không phải
theo cấu trúc cố định nào, tác giả có kinh nghiệm thường viết thảo luận theo một
cấu trúc như sau: (a) giải thích những dữ kiện trong phần kết quả; (b) so sánh
những kết quả này với các nghiên cứu trước; (c) bàn về ư nghĩa của những kết
quả; (d) chỉ ra những ưu điểm và khuyết điểm của cuộc nghiên cứu; (e) và sau
cùng là một kết luận sao cho người đọc có thể lĩnh hội được một cách dễ dàng.
Không một bài báo y khoa từ Việt Nam mà tôi đọc qua viết theo cấu trúc như vừa
mô tả.
Tính trung
b́nh, phần thảo luận của các bài báo y khoa mà tôi đọc qua hàm chứa rất ít ư
kiến. Tính trung b́nh phần này dài khoảng 1,5 trang, so với [trung b́nh] 4
trang trong các bài báo ở nước ngoài. Tuy nhiên, vấn đề dài ngắn không phải là
điều thiết yếu, quan trọng là nội dung, và có thể nói rằng nội dung thảo luận
rất nghèo nàn. Có rất nhiều bài báo mà phần thảo luận không thể xem là “thảo
luận” bởi v́ tác giả chỉ lặp lại những con số và thay đổi vài câu chữ trong phần
kết quả, hoàn toàn không có một giải thích và phát kiến ǵ cả!
Có tác giả cũng
cố gắng giải thích, hay đề nghị một mô h́nh giải thích, kết quả nghiên cứu của
họ, nhưng lại không kèm theo những chứng cớ khoa học, nên rất khó mà nói cách
giải thích đó thuyết phục hay không. Rất ít khi nào các tác giả Việt Nam so
sánh kết quả của họ với kết quả của những nghiên cứu trước và giải thích tại sao
chúng (những kết quả) khác nhau, hay tại sao chúng lại giống nhau, và ư nghĩa
của chúng là ǵ. Một điều đáng nói khác là phần lớn các tác giả Việt Nam không
chịu vạch ra những thiếu sót, những trắc trở, khó khăn trong nghiên cứu, hay nêu
được những ưu điểm của cuộc nghiên cứu, cũng như đưa ra các giải pháp khắc phục
hay những đề xuất hướng nghiên cứu trong tương lai. Cách viết phẩn thảo luận
của các tác giả Việt Nam cho người đọc một ấn tượng về một nghiên cứu hoàn hảo,
không có vấn đề ǵ cả.
Tiếng
Anh: quá nhiều sai sót. Trên thế giới ngày
nay, tiếng Anh là một ngôn ngữ quốc tế trong hoạt động khoa học. Vào thập niên
1980s, trên 60% các tập san khoa học trên thế giới sử dụng tiếng Anh. Hai mươi
năm sau, con số này là trên 80% [2]. Trong lĩnh vực y khoa và sinh học, hiện
nay hơn 90% các tập san sử dụng tiếng Anh. Ngay cả tập san khoa học tại các
nước không nói tiếng Anh như các nước Bắc Âu, Nhật, Thái Lan, Trung Quốc cũng
hoặc là sử dụng tiếng Anh làm phương tiện thông tin, hoặc có phần tóm lược viết
bằng tiếng Anh.
Các tạp chí y học Việt Nam trong mấy năm qua cũng cố gắng cung cấp
phần tóm lược bài báo khoa học bằng tiếng Anh. Nhưng rất tiếc là hầu như bài
báo nào (nếu không muốn nói là 100%) đều cũng có sai sót về tiếng Anh, từ cú
pháp, thuật ngữ, đến cách diễn đạt. Không thể kể hết tất cả các sai sót ở đây,
v́ hầu như câu văn nào cũng có sai sót. Chẳng hạn như trong một nghiên cứu về
các chỉ số sinh hóa trong nhóm bệnh nhân tai biến mạch máu năo, tác giả viết
trong phần kết quả: “There has no differency in blood cell count, platelet
count, hematocrit rate between cerebral infarction and cerebral hemorrhage.
However there is a little different in some patients”. Một câu văn có quá
nhiều sai sót về đánh vần, văn phạm, và khái niệm. Một nghiên cứu khác về ứng
dụng CT scan trong việc chẩn đoán thuyên tắc phổi, tác giả kết luận bằng một câu
văn với chữ “efficacy” thành “efficacity”: “Chest helical CT scan is a useful
tool in pulmonary embolism diagnosis in Vietnam condition with good feasibility,
efficacity and some small disadvantages that could be resolved in the near
future.” Thật ra, chữ efficacy mà tác giả muốn nói đến trong kết luận không
thể dùng trong nghiên cứu này v́ không thích hợp. Đây là một sai sót mang tính
học thuật, chứ không đơn giản là từ ngữ.
Có khi sai sót rất căn bản về khái niệm và thuật ngữ
mà đáng lẽ không nên có mặt trên mặt báo, như “Lipidemia is common in
hypertensive patients and their presentation increases cardiovascular risk”.
Đáng lẽ là hyperlipidemia (chứ không phải lipidemia) và cụm từ “cardiovascular
risk” đáng lẽ phải là “the risk of cardiovascular diseases”.
Vấn đề y
đức. Một nguyên tắc số 1 (và bất di bất dịch) của y khoa là không làm
tổn hại đến bệnh nhân. Nghiên cứu y học cũng phải tuân thủ theo nguyên tắc
này. Trong nhiều nghiên cứu, nhất là nghiên cứu can thiệp mà đối tượng nghiên
cứu có khi phải kinh qua một thuật điều trị mới hay một loại thuốc mới c̣n trong
ṿng thử nghiệm. Trong các trường hợp này, bệnh nhân có thể hưởng lợi từ thuật
điều trị, nhưng cũng có thể bệnh nhân cũng chịu đựng một số biến chứng có khi
nguy hiểm. Ngay cả trong các nghiên cứu không can thiệp, đối tượng nghiên cứu
có khi phải phơi nhiễm những phương pháp đo lường (như X quang, hay lấy mẫu máu
chẳng hạn). Ngoài ra, các thông tin lâm sàng thu thập từ cá nhân đối tượng
nghiên cứu cần phải được giữ kín tuyệt đối, và danh tính bệnh nhân dứt khoát
không được tiết lộ trên bất cứ phương tiện truyền thông nào nếu không có sự đồng
ư của bệnh nhân. Đây là những khía cạnh mang tính đạo đức khoa học, mà cụ thể
trong y khoa là khía cạnh y đức (medical ethics).
Ở các nước Tây
phương, bất cứ trường đại học hay bệnh viện nào đều có một ủy ban y đức (Ethics
Committee hay Institutional Review Board) có chức năng kiểm tra khía cạnh y đức
trong tất cả các công tŕnh nghiên cứu y học. Ủy ban này gồm có đại diện từ
giới nghiên cứu khoa học, bác sĩ, thống kê, luật sư, tôn giáo, và quần chúng hay
bệnh nhân. Ủy ban có nhiệm vụ cụ thể là duyệt xét xem công tŕnh nghiên cứu có
đáp ứng các yêu cầu y đức hay không, bảo đảm an toàn cho t́nh nguyện viên, kiểm
tra tính bảo mật, v.v… của dự án nghiên cứu. Chỉ khi nào các khía cạnh này được
giải quyết thỏa đáng, dự án mới được cho phép tiến hành.
Các tập san y học
quốc tế có uy tín dứt khoát sẽ không công bố một công tŕnh nghiên cứu, bất kể
công tŕnh đó có giá trị khoa học cỡ nào, nếu công tŕnh đó chưa được sự phê
chuẩn của ủy ban y đức địa phương. Do đó, ban biên tập các tập san y học quốc
tế thường yêu cầu tác giả phải kèm theo một tuyên bố như “Công tŕnh nghiên cứu
này đă được ủy ban y đức thuộc trường đại học ABC thông qua, và bệnh nhân đă
đồng ư tham gia vào nghiên cứu.” Không có tuyên bố này cũng có nghĩa là bài báo
sẽ không được b́nh duyệt (chứ chưa nói đến việc được chấp nhận cho xuất bản hay
không!)
Tuy nhiên, tất cả
những bài báo y học mà tôi đọc qua trong các tập san y học ở trong nước không có
một gịng chữ nào nói đến y đức. Không một bài báo nào cho biết bệnh nhân đă
thỏa thuận tham gia vào nghiên cứu và cho phép cung cấp thông tin! Có thể các
công tŕnh nghiên cứu đă được thông qua, nhưng tác giả “quên” không cung cấp
thông tin này?
Tài liệu
tham khảo: lạc hậu và văn hóa Bắc-Nam. Tài liệu tham khảo là phần cuối
của một bài báo khoa học, nơi mà tác giả liệt kê tất cả các tài liệu đă được
tham khảo để phát triển và thực hiện công tŕnh nghiên cứu. Liệt kê chính xác
tài liệu tham khảo không phải là một việc làm cho lấy có, mà phải được suy nghĩ
cẩn thận, nghiêm chỉnh, bởi v́ đây cũng là h́nh thức mà tác giả trực tiếp ghi
nhận đóng góp của các nhà nghiên cứu khác cho nghiên cứu của ḿnh. Trong hoạt
động khoa học, số lần trích dẫn là một loại “tiền tệ” và là một chỉ tiêu quan
trọng để đo lường ảnh hưởng của một công tŕnh nghiên cứu. Một trong những yêu
cầu của phân tham khảo tài liệu là trích dẫn phải chính xác (theo một công thức
như tên tác giả, tựa đề bài báo, tên tập san, năm xuất bản, số bộ và số trang),
phải liên quan đến văn cảnh, và nhất là tác giả đă đọc qua tài liệu mà ḿnh
trích dẫn (chứ không phải trích dẫn gián tiếp qua đọc các bài báo khác – một
hành vi thiếu thành thật tri thức).
Nhưng rất tiếc
các trích dẫn và cách tham khảo tài liệu trong các bài báo y học từ Việt Nam có
thể nói là “trăm hoa đua nở”, chẳng theo một thể thức, một hệ thống nào thống
nhất cả, hết sức tùy tiện. Một số tài liệu trích dẫn mà tôi có khả năng chuyên
môn để có thể khẳng định là chẳng phù hợp với phát biểu của tác giả!
Trung b́nh, mỗi
bài báo y học từ Việt Nam có khoảng 9 tài liệu tham khảo (ở phía Bắc) đến 17 ở
phía Nam. Không rơ tại sao lại có sự khác biệt khá lớn về con số tài liệu tham
khảo giữa hai miền như thế, nhưng thói quen và “văn hóa” trích dẫn có lẽ là một
yếu tố quan trọng.
Điều đáng nói
là một phần lớn các tài liệu tham khảo không phải là các bài báo khoa học nguyên
thủy (original article) mà chỉ là những bài báo trong các kỉ yếu hội nghị, hay
thậm chí tờ bướm quảng cáo của các công ti dược, hay có khi là một bài báo trên
các báo đại chúng như Tuổi trẻ!
Ngoài ra, nhiều
tài liệu trích dẫn (dù cũng chẳng phải là bài báo khoa học) khá “lạc hậu”, hơn
20 năm, tức khoảng thập niên 1980s. Trong khi đó, một “luật” bất thành văn
trong nghiên cứu y học là nên sử dụng và trích dẫn những nghiên cứu mới công bố
trong ṿng 5-10 năm.
Vấn đề
tác giả. Đứng tên tác giả một bài báo khoa học đồng nghĩa với viẹc chịu
trách nhiệm về những ǵ ḿnh viết và phát biểu. Năm 1985, Ủy ban tổng biên tập
các tập san y học (International Committee of Medical Journal Editors – ICMJE,
c̣n gọi là Vancouver Group) đề ra 3 tiêu chuẩn cho một tác giả bài báo khoa
học. Năm 2000, 3 tiêu chuẩn này được hiệu đính lại, và được giới khoa học quốc
tế công nhận là những tiêu chuẩn vàng để qui quyền tác giả. Theo định nghĩa của
ICMJE, một thành viên nghiên cứu có tư cách đứng tên tác giả phải hội đủ tất
cả 3 tiêu chuẩn sau đây: (a) Một là đă có đóng góp quan trọng trong việc
h́nh thành ư tưởng và phương pháp nghiên cứu, hay thu thập dữ kiện, hay phân
tích và diễn dịch dữ kiện; (b) hai là đă soạn thảo bài báo hay kiểm tra nội dung
tri thức của bài báo một cách nghiêm túc; và (c) ba là phê chuẩn bản thảo sau
cùng để gửi cho tập san.
Tính trung b́nh mỗi
bài báo y khoa ở Việt Nam chỉ có 2 tác giả (cao nhất là 4 tác giả). Không có sự
khác biệt giữa phía Nam và Bắc về số lượng tác giả bài báo y khoa. Con số này
tương đối thấp so với các bài báo y khoa ở ngoại quốc, với trung b́nh 6 tác giả
trên một bài báo.
Tuy nhiên, có
dấu hiệu cho thấy vấn đề tác giả bài báo y khoa ở Việt Nam c̣n khá tùy tiện.
Chẳng hạn như có bài báo mà tác giả chỉ đề tên họ một tác giả và kèm theo ḍng
chữ “và cộng sự”! Đây là một việc làm (hay thói quen) không thể chấp nhận trong
hoạt động khoa học.
Vài đề nghị cải thiện t́nh
h́nh
Sai sót và nhầm lẫn
trong nghiên cứu y khoa không phải chỉ xảy ra ở nước ta, mà c̣n khá phổ biến
ngay cả tại các nước đă phát triển. Theo một thống kê gần đây, gần 40% các bài
báo trong các tập san y học quốc tế có ít nhất là một sai sót. Tuy nhiên, đại
đa số những sai sót này là nhỏ, không ảnh hưởng đến kết luận của bài báo. C̣n
những sai sót mà tôi chỉ ra trong bài viết này là những sai sót nghiêm trọng, có
ảnh hưởng trực tiếp đến kết luận của công tŕnh nghiên cứu. Tôi có thể nói rằng
tất cả nhửng bài báo mà tôi đọc qua, nếu gửi cho các tập san y học quốc tế, chắc
chắn sẽ không qua khỏi ṿng đầu b́nh duyệt, chứ chưa nói đến việc có được chấp
nhận công bố hay không.
Nhưng t́nh h́nh và
điều kiện y tế ở nước ta đặt ra rất nhiều vấn đề thú vị, và y học Việt Nam hoàn
toàn có thể đóng góp làm phong phú tri thức y học thế giới. Để có mặt trên
trường quốc tế, chúng ta cần phải tự ḿnh khắc phục những vấn đề mà tôi vừa
nêu. Tôi đề nghị một vài biện pháp cụ thể sau đây:
Huấn
luyện về nghiên cứu khoa học. Phần lớn những vấn đề tôi nêu trong phần
trên có nguồn gốc từ vấn đề đào tạo. Các sinh viên y khoa sau đại học chưa được
huấn luyện về nghiên cứu khoa học, cho nên khi bắt tay vào nghiên cứu, họ không
ư thức được những sai lầm, những cạm bẫy trong nghiên cứu khoa học, và việc phạm
phải sai lầm, thiếu sót là hoàn toàn có thể hiểu được. Nh́n qua cách diễn đạt
các kết quả nghiên cứu, có thể nói rằng đại đa số tác giả chưa am hiểu các ư
nghĩa khoa học đằng sau những phương pháp mà họ áp dụng.
Do đó, đối với
các nghiên cứu sinh, trước khi tiến hành nghiên cứu cần phải trải qua một khóa
huấn luyện để nắm vững các nguyên lí, triết lí và phương pháp khoa học. Ngoài
ra, cần phải tổ chức các khóa học bồi dưỡng (continuing education) về phương
pháp khoa học cho các chuyên gia lâm sàng tham gia vào nghiên cứu khoa học.
Huấn
luyện về thống kê sinh học. Phân tích thống kê là một khâu quan
trọng không thể thiếu được trong các công tŕnh nghiên cứu khoa học, nhất là
khoa học thực nghiệm như nghiên cứu y khoa. Một công tŕnh nghiên cứu y khoa,
cho dù có tốn kém và quan trọng cỡ nào, nếu không được phân tích đúng phương
pháp sẽ không bao giờ có cơ hội được xuất hiện trong các tập san khoa học. Các
tạp san y học có uy tín càng cao yêu cầu về phân tích thống kê càng nặng. Không
có phần phân tích thống kê, bài báo không thể xem là một “bài báo khoa học”.
Không có phân tích thống kê, công tŕnh nghiên cứu chưa được xem là hoàn tất.
Ở nước ta khoa học
thống kê, nhất là thống kê sinh học, c̣n rất kém. Có thể nói không ngoa rằng sự
“lạc hậu” về khoa học thống kê ở nước ta đă làm ảnh hưởng không nhỏ đến y học
nước nhà. V́ nghiên cứu y học ở nước ta chưa được sự hỗ trợ từ khoa học thống
kê, cho nên rất nhiều nghiên cứu y học ở nước ta chưa có chất lượng cao, và chưa
thể công bố trên các tập san khoa học quốc tế. Người viết bài này biết rất
nhiều trường hợp nhiều nghiên cứu từ Việt Nam chỉ v́ không được thiết kế đúng
phương pháp, hay việc phân tích dữ liệu chưa đúng tiêu chuẩn khoa học nên bị các
tập san khoa học từ chối công bố.
Trong khi bất
cứ đại học nào ở các nước tiên tiến đều có một bộ môn thống kê học, một bộ môn
chuyên cung cấp tư vấn về thống kê học cho các nhà khoa học thực nghiệm, th́ ở
nước ta, các bộ môn khoa học vẫn c̣n giới hạn ở khoa toán, và chỉ xoay quanh một
vài vấn đề căn bản thống kê. Do đó, một chiến lược quan trọng cần đặt ra là
phát triển khoa học thống kê trong các trường đại học, nhất là thống kê sinh
học.
Ủy ban y
đức. Hiện nay, y đức là một vấn đề đáng quan tâm ở Việt Nam và trên thế
giới. Trong nghiên cứu y khoa, nhà nghiên cứu có nghĩa vụ phải tuân hành theo
một số qui định nghiêm ngặt để bảo đảm an toàn cho bệnh nhân và bảo mật thông
tin cá nhân của bệnh nhân. Vi phạm những qui định này chẳng những được xem là
thiếu y đức, mà c̣n là một gian lận (fraud) trong khoa học. Ở Mĩ đă có khá
nhiều trung tâm nghiên cứu y học bị đóng cửa và nhiều nhà nghiên cứu bị ṭa án
phạt (thậm chí đi tù) chỉ v́ vi phạm y đức trong nghiên cứu.
Tại các bệnh
viện và đại học cần có một ủy ban y đức để xét duyệt các tiêu chuẩn y đức của
một công tŕnh nghiên cứu. Ủy ban này cần có sự đại diện của giới nghiên cứu
khoa học, kể cả bác sĩ, luật, tôn giáo, và giới quản lí y tế. Bảy tiêu chuẩn y
đức ủy ban cần xem xét là: giá trị xă hội và giá trị khoa học của công tŕnh
nghiên cứu; công tŕnh nghiên cứu phải phù hợp với các chuẩn mực khoa học; tuyển
chọn đối tượng nghiên cứu phải công bằng (nếu có thể, không nên thiên vị giới
tính, hay độ tuổi, hay tôn giáo, hay dân tộc); nghiên cứu phải có ích cho bệnh
nhân; đă được một hội đồng khoa học độc lập b́nh duyệt và chấp thuận; bệnh nhân
có quyền từ chối tham gia hay ưng thuận; và bệnh nhân đă tham gia vào công tŕnh
có quyền rút ra bất cứ lúc nào [3].
Kiện toàn
hệ thống b́nh duyệt. B́nh duyệt (peer-review) là một hoạt động rất quan
trọng trong nghiên cứu khoa học. Mục đích của việc b́nh duyệt là thẩm định và
kiểm tra các bài báo khoa học trước khi chấp nhận cho công bố trên một tập san
khoa học. Hệ thống này c̣n được ứng dụng trong việc duyệt những đơn xin tài trợ
cho nghiên cứu tại các nước Tây phương.
Qua cơ chế này
mà tập san có thể ngăn chận những cặn bă, r |