www YKHOANET

NGHIÊN CỨU Y KHOA

B́nh luận y khoa

Bài giảng thống kê sinh học - (Biostatistics)

Thống kê R

Từ điển y khoa

Tạp chí y khoa

 

GÓC SINH VIÊN Y KHOA

Atlas ykhoa

Thông tin sinh viên

Triệu chứng học nội khoa

Thông số Cận Lâm Sàng

Tim mạchĐiều dưỡng

H́nh ảnh y khoa

 

TRƯỜNG  Y KHOA

ĐH Y Khoa Hà Nội

ĐH Y Dược TPHCM

ĐH Y Khoa Thái Nguyên

ĐH Y Khoa Huế

ĐH Y Khoa Thái B́nh

ĐH Y Tế Công Cộng

 

Phụ trách thường trực:
GS Nguyễn Văn Tuấn
TS Nguyễn Đ́nh Nguyên
BS Phan Xuân Trung

 

Nghiên cứu y học ở Việt Nam - đặc điểm, thiếu sót, và sai sót

Nguyễn Văn Tuấn

            Sự có mặt của y học Việt Nam trên trường quốc tế c̣n rất khiêm tốn, bởi v́ phần lớn các nghiên cứu y học ở Việt Nam được công bố trong các tạp chí y học trong nước.  Trong một phân tích tổng hợp gần đây của tác giả Phạm Duy Hiển, trong thời gian 1995 đến 2004, trung b́nh hàng năm giới nghiên cứu y khoa Việt Nam công bố khoảng 1000 bài báo y sinh học trong các tập san y học trong và ngoài nước; trong số này chỉ có 5 bài trong các tập san y học quốc tế [1].  Nói cách khác, chỉ có khoảng 0,5% nghiên cứu y học từ Việt Nam có mặt trên các diễn đàn y học quốc tế.  Con số này c̣n rất khiêm tốn nếu so với các nước lân cận như Thái Lan hay Mă Lai.

Có nhiều lí do tại sao các nghiên cứu chỉ công bố trên các tạp chí địa phương, kể cả sự liên quan của nghiên cứu đối với t́nh h́nh và bối cảnh Việt Nam, soạn thảo bằng tiếng Việt, hay không được chấp nhận cho công bố trên các tập san quốc tế.  Nhưng hoạt động khoa học là một lĩnh vực phi biên giới, cho nên dù là nghiên cứu từ Việt Nam, nhưng nếu các nghiên cứu có chất lượng tốt (như ư tưởng mới hay phương pháp nghiên cứu đúng tiêu chuẩn khoa học) th́ các nghiên cứu đó vẫn có giá trị khoa học, và vẫn có thể xuất hiện trong các tập san y học quốc tế.  Do đó, vấn đề chất lượng các nghiên cứu đă công bố trong các tạp chí y học ở Việt Nam cần được đặt ra để t́m một hướng đi tích cực hơn.

            Người viết bài này đă điểm qua một số bài báo khoa học xuất hiện trong các tạp chí y học thuộc trường Đại học Y Hà Nội, Đại học Y Dược Thành phố Hồ Chí Minh, Tạp chí Y học thực hành, Tạp chí Nghiên cứu Y học, và Tạp chí Dược học.  Các bài báo này được công bố trong khoảng thời gian từ 2001 đến 2006.  Trong mỗi số và mỗi tạp chí, tôi ngẫu nhiên chọn ra 3 bài ở mục “nghiên cứu y học” (hay tương tự).  Tất cả có 56 bài được chọn, và tôi đọc tất cả và ghi chú những điểm cần lưu ư về ư tưởng, phương pháp và cách tŕnh bày kết quả nghiên cứu.

Điểm qua các bài báo này, tôi thấy nhiều nhà nghiên cứu trong nước đă có những công tŕnh nghiên cứu có ích với ư tưởng hay, có thể ứng dụng vào việc chăm sóc bệnh nhân.  Chẳng hạn như những công tŕnh nghiên cứu về HIV và so sánh phương pháp xét nghiệm sinh hóa (do các nhà nghiên cứu thuộc Đại học Y Dược TPHCM tiến hành) hay nghiên cứu về độ tuổi măn kinh và các yếu tố liên quan đến măn kinh (Đại học Y Hà Nội) mà kết quả rất thú vị và có thể khai triển thêm thành một nghiên cứu có ích cho bệnh nhân.  Ngoài ra, c̣n có một số nghiên cứu mang tính phát triển phương pháp xét nghiệm và chẩn đoán mới với kết quả rất đáng khích lệ.  Trong điều kiện hạn hẹp kinh phí và cơ sở vật chất mà các đồng nghiệp trong nước đă tiến hành những nghiên cứu qui mô lớn và công phu như thế quả là một nỗ lực đáng trân trọng.  Tôi thiết nghĩ những công tŕnh như thế đáng lẽ phải có mặt trong các tập san y học uy tín trên thế giới, nhưng rất tiếc điều đó chưa xảy ra. 

            Vấn đề đặt ra là tại sao các nghiên cứu như thế không có mặt trên các diễn đàn y học quốc tế?  Điểm qua các nghiên cứu này một cách cẩn thận, tôi cho rằng nguyên nhân là do thiết kế nghiên cứu chưa được thỏa đáng và chưa có hệ thống.  Ngoài ra, c̣n có rất nhiều nghiên cứu với khá nhiều thiếu sót và sai lầm, v́ khiếm khuyết trong phương pháp nghiên cứu và do đó chất lượng không mấy cao.  Có khi những thiếu sót và sai lầm này rất nghiêm trọng đến độ kết quả nghiên cứu rất khó diễn dịch, và có thể nói là không có giá trị khoa học ǵ cả.  Trong bài viết này, tôi sẽ nêu lên một số thiếu sót phổ biến nhất và sẽ đưa ra một số đề nghị để nâng cao chất lượng nghiên cứu y học ở trong nước.

Ư tưởng: thiếu cái mới

            Giá trị một nghiên cứu y học có thể đánh giá qua bốn câu hỏi chính: tại sao nghiên cứu (ư tưởng hay vấn đề nghiên cứu), đă làm ǵ (phương pháp), phát hiện cái ǵ (kết quả), kết quả đó có ư nghĩa ǵ (thảo luận về kết quả).  Về phần ư tưởng nghiên cứu, có thể nói ngắn gọn rằng gần như tất cả các nghiên cứu xuất hiện trong các tập san y học trong nước xoay quanh 4 chủ đề chính như sau:

  • Nghiên cứu mô tả thuần túy ở một nhóm bệnh nhân hay quần thể, như chỉ số sinh hóa ở bệnh nhân tai biến mạch máu năo, chỉ số lipid ở bệnh nhân cao huyết áp, tế bào lymphô và CD4 ở bệnh nhân AIDS/HIV, mật độ xương ở đàn ông, v.v… V́ tính chất mô tả, cho nên các nghiên cứu này chưa thể đào sâu và phân tích các vấn đề bệnh lí, lâm sàng.
  • Nghiên cứu t́m hiểu các yếu tố nguy cơ cũng chiếm một phần khá lớn trong các nghiên cứu lâm sàng ở Việt Nam.  Các nghiên cứu này có mục tiêu chính là phát hiện các yếu tố có thể liên quan đến bệnh.  Một số nghiên cứu tiêu biểu như yếu tố miễn dịch ở bệnh nhân viêm cầu thận, nguyên nhân của t́nh trạng thiếu máu ở trẻ em, mối liên hệ giữa homocysteine và nhồi máu năo, yếu tố dự đoán phù năo tử vong, v.v… Nhưng các nghiên cứu này đáng lẽ phải được tiến hành theo thời gian (tức theo dơi đối tượng một thời gian để xác định các yếu tố nguy cơ ban đầu và phát triển bệnh về sau), nhưng rất tiếc các nghiên cứu ở Việt Nam chỉ giới hạn ở dạng  “cắt ngang”, thành ra, giá trị khoa học không cao; thậm chí, mục tiêu đề  ra cũng không đạt được.  Một số nghiên cứu, tuy mục đích là t́m “nguyên nhân” của bệnh, nhưng v́ cách thiết kế, cho nên tác giả báo chỉ có thể kết luận là “yếu tố nguy cơ” chứ không thể là “nguyên nhân” được.
  • Nghiên cứu về chẩn đoán như tiêu chuẩn chẩn đoán ung thư phế quản bằng cách sử dụng tế bào học, chẩn đoán màng năo trẻ em bằng kĩ thuật PCR, so sánh kết quả chẩn đoán, hay giá trị chẩn đoán của siêu âm ở các bệnh nhân với sỏi đường mật.  Đọc qua các nghiên cứu này, tôi thấy rất nhiều tác giả hiểu không đúng (hoặc quá đơn giản) về giá trị chẩn đoán, cho nên có những kết luận quá lạc quan.  Thật ra, phần lớn nghiên cứu đều khó mà ứng dụng trong thực tế lâm sàng, bởi v́ phương án nghiên cứu chỉ, một lần nữa, dừng lại ở dạng “nghiên cứu cắt ngang”. Đáng lẽ ra, các nghiên cứu này phải là những nghiên cứu theo thời gian (prospective study) để kết quả có thể ứng dụng trong việc tiên đoán bệnh tật cho một cá nhân.
  • Nghiên cứu dược thảo thường tập trung vào các phân tích sinh hóa và độc tính của một số dược thảo như độc tính của cây trâm bầu.  Các nghiên cứu này nói chung là khá đơn giản về kĩ thuật, và v́ cách mô tả nghiên cứu không rơ ràng nên rất khó đánh giá giá trị khoa học của chúng.

Đại đa số các nghiên cứu trên cũng chỉ dừng lại ở mức độ đơn giản, chứ chưa đi sâu vào lĩnh vực phân tích (analytical research). Phần lớn các nghiên cứu chỉ giải quyết các vấn đề mang tính địa phương, những vấn đề mang tính vi mô, chứ chưa nhằm trả lời những câu hỏi lớn của y học.  Một số lớn nghiên cứu mang tính [mà tiếng Anh hay gọi là] “me too”, tức là nghiên cứu lặp lại ư tưởng của người khác, hoàn toàn không có một phát kiến ǵ mới.  (Xin nói thêm, đó chỉ là một nhận xét thực tế, chứ không phải một phê phán).

Giá trị khoa học: dưới trung b́nh

            Ngoài ư tưởng mới, giá trị khoa học của một nghiên cứu y học thường được đánh giá qua phương pháp, nhất là phương pháp thiết kế và thu thập dữ liệu.  Theo y học thực chứng, có 7 loại thiết kế nghiên cứu chính như sau (xếp theo thứ bậc giá trị khoa học từ thấp nhất đến cao nhất):

  • Nghiên cứu cơ bản trên chuột và động vật cấp thấp trong pḥng thí nghiệm về một phân tử hay tác nhân cụ thể;
  • Báo cáo lâm sàng (case reports) trong thực tế là những kinh nghiệm điều trị về một hay vài trường hợp lâm sàng đặc biệt và hiếm thấy;
  • Nghiên cứu đối chứng (case-control study) là những nghiên cứu nhằm mục đích t́m hiểu mối liên hệ giữa một yếu tố nguy cơ và bệnh tật bằng cách xem xét và so sánh sự phân phối một yếu tố nguy cơ giữa nhóm bệnh nhân và nhóm không mắc bệnh (đối chứng);
  • Nghiên cứu tiêu biểu tại một thời điểm (cross-sectional study) là những nghiên cứu cắt ngang, mà mục đích thường là ước tính tỉ lệ hiện hành của bệnh (prevelance) và các yếu tố liên quan đến bệnh trong một quần thể;
  • Nghiên cứu theo thời gian (prospective / longitudinal study) là những nghiên cứu theo dơi một nhóm đối tượng, kể cả bệnh nhân, một thời gian nhằm ước tính tỉ lệ phát sinh của bệnh (incidence) và các yếu tố liên quan đến bệnh trong một quần thể;
  • Thử nghiệm lâm sàng đối chứng ngẫu nhiên (randomized controlled clinical trial - RCT) là những thí nghiệm công phu hơn thường được sử dụng trong việc thẩm định mức độ hiệu nghiệm của một thuật điều trị lâm sàng trong một nhóm đối tượng cụ thể; và
  • Phân tích tổng hợp (meta-analysis), như tên gọi, là những nghiên cứu tổng hợp các kết quả nghiên cứu RCT, cross-section, longitudinal và case-control để đi đến một kết luận chính xác và đáng tin cậy hơn.

Đại đa số các nghiên cứu y học công bố trong các tạp chí y học ở Việt Nam là những nghiên cứu đối chứng và nghiên cứu cắt ngang.  Chưa thấy một nghiên cứu cơ bản, RCT hay một phân tích tổng hợp nào trong các tạp chí ở Việt Nam.  Như vậy, các tạp chí y học ở trong nước chỉ công bố những công tŕnh nghiên cứu có giá trị khoa học thấp dưới trung b́nh.

            Ngay cả những nghiên cứu đối chứng và nghiên cứu cắt ngang, các đối tượng thường là bệnh nhân trong các bệnh viện, chứ không được tiến hành trong một quần thể dân số được lấy mẫu một cách có hệ thống.  Một ví dụ tiêu biểu là nghiên cứu về mối liên hệ giữa homocysteine huyết tương và chứng nhồi máu năo được tiến hành bằng cách so sánh một nhóm bệnh nhân nhồi máu năo với một nhóm bệnh nhân ngoại trú.  V́ cách chọn đối tượng nghiên cứu từ bệnh viện (tức là những người đă có nguy cơ bệnh cao) cho nên kết quả không mang tính khách quan cao, và rất khó mà ứng dụng cho một quần thể lớn hơn.

            Có một số nghiên cứu nhằm mục đích chẩn đoán bệnh, nhưng v́ chủ yếu là nghiên cứu cắt ngang hay nghiên cứu đối chứng (mà đối tượng thường là bệnh nhân từ bệnh viện), cho nên kết quả rất khó diễn dịch, nếu không muốn nói là chẳng áp dụng vào thực hành lâm sàng được.  Tiêu biểu cho nghiên cứu dạng này là một nghiên cứu thẩm định giá trị siêu âm trong việc chẩn đoán sỏi đường mật, các nhà nghiên cứu chỉ xem xét các bệnh nhân đă được giải phẫu mà không có nhóm đối chứng (không bệnh), cho nên kết quả chẳng có ư nghĩa ǵ dù các tác giả kết luận rằng “Siêu âm là một phương pháp hữu hiệu trong chẩn đoán sỏi đường mật chính nói chung Sn=95,9%.”  (Chú ư Sn là tỉ lệ dương tính thật).  Nhưng tác giả “quên” đề cập tỉ lệ âm tính thật, bởi v́ tỉ lệ này không thể ước tính được!

Một số nghiên cứu nhằm mục đích phát triển chẩn đoán nhưng v́ thiết kế không phù hợp (như nghiên cứu cắt ngang, hay dựa vào bệnh nhân nội trú), cho nên các kết quả và kết luận chẳng có ư nghĩa ǵ và chẳng đáp ứng được mục đích đặt ra.

Một nghiên cứu có giá trị khoa học phải được thiết kế sao cho tuân thủ ba nguyên tắc: ngẫu nhiên hóa (randomization), có nhóm đối chứng (control), lặp lại nhiều lần (replication) hoặc phân nhóm (blocking).  Một số lớn nghiên cứu trong bệnh viện thậm chí không có nhóm đối chứng (một “vi phạm” cơ bản trong phương pháp nghiên cứu), cho nên kết quả dù được tŕnh bày ở dạng nào vẫn rất khó diễn dịch và chẳng có giá trị khoa học ǵ đáng kể.

Phương pháp nghiên cứu: quá nhiều sai sót

            Một công tŕnh nghiên cứu y học được xem là một cống hiến mới nếu công tŕnh đó nêu lên được một vấn đề mới, một ư tưởng mới, hay sử dụng một phương pháp mới cho một vấn đề cũ.  Do đó, phương pháp nghiên cứu đóng một vai tṛ then chốt về chất lượng của một nghiên cứu.  Phương pháp ở đây là cách thiết kế nghiên cứu, phương pháp phân tích vấn đề, kể cả phân tích số liệu, và phương pháp đo lường hay thu thập dữ liệu.

            Theo một thống kê những nguyên nhân mà các bài báo không được chấp nhận cho công bố trên các tạp chí y học quốc tế, 70% là do có vấn đề về phương pháp, và trong số này hơn 50% là do phân tích số liệu sai phương pháp, và phần c̣n lại là vấn đề đo lường.  Những ai có kinh nghiệm nghiên cứu khoa học đều có thể đánh giá giá trị của một bài báo qua phần phương pháp.

            Phân tích dữ liệu bằng các mô h́nh thống kê đóng một vai tṛ then chốt trong các nghiên cứu y khoa.  Thống kê cung cấp cho nhà nghiên cứu một cách suy nghĩ về dữ liệu, để hiểu và diễn dịch ư nghĩa của dữ kiện.  Giá trị khoa học của kết luận từ một nghiên cứu không chỉ tùy thuộc vào phương án (thiết kế) của nghiên cứu mà c̣n tùy thuộc một phần lớn vào việc áp dụng đúng phương pháp thống kê.  Để áp dụng đúng phương pháp thống kê, người phân tích chẳng những phải hiểu rơ các giả định đằng sau những phương pháp này, mà c̣n phải nắm vững mục đích nghiên cứu, am hiểu phương pháp đo lường và cách thu thập dữ liệu.  Chẳng hạn như kiểm định t hay phân tích phương sai (analysis of variance) chỉ có thể áp dụng phân tích các biến số tuân theo luật phân phối chuẩn (normal distribution); nhưng nếu các phương pháp này được ứng dụng cho các biến số không theo phân phối chuẩn hay các biến số không liên tục (discrete variable) th́ kết quả sẽ trở nên vô nghĩa và kết luận cũng sai.

            Các nghiên cứu y học xuất hiện trong các tạp chí y học trong nước có quá nhiều sai sót về phương pháp phân tích.  Có thể nói không ngoa rằng 100% các bài báo mà tôi đọc qua đều có ít nhất là một sai sót, một sai lầm về phương pháp phân tích số liệu.  Có khi sai sót rất nghiêm trọng, có lẽ xuất phát từ việc hiểu sai mô h́nh thống kê, cho nên kết quả và kết luận sai.  Những sai sót trong phần này có thể chia thành 5 nhóm sau đây:

            Ứng dụng sai phương pháp.  Như đề cập trên, mỗi phương pháp phân tích thống kê đều có những giả định đằng sau và chỉ thích hợp cho một số dạng nghiên cứu hay một số loại số liệu cụ thể.  Chẳng hạn như phương pháp kiểm định thống kê cho các “nghiên cứu trước – sau” (before-after study, tức các nghiên cứu mà một nhóm đối tượng được thẩm định trước và sau khi điều trị) không thể áp dụng để so sánh hai nhóm bệnh nhân độc lập. 

            Trong một nghiên cứu về tác dụng điều trị viêm dạ dày, các tác giả so sánh t́nh trạng viêm (5 thứ bậc: viêm nông, viêm teo nhẹ, viêm teo vừa, viêm teo nặng, và niêm mạc b́nh thường) trong một nhóm bệnh nhân trước và sau điều trị.  Kết quả nghiên cứu được phân tích bằng kiểm định Chi b́nh phương (Chi square test) với 3 bậc tự do (degrees of freedom).  Ứng dụng phương pháp phân tích Chi b́nh phương rất sai trong dạng nghiên cứu này, bởi v́ số liệu thu thập trước và sau điều trị không độc lập với nhau.  Con số bậc tự do cũng sai!  

            Vi phạm và bất chấp giả định.  Các phương pháp kiểm định thông thường nhất như kiểm định t (t-test) tuy rất dễ tính toán, nhưng kết quả có khi cũng rất dễ sai lầm nếu không xem xét đến sự phân phối của số liệu.  Nếu hai biến không có cùng phương sai th́ kiểm định t không thể áp dụng.  Ấy thế mà nhầm lẫn này thường rất phổ biến trong các nghiên cứu y học từ Việt Nam.  Một ví dụ về sai lầm tiêu biểu là trong một nghiên cứu mô tả về bệnh AIDS, các tác giả viết “số lượng tuyệt đối tế bào CD4 của các bệnh nhân AIDS là 229 ± 35 tb/ml so với số TCD4 ở nhóm người b́nh thường khỏe mạnh là 879 ± 232 tb/ml … giảm có ư nghĩa thống kê với p<0,001”!  Tuy tác giả không cho biết con số đằng sau dấu “±” là ǵ, nhưng chắc chắn đó là chỉ số phản ánh độ dao động của số lượng tế bào CD4, và qua báo cáo trên, có thể thấy rằng nhóm đối tượng b́nh thường có độ dao động rất cao so với nhóm bệnh nhân (232 so với 35 tb/ml), và do đó hai nhóm này không có cùng dạng phân phối, cho nên kết quả từ kiểm định t có vấn đề.

            Nhưng cũng có trường hợp tác giả biến đổi số liệu một cách vô lí do.  Chẳng hạn như một nghiên cứu về homocysteine (một loại axít trong máu nghi ngờ là có liên hệ đến bệnh tim), các nhà nghiên cứu biến đổi đo lường homocysteine qua đơn vị logarít: “Do homocysteine huyết tương có độ lệch là 1,11 nên tính biến đổi log và trung vị”.  Nhưng khi đọc kĩ bài báo, tôi thấy độ homocysteine trung b́nh là 9,67 mmol/L và độ lệch chuẩn là 3,07 mmol/L (chứ không phải 1,1 mmol/L), và nh́n vào biểu đồ phân phối của homocysteine tôi thấy việc biến đổi số liệu này không cần thiết, nếu không muốn nói là làm cho kết quả khó hiểu hơn (một người b́nh thường đă khó hiểu đơn vị mmol/L, và càng cảm thấy rối rắm hơn trước đơn vị như log của mmol/L!)

            Phân nhóm tùy tiện.  Trong phần lớn các bài báo khoa học, các tác giả có xu hướng chia một biến số liên tục (như độ tuổi, lymphocyte, thời gian, v.v…) thành nhiều nhóm một cách cực ḱ tùy tiện.  Chẳng hạn như có tác giả chi độ tuổi thành từng nhóm theo 10-tuổi như 40 đến 49, 50 đến 59, và 60 đến 70, nhưng một nghiên cứu khác có tác giả chia thành nhóm tuổi lẻ như 35 đến 45, 46 đến 55, và trên 55!  Có khi ngay trong một nghiên cứu, tác giả lại tự ḿnh mâu thuẫn: lúc đầu th́ chia thành 4 nhóm độ tuổi (1 đến 12 tháng, 1 - 5 tuổi, 6-10, 10-15) nhưng ngay sau đó lại chia thành 3 nhóm (1 – 12 tháng, 13 tháng đến 5 tuổi, và 6 đến 15 tuổi)!  Ngay cả các biến như huyết áp cũng bị cắt thành từng nhóm như thế, và cách chia cắt đó hoàn toàn không có một lí do lâm sàng nào.

            Đứng trên phương diện lí thuyết đo lường và phân tích thống kê, việc biến đổi một một biến số liên tục thành một biến số không liên tục (như cách chia cắt trên) là một sai sót, bởi v́ việc biến đổi đó làm cho thông tin bị mất (loss of information) của biến.  Chẳng hạn như một phân tích tiên đoán xác suất mắc bệnh dựa vào hai biến liên tục như độ tuổi và trọng lượng của bệnh nhân lúc nào cũng cần ít thông số hơn là một phân tích dựa vào nhóm tuổi và nhóm trọng lượng. 

Ngoài ra, đứng trên phương diện logic và thực tế lâm sàng, không có lí do ǵ để chia hai bệnh nhân với áp suất máu 110 mmHg và 111 mmHg thành hai nhóm khác nhau cả.  Chính v́ thế mà các tập san y khoa và nhà thống kê khuyến cáo nên tránh cách phân chia một biến số liên tục một cách tùy tiện.

            Phân tích theo kiểu “câu cá”, thiếu kế hoạch.  Cũng như người câu cá, nếu chịu khó kiên tŕ câu cá hết nơi này sang nơi khác và tháng này sang tháng nọ, th́ thể nào cũng câu được một con cá (dù con cá này không nằm trong dự tính ban đầu), nhà nghiên cứu cũng có thể kiên tŕ t́m cách phân tích hết nhóm này sang nhóm nọ đến khi “phát hiện” được một khác biệt nào đó mà nhà nghiên cứu không nghĩ đến lúc khởi đầu nghiên cứu.  Đó là những phát hiện mà giới khoa học gọi là “fishing expedition” (chuyến câu cá).  Một công tŕnh nghiên cứu thông thường đo lường nhiều biến số phản ánh t́nh trạng của bệnh nhân.  Với nhiều biến số như thế và nhiều cách phân nhóm bệnh nhân theo giới tính, độ tuổi hay các chỉ tiêu lâm sàng khác, nhà nghiên cứu có thể có hàng trăm, thậm chí hàng ngàn, nhóm nhỏ đối tượng để phân tích.  Trong trường hợp đó, một số kết quả phân tích sẽ có “ư nghĩa thống kê” chỉ v́ yếu tố ngẫu nhiên mà chẳng có ư nghĩa sinh học nào cả. 

Rất nhiều nghiên cứu y khoa từ Việt Nam mà tôi đọc qua mang tính câu cá như mô tả trên.  Chẳng hạn như một nghiên cứu về mối liên hệ giữa lipid và chứng cao huyết áp, các nhà nghiên cứu đo lường 4 chỉ số lipid như tổng số cholesterol, LDL cholesterol, HDL cholesterol, và triglycerides trong hai nhóm đối tượng nam và nữ (nhóm cao huyết áp và nhóm b́nh thường) tuổi từ 40 đến 70 tuổi.  Họ chia các đối tượng thành 3 nhóm tuổi theo giới, cộng với hai nhóm đối tượng, các nhà nghiên cứu có đến 12 nhóm nhỏ khác nhau.  Với 12 nhóm nhỏ, các nhà nghiên cứu có thể làm 66 phân tích so sánh.  Và, mỗi so sánh, họ có thể lặp lại 4 lần (cho 4 chỉ số lipid).  Sau khi phân tích nhiều như thế, các nhà nghiên cứu phát hiện rằng chỉ có triglycerides là khác biệt giữa nam và nữ, và sự khác biệt này chỉ t́m thấy trong nhóm đối tượng tuổi từ 40 đến 49 và chỉ trong nữ giới thuộc nhóm b́nh thường.  Nói cách khác, các nhà nghiên cứu đă đi ra ngoài mục đích ban đầu của nghiên cứu, và phát hiện được một khác biệt mà câu hỏi “tại sao” vẫn chưa thể trả lời bằng lí giải sinh học.

            Để cho máy tính làm việc.  Ngày nay, rất nhiều phần mềm cho phân tích thống kê được phát triển, giúp cho nhà nghiên cứu có thể tiến hành những phân tích phức tạp một cách nhanh gọn và hữu hiệu.  Nhiều mô h́nh phân tích mà chỉ vài thập niên trước đây không ai dám mơ đến (v́ có thể tốn đến hàng tháng, hay thậm chí bất khả thi) nay có thể thực hiện trong ṿng vài phút.  Nhưng các phần mềm này là những con dao hai lưỡi: một mặt, chúng giúp cho nhà nghiên cứu giải quyết vấn đề tính toán; mặt khác, chúng có thể bị lạm dụng để tiến hành những phân tích sai, vô duyên, vô ư thức và vô nguyên tắc.  Người ta có thể sử dụng các phần mềm này để tính số trung b́nh của hàng triệu số điện thoại, nhưng tất nhiên kết quả đó vẫn chỉ là một con số ngẫu nhiên, chẳng có ư nghĩa ǵ trong thực tế.

            Tiêu biểu t́nh trạng này là để cho các phần mềm phân tích thống kê làm cái việc mà đáng lẽ nhà nghiên cứu phải làm: phân tích và suy nghĩ.  Trong một nghiên cứu về mối liên hệ giữa homocysteine và chứng nhồi máu năo, các nhà nghiên cứu viết: “Phương tŕnh hồi qui bội log được xây dựng nhồi máu năo như biến phụ thuộc, homocysteine và các yếu tố nguy cơ như biến độc lập.  Bằng phương pháp loại dần, kết quả các biến dự đoán quan trọng nguy cơ nhồi máu năo gồm: homocysteine, cao huyết áp, và hút thuốc lá”.  Nhưng khi xem kĩ bảng kết quả phân tích dưới đây th́ người đọc sẽ có một “bức tranh” rất khác với nhận xét đó:

Yếu tố

Hệ số b

Hệ số tương quan

Sai số

P

Homocysteine>15 mmol/L

1,66

-0,19

0,40

<0,001

Cao huyết áp

-1,84

-0,42

0,22

<0,001

Hút thuốc

-1,11

-0,92

0,43

0,01

Nhồi máu năo

1,92

1,00

0,46

<0,001

Theo bảng kết quả này (dù tác giả không giải thích “hệ số b” là ǵ, nhưng tôi có thể biết được ư nghĩa của nó), th́ quả là cá nhân với độ homocysteine cao có nguy cơ bị chứng nhồi máu năo gia tăng, nhưng điều lạ lùng là kết quả trên c̣n cho thấy người với cao huyết áp và hút thuốc lá có nguy cơ nhồi máu năo thấp!  (Bảng số liệu này c̣n có một vấn đề khác: đó là cột “Hệ số tương quan”, không rơ tác giả ước tính hệ số tương quan giữa cao huyết áp và nhồi máu năo bằng cách nào, bởi v́ nhồi máu năo là một biến thể loại, làm sao ước tính tương quan với một biến liên tục như cao huyết áp?  Ngay cả việc tŕnh bày trong một bảng số cũng gây ra không ít lẫn lộn!)  

Thật ra, đây là một sai sót rất phổ biến trong phân tích thống kê đa biến mà nếu người phân tích không chịu khó suy nghĩ rất dễ bị sai lầm. Trong trường hợp mà các biến độc lập có tương quan (correlation) với nhau, và khi các biến này được phân tích trong một mô h́nh, t́nh trạng đa tương quan (multicollinearity) sẽ xảy ra, và các thông số từ mô h́nh này có thể không c̣n ư nghĩa thực tế nữa.

Trong nhiều nghiên cứu với mục đích tiên đoán khả năng mắc bệnh, việc xây dựng một mô h́nh tiên đoán bằng thống kê rất phức tạp.  Trong hàng chục, thậm chí hàng trăm, yếu tố lâm sàng, vấn đề đặt ra là yếu tố nào có liên quan đến khả năng mắc bệnh.  Để trả lời câu hỏi này nhà nghiên cứu phải xây dựng một mô h́nh tiên đoán (predictive model) đơn giản nhưng chính xác dựa vào các yếu tố nguy cơ.  V́ có nhiều yếu tố nguy cơ, cho nên con số mô h́nh tiên đoán có thể lên đến hàng ngàn, thậm chí hàng triệu mô h́nh, và chọn mô h́nh nào tối ưu nhất là một việc làm không đơn giản chút nào. Khoa học thống kê cung cấp nhiều mô h́nh để giải quyết vấn đề, nhưng nó đ̣i hỏi nhà nghiên cứu phải am hiểu mô h́nh, chứ không phải để cho máy tính quyết định mô h́nh. 

Có thể nói rằng không có một nghiên cứu nào mà người viết đọc qua ứng dụng các mô h́nh phân tích đa biến đúng cả.  Các nhà nghiên cứu Việt Nam vẫn c̣n quá tùy thuộc vào phần mềm phân tích thống kê và để cho các phần mềm này “chỉ thị”.  Đó là một điều rất đáng tiếc, v́ rất dễ dẫn đến sai lầm nghiêm trọng trong kết quả nghiên cứu.  Chẳng hạn như một nghiên cứu nhằm t́m các yếu tố nguy cơ (risk factors) để dự đoán khả năng phù năo tử vong ở các bệnh nhân nhồi máu năo, và tác giả viết như sau: “Các biến có liên quan với tử vong do thần kinh trong phân tích đơn biến với mức ư nghĩa p<0,05 sẽ được đưa vào phân tích hồi qui đa biến logistic”.  Nói cách khác, các tác giả tiến hành phân tích hai giai đoạn: giai đoạn 1 họ phân tích từng biến một và chỉ lưu lại các biến nào có ư nghĩa thống kê (p<0,05); trong giai đoạn 2, tất cả các biến có ư nghĩa thống kê trong giai đoạn 1 được đưa vào phân tích đa biến.  Đây cũng là một sai lầm khá phổ biến, không những trong các nghiên cứu ở Việt Nam mà c̣n ở nước ngoài, v́ cách phân tích như thế sẽ loại bỏ các biến có thể có liên quan đến phù năo tử vong tuy không có ư nghĩa thống kê trong giai đoạn 1 nhưng lại có ư nghĩa thống kê trong giai đoạn 2 khi mà các biến được xem xét cùng một lúc trong một mô h́nh.  Sai lầm này có lẽ phản ánh sự thiếu am hiểu về mô h́nh hồi qui logistic và phương pháp xây dựng mô h́nh trong thống kê học.

            Hiểu sai khái niệm.  Trong một nghiên cứu khác, tác giả tỏ ra chưa am hiểu các khái niệm về đo lường trong chẩn đoán y khoa nên viết: “Kết quả siêu âm được đối chiếu với kết quả phẫu thuật và rút ra 4 khả năng có thể xảy ra của từng dấu hiệu trên siêu âm: dương tính thật, dương tính giả, âm tính thật, âm tính giả.  Từ đó tính các giá trị: độ nhạy, độ đặc hiệu, giá trị dự báo dương tính, giá trị dự báo âm tính.” Thật ra, không có chuyện tính toán độ nhạy, độ đặc hiệu từ các giá trị dương tính thật hay âm tính thật, bởi v́ độ nhạy (sensitivity) chính là dương tính thật, và độ đặc hiệu (specificity) chính là âm tính thật!  C̣n các giá trị dự báo dương tính và giá trị dự báo âm tính cũng sai, v́ thiết kế nghiên cứu không cho phép tác giả ước tính các chỉ số này.

            Một nghiên cứu về mối tương quan giữa tế bào lymphocyte và CD4 ở các bệnh nhân AIDS kết luận rằng “môi tương quan giữa tế bào lympho T CD4+ và tế bào lympho toàn phần ở 517 bệnh nhân ngoại trú cho thấy mối tương quan này theo tỉ lệ thuận với hệ số tương quan r=0.66 (p<0,001). Tương quan này yếu đi khi phân tầng theo tế bào lympho”.  Phát biểu trên khá khó hiểu, nhưng thật ra bảng thống kê số 5 của bài báo cho thấy kết quả rơ hơn:

Lymphocyte

N

Hệ số tương quan lympho CD4

P

Tất cả bệnh nhân

517

0,66

<0,001

<1000

60

0,36

0,005

1000 – 2000

208

0,49

<0,001

>5000

249

0,35

<0,001

(Một lần nữa, tác giả không giải thích “N” là ǵ, và trị số P đề cập đến cái ǵ!  Tuy nhiên những ai có kinh nghiệm nghiên cứu có thể đoán biết N là số đối tượng và trị số P đề cập đến ư nghĩa thống kê của hệ số tương quan.)  Vấn đề đặt ra là tại sao hệ số tương quan của cả nhóm (517 bệnh nhân) là 0,66, nhưng khi phân từng nhóm nhỏ th́ các hệ số tương quan chỉ dao động từ 0,35 đến 0,49 ?  Tác giả không giải thích, mà c̣n xem đó là một phát hiện y học!  Thật ra, đây là một sai lầm khá phổ biến trong các phân tích tương quan khi một biến số bị chia cắt thành từng mảnh nhỏ.  Bởi v́ khi một biến được chia thành từng nhóm th́ toàn cự của dăy số (range) trong từng nhóm nhỏ bị hạn chế, và phương sai (variance) trở nên thấp, và hệ quả của phương sai thấp là hệ số tương quan trong các nhóm nhỏ này cũng giảm.  Hệ số tương quan tính toán trong từng nhóm nhỏ như thế không phản ánh chính xác độ tương quan của một quần thể.  Đây là một hiện tượng số học, chứ chẳng phải làm một phát hiện có ư nghĩa sinh học ǵ cả.

Báo cáo: quá sơ sài và nhiều thiếu sót

            Báo cáo khoa học (hay bài báo khoa học – papers) là một “sản phẩm” của nghiên cứu khoa học, một loại “tiền tệ” trong hoạt động khoa học, bởi v́ báo cáo khoa học không chỉ là một bản báo cáo về một công tŕnh nghiên cứu, mà c̣n là một đóng góp cho kho tàng tri thức của thế giới.  Y học tiến bộ cũng nhờ một phần lớn vào thông tin từ những bài báo khoa học, bởi v́ qua chúng mà các nhà khoa học có dịp trao đổi, chia sẻ và học hỏi kinh nghiệm lẫn nhau.  Chính v́ tính trao đổi thông tin này, các báo cáo khoa học phải tuân theo một cấu trúc đặc thù và được viết bằng một văn phong ngắn gọn nhưng phải đầy đủ.  Cấu trúc một bài báo khoa học thường là cấu trúc IMRAD (Introduction – Dẫn nhập, Methods – Phương pháp, Results – Kết quả, và Discussion – Thảo luận.

Một báo cáo khoa học hay có thể thu hút người đọc “nhập cuộc”.  Do đó, tác giả phải suy nghĩ rất cẩn thận (và có khi khá lâu – một bài báo khoa học có khi viết đi viết lại đến 3 tháng trời).  Nếu không tiếp cận vấn đề một cách có việc hệ thống, tất cả những nỗ lực cho một bài báo khoa học có thể trở nên vô dụng, thậm chí đem lại ảnh hưởng xấu v́ một công tŕnh nghiên cứu sẽ không có cơ hội xuất hiện trên các tập san chuyên môn.  Mặc dù ở các nước phương Tây, người ta đă có nhiều bài viết chỉ dẫn – thậm chí cả sách dạy – cách viết một bài báo khoa học, nhưng ở nước ta, h́nh như vẫn chưa có một tài liệu chỉ dẫn như thế.  Có lẽ v́ lí do này mà rất nhiều bài báo khoa học tôi đọc qua đều có quá nhiều vấn đề về cách tŕnh bày cũng như văn phong rất khó hiểu (giống như thách đố người đọc!)  Không thể nêu tất cả các vấn đề ở đây, v́ 100% những bài tôi đọc qua thành thật mà nói, đều cần phải viết lại.  Ở đây, tôi chỉ nêu các vấn đề nổi cộm mà thôi:

            Dẫn nhập: lí do mù mờ.  Thông thường trong phần này, tác giả phải trả lời cho được câu hỏi “Tại sao làm nghiên cứu này?”  và để trả lời câu hỏi đó, tác giả phải điểm qua các nghiên cứu liên quan trong quá khứ ở Việt Nam và trên thế giới, chỉ ra những thiếu sót hay khía cạnh chưa giải quyết, và nêu lên mục đích cụ thể của nghiên cứu của tác giả.  Ngoài ra, tác giả c̣n phải thuyết phục người đọc vấn đề  mà tác giả quan tâm là một vấn đề lớn, có ư nghĩa xă hội, có liên quan đến việc nâng cao chất lượng chăm sóc bệnh nhân hay quần chúng.  Nhưng rất tiếc, không có một bài báo nào tôi đọc qua đáp ứng được các yêu cầu căn bản trên.  Các tác giả Việt Nam thường viết phần dẫn nhập rất ngắn (không đầy 1 phần tư trang giấy), ngắn đến nổi người đọc không hiểu tác giả muốn làm ǵ, và công tŕnh nghiên cứu có xứng đáng hay không.  Các tác giả có cố gắng điểm qua các nghiên cứu trước, nhưng quá hạn chế (trung b́nh chỉ có 2 tài liệu tham khảo).  Thậm chí, có nhiều bài báo, tác giả chẳng điểm qua các nghiên cứu trước!   

            Đối tượng nghiên cứu: mô tả quá sơ sài.  Kết quả nghiên cứu có thể khái quát hóa hay không tùy thuộc một phần lớn vào thành phần đối tượng nghiên cứu.  Chẳng hạn một nghiên cứu mà đối tượng là bệnh nhân nội trú trong bệnh viện khó mà áp dụng cho các quần thể lớn hơn trong dân số.  Do đó, mô tả đặc tính các đối tượng nghiên cứu rất quan trọng để người đọc có thể lượng xét giá trị khoa học của kết quả và kết luận.  Rất tiếc là trong các bài báo về nghiên cứu y khoa ở Việt Nam, các tác giả có vẻ không coi trọng khía cạnh này.  Phần lớn đối tượng nghiên cứu chỉ được mô tả bằng một đoạn văn ngắn. Chẳng hạn như nghiên cứu về t́nh h́nh suy dinh dưỡng, các tác giả viết vỏn vẹn một câu văn như sau: “Đối tượng nghiên cứu là trẻ em dưới 5 tuổi sinh từ ngày 1/1/1996 đến 31/12/2000 tại hai huyện Đông Sơn và Nga Sơn tỉnh Thanh Hóa”.  Đáng lẽ ở đây, tác giả nên cho người đọc và đồng nghiệp biết tại sao chọn hai huyện này, cách tuyển chọn đối tượng ra sao, ai là người liên lạc, có kế hoạch lấy mẫu hay không, v.v… nhưng rất tiếc các thông tin này không có, nên khó mà đánh giá giá trị khoa học của nghiên cứu này.

            Cở mẫu: thiếu lí do.  Một nghiên cứu có hệ thống phải là một nghiên cứu có kế hoạch và được tiến hành đúng với qui tŕnh khoa học từ khâu phát triển giả thiết, chọn phương án nghiên cứu, ước tính cỡ mẫu, đến phân tích và diễn dịch.  Trong các khâu này, ước tính cỡ mẫu (tức ước tính số đối tượng cần thiết cho nghiên cứu) đóng vai tṛ rất quan trọng.  Nếu số lượng đối tượng quá ít, kết quả nghiên cứu sẽ không có giá trị ǵ và không thể đi đến kết luận; ngược lại, nếu nghiên cứu có quá nhiều đối tượng hơn cần thiết th́ vi phạm y đức.  Do đó, một báo cáo khoa học có giá trị phải giải thích rơ tại sao nghiên cứu được tiến hành trên số đối tượng đă ấn định.  Nhưng tất cả các bài báo y học từ Việt Nam mà tôi xem qua hoàn toàn không có một lời giải thích ǵ về cỡ mẫu.  Do đó, rất khó mà hiểu các nghiên cứu này có quả thật được lên kế hoạch và thiết kế nghiêm chỉnh, hay chỉ là những nghiên cứu cho có bằng cách sử dụng bệnh nhân sẵn có trong bệnh viện.

Phương pháp đo lường: quá tiết kiệm chữ nghĩa.  Trong giới nghiên cứu khoa học, người ta có câu “rác vào, ra rác” (garbage in, garbage out), tức là nếu một nghiên cứu mà phương pháp đo lường thiếu chính xác, không có độ tin cậy cao, th́ kết quả của nghiên cứu đó cũng chỉ là một khối rác con số.  Do đó, kết quả của nghiên cứu tùy thuộc rất nhiều vào phương pháp đo lường, và tác giả phải có trách nhiệm mô tả chi tiết về các phương pháp thu thập số liệu, phân tích sinh hóa, đo lường các chỉ số lâm sàng, v.v… trong một bài báo khoa học.

            Điểm qua các nghiên cứu y học từ Việt Nam, tôi có thể nói đây là một phần yếu nhất, mù mờ nhất.  Không như các bài báo khoa học trên các tập san y học quốc tế mà phần phương pháp chiếm một phần lớn của nội dung bài báo, các bài báo y học từ Việt Nam rất “tiết kiệm” về phần này.  Hầu như nghiên cứu nào cũng mô tả phần phương pháp cực ḱ sơ sài, chỉ trong ṿng nửa trang giấy A4.  Một số nghiên cứu mà các tác giả chỉ mô tả chi tiết đo lường không đầy 50 chữ!  Thậm chí c̣n có một số nghiên cứu về huyết học, lipid mà các tác giả không có đến một chữ để mô tả phương pháp đo lường cholesterol ra sao, hay không một chữ về các chi tiết phân tích hồng cầu, bạch cầu và hematocrit!

            Kết quả nghiên cứu: không theo sát mục đích.  Thông thường trong phần báo cáo kết quả, tác giả phải đi thẳng vào vấn đề nêu ra trong phần dẫn nhập, tức phải trả lời cho được câu hỏi “Đă phát hiện cái ǵ?”  Nhưng các bài báo y học ở Việt Nam thường mang tính “ṿng vo tam quốc” về đối tượng nghiên cứu (mà đáng lẽ phải tŕnh bày trong phần phương pháp) rồi mới đi vào kết quả chính.  Ngay cả báo cáo các kết quả chính, tác giả không chịu theo sát mục đích đặt ra lúc ban đầu hay trong phần dẫn nhập.  Tiêu biểu cho t́nh trạng này là thay v́ báo cáo kết quả toàn bộ đối tượng nghiên cứu, tác giả lại nhấn mạnh đến các nhóm nhỏ mà kết quả có khi chẳng có ư nghĩa ǵ đáng kể (nếu không muốn nói là kết quả ngẫu nhiên)!

Một xu hướng đáng chú ư khác là có rất nhiều tác giả thay v́ chỉ tŕnh bày kết quả th́ họ lại diễn dịch luôn kết quả (đáng lẽ phải dành cho phần thảo luận).  Có nhiều khi tác giả lặp lại những con số trong bảng số liệu và biểu đồ, tức là một cách phí phạm chữ nghĩa.  Cũng như phần dẫn nhập, nội dung phần kết quả thường rất ngắn (trung b́nh là 2,5 đoạn văn, khoảng 1/4 trang giấy A4). 

            Tŕnh bày số liệu: chính xác đến độ không cần thiết.  Một trong những xu hướng khá phổ biến trong các bài báo y học ở trong nước là các chỉ số thống kê thường được tŕnh bày với sự chính xác một cách ...  thừa thải.  Chẳng hạn như một báo cáo mô tả về các đối tượng tham gia vào công tŕnh nghiên cứu, các tác giả viết: “Tuổi trung b́nh của 194 bệnh nhân là 47,89 tuổi (17,95).  Số bệnh nhân nữ là 132 bệnh nhân (68,04%), số bệnh nhân nam là 62 bệnh nhân (31,96%).”  Chú ư con số trong ngoặc (17,95) không rơ đó là con số ǵ?  Có thể tác giả muốn đề cập đến độ lệch chuẩn (standard deviation), nhưng cũng có thể là sai số chuẩn (standard error), nhưng dù sao đi nữa, một cách viết như thế không thể chấp nhận trong một bài báo khoa học.

            Biểu đồ: nghèo nàn ư nghĩa.  Yếu tố thị giác rất quan trọng.  Người Trung Hoa từng nói “Một biểu đồ có giá trị bằng một vạn chữ viết.”  Mục đích của biểu đồ là cung cấp một ấn tượng về phát hiện chính của công tŕnh nghiên cứu.  Biểu đồ có khi được dùng làm tài liệu giảng dạy.  V́ thế biểu đồ là một phương tiện hữu hiệu nhất để nhấn mạnh thông điệp của bài báo.  Biểu đồ thường được sử dụng để thể hiện xu hướng và kết quả cho từng nhóm, nhưng cũng có thể dùng để tŕnh bày dữ kiện một cách gọn gàng.  Các biểu đồ dễ hiểu, nội dung phong phú là những phương tiện vô giá.  Do đó, nhà nghiên cứu cần phải suy nghĩ một cách sáng tạo cách thể hiện số liệu quan trọng bằng biểu đồ.

Rất nhiều biểu đồ trong các bài báo y học ở Việt Nam chỉ xoay quanh các biểu đồ mô tả như histogram, biều đồ pie, biểu đồ tần số.  Rất hiếm thấy các biểu đồ mang tính phân tích.  Các biểu đồ mô tả cũng rất nghèo nàn về ư nghĩa, đơn sơ trong tŕnh bày chẳng khác ǵ cách vẽ biểu đồ trong các bài tập dành cho sinh viên.  Có nhiều biểu đồ lặp lại những ǵ tŕnh bày trong các bảng số liệu, tức là chẳng cung cấp thêm thông tin ǵ cho người đọc, chẳng gây một ấn tượng ǵ đáng nhớ.  Cách làm việc như thế cho người đọc ấn tượng rằng tác giả h́nh như chưa đầu tư suy nghĩ về việc tŕnh bày kết quả sao cho có ư nghĩa và dễ hiểu.

            Bảng số: khô khan và thiếu ư nghĩa.  Trong một bài báo khoa học, các bảng thống kê số liệu thường được dùng để tŕnh bày những số liệu mang tính trang trọng, tính chính xác cao, tính chính thức.  Các bảng thống kê có thể dùng để (a) mô tả bằng con số những đặc điểm chính của các đối tượng nghiên cứu; (b) tŕnh bày kết quả phân tích mối liên hệ giữa các yếu tố trong nghiên cứu; và (c) so sánh giữa các nhóm bệnh và đối chứng.  Thiết kế một bảng thống kê có ư nghĩa không phải là việc làm đơn giản, mà đ̣i hỏi kinh nghiệm và một chút “nghệ thuật” trong việc tŕnh bày. 

            Rất tiếc là những bảng số liệu trong các bài báo khoa học từ Việt Nam chẳng những không hấp dẫn mà c̣n chứa rất nhiều thiếu sót.  Phần lớn các bảng số này chỉ dừng lại ở tính mô tả, một phần nhỏ là những bảng tŕnh bày hệ số tương quan, thông số từ các phân tích hồi quy nhưng v́ chẳng có ghi chú cẩn thận, cho nên chẳng ai có thể hiểu nổi ư nghĩa của những bảng số liệu này.

            Điều đáng nói là có một số bài báo thậm chí chẳng có một bảng số liệu và biểu đồ  nào!  C̣n phần mô tả kết quả bằng chữ th́ cũng rất khó theo dơi. 

            Thảo luận: quá chủ quan.  Đối với phần lớn nhà nghiên cứu, đây là phần khó viết nhất v́ nó không có một cấu trúc cố định nào cả.  Nói một cách ngắn gọn, trong phần này, tác giả phải trả lời câu hỏi “Những kết quả này có nghĩa ǵ?”.  Tuy không phải theo cấu trúc cố định nào, tác giả có kinh nghiệm thường viết thảo luận theo một cấu trúc như sau: (a) giải thích những dữ kiện trong phần kết quả; (b) so sánh những kết quả này với các nghiên cứu trước; (c) bàn về ư nghĩa của những kết quả; (d) chỉ ra những ưu điểm và khuyết điểm của cuộc nghiên cứu; (e) và sau cùng là một kết luận sao cho người đọc có thể lĩnh hội được một cách dễ dàng.  Không một bài báo y khoa từ Việt Nam mà tôi đọc qua viết theo cấu trúc như vừa mô tả.

Tính trung b́nh, phần thảo luận của các bài báo y khoa mà tôi đọc qua hàm chứa rất ít ư kiến.  Tính trung b́nh phần này dài khoảng 1,5  trang, so với [trung b́nh] 4 trang trong các bài báo ở nước ngoài.  Tuy nhiên, vấn đề dài ngắn không phải là điều thiết yếu, quan trọng là nội dung, và có thể nói rằng nội dung thảo luận rất nghèo nàn.  Có rất nhiều bài báo mà phần thảo luận không thể xem là “thảo luận” bởi v́ tác giả chỉ lặp lại những con số và thay đổi vài câu chữ trong phần kết quả, hoàn toàn không có một giải thích và phát kiến ǵ cả!

Có tác giả cũng cố gắng giải thích, hay đề nghị một mô h́nh giải thích, kết quả nghiên cứu của họ, nhưng lại không kèm theo những chứng cớ khoa học, nên rất khó mà nói cách giải thích đó thuyết phục hay không.  Rất ít khi nào các tác giả Việt Nam so sánh kết quả của họ với kết quả của những nghiên cứu trước và giải thích tại sao chúng (những kết quả) khác nhau, hay tại sao chúng lại giống nhau, và ư nghĩa của chúng là ǵ.  Một điều đáng nói khác là phần lớn các tác giả Việt Nam không chịu vạch ra những thiếu sót, những trắc trở, khó khăn trong nghiên cứu, hay nêu được những ưu điểm của cuộc nghiên cứu, cũng như đưa ra các giải pháp khắc phục hay những đề xuất hướng nghiên cứu trong tương lai.  Cách viết phẩn thảo luận của các tác giả Việt Nam cho người đọc một ấn tượng về một nghiên cứu hoàn hảo, không có vấn đề ǵ cả.

Tiếng Anh: quá nhiều sai sót. Trên thế giới ngày nay, tiếng Anh là một ngôn ngữ quốc tế trong hoạt động khoa học.  Vào thập niên 1980s, trên 60% các tập san khoa học trên thế giới sử dụng tiếng Anh.  Hai mươi năm sau, con số này là trên 80% [2].  Trong lĩnh vực y khoa và sinh học, hiện nay hơn 90% các tập san sử dụng tiếng Anh.  Ngay cả tập san khoa học tại các nước không nói tiếng Anh như các nước Bắc Âu, Nhật, Thái Lan, Trung Quốc cũng hoặc là sử dụng tiếng Anh làm phương tiện thông tin, hoặc có phần tóm lược viết bằng tiếng Anh. 

            Các tạp chí y học Việt Nam trong mấy năm qua cũng cố gắng cung cấp phần tóm lược bài báo khoa học bằng tiếng Anh.  Nhưng rất tiếc là hầu như bài báo nào (nếu không muốn nói là 100%) đều cũng có sai sót về tiếng Anh, từ cú pháp, thuật ngữ, đến cách diễn đạt.  Không thể kể hết tất cả các sai sót ở đây, v́ hầu như câu văn nào cũng có sai sót.  Chẳng hạn như trong một nghiên cứu về các chỉ số sinh hóa trong nhóm bệnh nhân tai biến mạch máu năo, tác giả viết trong phần kết quả: “There has no differency in blood cell count, platelet count, hematocrit rate between cerebral infarction and cerebral hemorrhage.  However there is a little different in some patients”.  Một câu văn có quá nhiều sai sót về đánh vần, văn phạm, và khái niệm.  Một nghiên cứu khác về ứng dụng CT scan trong việc chẩn đoán thuyên tắc phổi, tác giả kết luận bằng một câu văn với chữ “efficacy” thành “efficacity”: “Chest helical CT scan is a useful tool in pulmonary embolism diagnosis in Vietnam condition with good feasibility, efficacity and some small disadvantages that could be resolved in the near future.”  Thật ra, chữ efficacy mà tác giả muốn nói đến trong kết luận không thể dùng trong nghiên cứu này v́ không thích hợp. Đây là một sai sót mang tính học thuật, chứ không đơn giản là từ ngữ.

Có khi sai sót rất căn bản về khái niệm và thuật ngữ mà đáng lẽ không nên có mặt trên mặt báo, như Lipidemia is common in hypertensive patients and their presentation increases cardiovascular risk”.  Đáng lẽ là hyperlipidemia (chứ không phải lipidemia) và cụm từ “cardiovascular risk” đáng lẽ phải là “the risk of cardiovascular diseases”.  

Vấn đề y đứcMột nguyên tắc số 1 (và bất di bất dịch) của y khoa là không làm tổn hại đến bệnh nhân.  Nghiên cứu y học cũng phải tuân thủ theo nguyên tắc này.  Trong nhiều nghiên cứu, nhất là nghiên cứu can thiệp mà đối tượng nghiên cứu có khi phải kinh qua một thuật điều trị mới hay một loại thuốc mới c̣n trong ṿng thử nghiệm.  Trong các trường hợp này, bệnh nhân có thể hưởng lợi từ thuật điều trị, nhưng cũng có thể bệnh nhân cũng chịu đựng một số biến chứng có khi nguy hiểm.  Ngay cả trong các nghiên cứu không can thiệp, đối tượng nghiên cứu có khi phải phơi nhiễm những phương pháp đo lường (như X quang, hay lấy mẫu máu chẳng hạn).  Ngoài ra, các thông tin lâm sàng thu thập từ cá nhân đối tượng nghiên cứu cần phải được giữ kín tuyệt đối, và danh tính bệnh nhân dứt khoát không được tiết lộ trên bất cứ phương tiện truyền thông nào nếu không có sự đồng ư của bệnh nhân.  Đây là những khía cạnh mang tính đạo đức khoa học, mà cụ thể trong y khoa là khía cạnh y đức (medical ethics).

Ở các nước Tây phương, bất cứ trường đại học hay bệnh viện nào đều có một ủy ban y đức (Ethics Committee hay Institutional Review Board) có chức năng kiểm tra khía cạnh y đức trong tất cả các công tŕnh nghiên cứu y học.  Ủy ban này gồm có đại diện từ giới nghiên cứu khoa học, bác sĩ, thống kê, luật sư, tôn giáo, và quần chúng hay bệnh nhân.  Ủy ban có nhiệm vụ cụ thể là duyệt xét xem công tŕnh nghiên cứu có đáp ứng các yêu cầu y đức hay không, bảo đảm an toàn cho t́nh nguyện viên, kiểm tra tính bảo mật, v.v… của dự án nghiên cứu.  Chỉ khi nào các khía cạnh này được giải quyết thỏa đáng, dự án mới được cho phép tiến hành.

            Các tập san y học quốc tế có uy tín dứt khoát sẽ không công bố một công tŕnh nghiên cứu, bất kể công tŕnh đó có giá trị khoa học cỡ nào, nếu công tŕnh đó chưa được sự phê chuẩn của ủy ban y đức địa phương.  Do đó, ban biên tập các tập san y học quốc tế thường yêu cầu tác giả phải kèm theo một tuyên bố như “Công tŕnh nghiên cứu này đă được ủy ban y đức thuộc trường đại học ABC thông qua, và bệnh nhân đă đồng ư tham gia vào nghiên cứu.”  Không có tuyên bố này cũng có nghĩa là bài báo sẽ không được b́nh duyệt (chứ chưa nói đến việc được chấp nhận cho xuất bản hay không!)

            Tuy nhiên, tất cả những bài báo y học mà tôi đọc qua trong các tập san y học ở trong nước không có một gịng chữ nào nói đến y đức.  Không một bài báo nào cho biết bệnh nhân đă thỏa thuận tham gia vào nghiên cứu và cho phép cung cấp thông tin!  Có thể các công tŕnh nghiên cứu đă được thông qua, nhưng tác giả “quên” không cung cấp thông tin này? 

Tài liệu tham khảo: lạc hậu và văn hóa Bắc-NamTài liệu tham khảo là phần cuối của một bài báo khoa học, nơi mà tác giả liệt kê tất cả các tài liệu đă được tham khảo để phát triển và thực hiện công tŕnh nghiên cứu.  Liệt kê chính xác tài liệu tham khảo không phải là một việc làm cho lấy có, mà phải được suy nghĩ cẩn thận, nghiêm chỉnh, bởi v́ đây cũng là h́nh thức mà tác giả trực tiếp ghi nhận đóng góp của các nhà nghiên cứu khác cho nghiên cứu của ḿnh.  Trong hoạt động khoa học, số lần trích dẫn là một loại “tiền tệ” và là một chỉ tiêu quan trọng để đo lường ảnh hưởng của một công tŕnh nghiên cứu.  Một trong những yêu cầu của phân tham khảo tài liệu là trích dẫn phải chính xác (theo một công thức như tên tác giả, tựa đề bài báo, tên tập san, năm xuất bản, số bộ và số trang), phải liên quan đến văn cảnh, và nhất là tác giả đă đọc qua tài liệu mà ḿnh trích dẫn (chứ không phải trích dẫn gián tiếp qua đọc các bài báo khác – một hành vi thiếu thành thật tri thức).

Nhưng rất tiếc các trích dẫn và cách tham khảo tài liệu trong các bài báo y học từ Việt Nam có thể nói là “trăm hoa đua nở”, chẳng theo một thể thức, một hệ thống nào thống nhất cả, hết sức tùy tiện.  Một số tài liệu trích dẫn mà tôi có khả năng chuyên môn để có thể khẳng định là chẳng phù hợp với phát biểu của tác giả!

Trung b́nh, mỗi bài báo y học từ Việt Nam có khoảng 9 tài liệu tham khảo (ở phía Bắc) đến 17 ở phía Nam.  Không rơ tại sao lại có sự khác biệt khá lớn về con số tài liệu tham khảo giữa hai miền như thế, nhưng thói quen và “văn hóa” trích dẫn có lẽ là một yếu tố quan trọng.

Điều đáng nói là một phần lớn các tài liệu tham khảo không phải là các bài báo khoa học nguyên thủy (original article) mà chỉ là những bài báo trong các kỉ yếu hội nghị, hay thậm chí tờ bướm quảng cáo của các công ti dược, hay có khi là một bài báo trên các báo đại chúng như Tuổi trẻ!

Ngoài ra, nhiều tài liệu trích dẫn (dù cũng chẳng phải là bài báo khoa học) khá “lạc hậu”, hơn 20 năm, tức khoảng thập niên 1980s.  Trong khi đó, một “luật” bất thành văn trong nghiên cứu y học là nên sử dụng và trích dẫn những nghiên cứu mới công bố trong ṿng 5-10 năm.

Vấn đề tác giả.  Đứng tên tác giả một bài báo khoa học đồng nghĩa với viẹc chịu trách nhiệm về những ǵ ḿnh viết và phát biểu.  Năm 1985, Ủy ban tổng biên tập các tập san y học (International Committee of Medical Journal Editors – ICMJE, c̣n gọi là Vancouver Group) đề ra 3 tiêu chuẩn cho một tác giả bài báo khoa học.  Năm 2000, 3 tiêu chuẩn này được hiệu đính lại, và được giới khoa học quốc tế công nhận là những tiêu chuẩn vàng để qui quyền tác giả.  Theo định nghĩa của ICMJE, một thành viên nghiên cứu có tư cách đứng tên tác giả phải hội đủ tất cả 3 tiêu chuẩn sau đây: (a) Một là đă có đóng góp quan trọng trong việc h́nh thành ư tưởng và phương pháp nghiên cứu, hay thu thập dữ kiện, hay phân tích và diễn dịch dữ kiện; (b) hai là đă soạn thảo bài báo hay kiểm tra nội dung tri thức của bài báo một cách nghiêm túc; và (c) ba là phê chuẩn bản thảo sau cùng để gửi cho tập san.

            Tính trung b́nh mỗi bài báo y khoa ở Việt Nam chỉ có 2 tác giả (cao nhất là 4 tác giả).  Không có sự khác biệt giữa phía Nam và Bắc về số lượng tác giả bài báo y khoa.  Con số này tương đối thấp so với các bài báo y khoa ở ngoại quốc, với trung b́nh 6 tác giả trên một bài báo. 

Tuy nhiên, có dấu hiệu cho thấy vấn đề tác giả bài báo y khoa ở Việt Nam c̣n khá tùy tiện.  Chẳng hạn như có bài báo mà tác giả chỉ đề tên họ một tác giả và kèm theo ḍng chữ “và cộng sự”!  Đây là một việc làm (hay thói quen) không thể chấp nhận trong hoạt động khoa học.

Vài đề nghị cải thiện t́nh h́nh

            Sai sót và nhầm lẫn trong nghiên cứu y khoa không phải chỉ xảy ra ở nước ta, mà c̣n khá phổ biến ngay cả tại các nước đă phát triển.  Theo một thống kê gần đây, gần 40% các bài báo trong các tập san y học quốc tế có ít nhất là một sai sót.  Tuy nhiên, đại đa số những sai sót này là nhỏ, không ảnh hưởng đến kết luận của bài báo.  C̣n những sai sót mà tôi chỉ ra trong bài viết này là những sai sót nghiêm trọng, có ảnh hưởng trực tiếp đến kết luận của công tŕnh nghiên cứu.  Tôi có thể nói rằng tất cả nhửng bài báo mà tôi đọc qua, nếu gửi cho các tập san y học quốc tế, chắc chắn sẽ không qua khỏi ṿng đầu b́nh duyệt, chứ chưa nói đến việc có được chấp nhận công bố hay không.

            Nhưng t́nh h́nh và điều kiện y tế ở nước ta đặt ra rất nhiều vấn đề thú vị, và y học Việt Nam hoàn toàn có thể đóng góp làm phong phú tri thức y học thế giới.  Để có mặt trên trường quốc tế, chúng ta cần phải tự ḿnh khắc phục những vấn đề mà tôi vừa nêu.  Tôi đề nghị một vài biện pháp cụ thể sau đây: 

Huấn luyện về nghiên cứu khoa học.  Phần lớn những vấn đề tôi nêu trong phần trên có nguồn gốc từ vấn đề đào tạo.  Các sinh viên y khoa sau đại học chưa được huấn luyện về nghiên cứu khoa học, cho nên khi bắt tay vào nghiên cứu, họ không ư thức được những sai lầm, những cạm bẫy trong nghiên cứu khoa học, và việc phạm phải sai lầm, thiếu sót là hoàn toàn có thể hiểu được.  Nh́n qua cách diễn đạt các kết quả nghiên cứu, có thể nói rằng đại đa số tác giả chưa am hiểu các ư nghĩa khoa học đằng sau những phương pháp mà họ áp dụng. 

Do đó, đối với các nghiên cứu sinh, trước khi tiến hành nghiên cứu cần phải trải qua một khóa huấn luyện để nắm vững các nguyên lí, triết lí và phương pháp khoa học.  Ngoài ra, cần phải tổ chức các khóa học bồi dưỡng (continuing education) về phương pháp khoa học cho các chuyên gia lâm sàng tham gia vào nghiên cứu khoa học.  

Huấn luyện về thống kê sinh học.  Phân tích thống kê là một khâu quan trọng không thể thiếu được trong các công tŕnh nghiên cứu khoa học, nhất là khoa học thực nghiệm như nghiên cứu y khoa.  Một công tŕnh nghiên cứu y khoa, cho dù có tốn kém và quan trọng cỡ nào, nếu không được phân tích đúng phương pháp sẽ không bao giờ có cơ hội được xuất hiện trong các tập san khoa học.  Các tạp san y học có uy tín càng cao yêu cầu về phân tích thống kê càng nặng.  Không có phần phân tích thống kê, bài báo không thể xem là một “bài báo khoa học”.  Không có phân tích thống kê, công tŕnh nghiên cứu chưa được xem là hoàn tất. 

            Ở nước ta khoa học thống kê, nhất là thống kê sinh học, c̣n rất kém.  Có thể nói không ngoa rằng sự “lạc hậu” về khoa học thống kê ở nước ta đă làm ảnh hưởng không nhỏ đến y học nước nhà.  V́ nghiên cứu y học ở nước ta chưa được sự hỗ trợ từ khoa học thống kê, cho nên rất nhiều nghiên cứu y học ở nước ta chưa có chất lượng cao, và chưa thể công bố trên các tập san khoa học quốc tế.  Người viết bài này biết rất nhiều trường hợp nhiều nghiên cứu từ Việt Nam chỉ v́ không được thiết kế đúng phương pháp, hay việc phân tích dữ liệu chưa đúng tiêu chuẩn khoa học nên bị các tập san khoa học từ chối công bố.

Trong khi bất cứ đại học nào ở các nước tiên tiến đều có một bộ môn thống kê học, một bộ môn chuyên cung cấp tư vấn về thống kê học cho các nhà khoa học thực nghiệm, th́ ở nước ta, các bộ môn khoa học vẫn c̣n giới hạn ở khoa toán, và chỉ xoay quanh một vài vấn đề căn bản thống kê.  Do đó, một chiến lược quan trọng cần đặt ra là phát triển khoa học thống kê trong các trường đại học, nhất là thống kê sinh học.

Ủy ban y đức.  Hiện nay, y đức là một vấn đề đáng quan tâm ở Việt Nam và trên thế giới.  Trong nghiên cứu y khoa, nhà nghiên cứu có nghĩa vụ phải tuân hành theo một số qui định nghiêm ngặt để bảo đảm an toàn cho bệnh nhân và bảo mật thông tin cá nhân của bệnh nhân.  Vi phạm những qui định này chẳng những được xem là thiếu y đức, mà c̣n là một gian lận (fraud) trong khoa học.  Ở Mĩ đă có khá nhiều trung tâm nghiên cứu y học bị đóng cửa và nhiều nhà nghiên cứu bị ṭa án phạt (thậm chí đi tù) chỉ v́ vi phạm y đức trong nghiên cứu.

Tại các bệnh viện và đại học cần có một ủy ban y đức để xét duyệt các tiêu chuẩn y đức của một công tŕnh nghiên cứu.  Ủy ban này cần có sự đại diện của giới nghiên cứu khoa học, kể cả bác sĩ, luật, tôn giáo, và giới quản lí y tế.  Bảy tiêu chuẩn y đức ủy ban cần xem xét là: giá trị xă hội và giá trị khoa học của công tŕnh nghiên cứu; công tŕnh nghiên cứu phải phù hợp với các chuẩn mực khoa học; tuyển chọn đối tượng nghiên cứu phải công bằng (nếu có thể, không nên thiên vị giới tính, hay độ tuổi, hay tôn giáo, hay dân tộc); nghiên cứu phải có ích cho bệnh nhân; đă được một hội đồng khoa học độc lập b́nh duyệt và chấp thuận; bệnh nhân có quyền từ chối tham gia hay ưng thuận; và bệnh nhân đă tham gia vào công tŕnh có quyền rút ra bất cứ lúc nào [3].

Kiện toàn hệ thống b́nh duyệt.  B́nh duyệt (peer-review) là một hoạt động rất quan trọng trong nghiên cứu khoa học.  Mục đích của việc b́nh duyệt là thẩm định và kiểm tra các bài báo khoa học trước khi chấp nhận cho công bố trên một tập san khoa học.  Hệ thống này c̣n được ứng dụng trong việc duyệt những đơn xin tài trợ cho nghiên cứu tại các nước Tây phương. 

Qua cơ chế này mà tập san có thể ngăn chận những cặn bă, r