You dont have javascript enabled! Please enable it! Diễn giải kết quả nghiên cứu bằng định lí Bayes - GS. Nguyễn Văn Tuấn - THƯ VIỆN MEDIPHARM
Trang chủNghiên cứu Y học

Diễn giải kết quả nghiên cứu bằng định lí Bayes – GS. Nguyễn Văn Tuấn

Phác đồ chẩn đoán và điều trị suy buồng trứng sớm
Phác đồ chẩn đoán và điều trị herpes sinh dục
Phác đồ chẩn đoán và điều trị viêm nội tâm mạc nhiễm khuẩn
Phác đồ chẩn đoán và điều trị hẹp van hai lá
Phác đồ chẩn đoán và điều trị U sụn màng hoạt dịch
Một trong những câu trả lời quan trọng nhất mà người đọc kết quả của một công trình nghiên cứu lâm sàng đối chứng ngẫu nhiên (randomized controlled trial – RCT) muốn có là: với những dữ liệu thu thập được, xác suất mà phương pháp điều trị có hiệu quả là bao nhiêu?

____________________

Nguyễn Văn Tuấn
Giáo sư y khoa, Đại học New South Wales
Viện nghiên cứu y khoa Garvan, Sydney, Australia

Một trong những câu trả lời quan trọng nhất mà người đọc kết quả của một công trình nghiên cứu lâm sàng đối chứng ngẫu nhiên (randomized controlled trial – RCT) muốn có là: với những dữ liệu thu thập được, xác suất mà phương pháp điều trị có hiệu quả là bao nhiêu?  Tuy nhiên, phương pháp phân tích thông dụng hiện nay lại nhằm trả lời một câu hỏi ngược lại: nếu phương pháp điều trị không có hiệu quả, xác suất mà dữ liệu này xuất hiện là bao nhiêu.  Phương pháp hiện hành đã gây ra nhiều nhầm lẫn trong việc diễn giải kết quả nghiên cứu. Hiện nay, các nhà nghiên cứu đang chuyển sang một phương pháp phân tích và diễn giải khác để trả lời câu hỏi mà nhà nghiên cứu cần biết. Phương pháp “mới” này dựa vào trường pháp thống kê Bayes (Bayesian Statistics). Trong bài này tôi sẽ giải thích suy luận và diễn giải kết quả RCT theo trường phái Bayes.

Trong khoa học, có hai trường phái thống kê học: trường phái tần số hay cổ điển (frequentist, hay classical statistics) và trường phái Bayes (Bayesian statistics).  Hai trường phái thống kê học này khác nhau về triết lí khoa học và nhất là cách hiểu khái niệm xác suất.  Nói một cách ngắn gọn, trường phái thống kê cổ điển xem xác suất là một tần số của một sự kiện xảy ra, còn trường phái Bayes xem xác suất là một thước đo về tri thức [1].  Chẳng hạn như trước phát biểu “xác suất một bệnh nhân mắc bệnh xơ vữa động mạch là 10%“, trường phái thống kê cổ điển diễn giải rằng về lâu về dài trong số 100 người thì có 10 người mắc bệnh, còn trường phái Bayes xem đó là một cảm nhận cá nhân về nguy cơ mắc bệnh, và vì mang tính cá nhân nên xác suất theo Bayes là cảm nhận chủ quan (subjectivist probability).

Do đó, ý tưởng căn bản của trường phái thống kê Bayes là các thông số như trung bình, tỉ lệ, độ lệch chuẩn, v.v… có những luật phân phối riêng. Các luật phân phối này chẳng những thể hiện tình trạng bất định của các thông số, mà còn phản ảnh kiến thức của chúng ta về các thông số đó.  Đối với trường phái thống kê cổ điển, các thông số này là cố định, không có luật phân phối.  Đây chính là điểm khác biệt cơ bản mang tính toán học giữa hai trường phái thống kê.

Suy luận theo trường phái Bayes thật ra không phải là một điều xa lạ đối với các bác sĩ lâm sàng.  Đối với các bác sĩ lâm sàng, trước một kết quả xét nghiệm, điều mà bác sĩ cần biết là khả năng (hay xác suất) mà cá nhân mắc bệnh là bao nhiêu.  Để ước tính xác suất này, bác sĩ cần phải có thông tin nền (background information) về bệnh, độ nhạy và tỉ lệ dương tính giả của phương pháp xét nghiệm.  Với 3 thông tin này, bác sĩ có thể ước tính xác suất cá nhân mắc bệnh là bao nhiêu.  Đó chính là cách suy luận và diễn giải kết quả xét nghiệm theo trường phái Bayes, dù sách giáo khoa y khoa ít khi nào sử dụng đến thuật ngữ Bayes [2-3].

Diễn giải kết quả nghiên cứu lâm sàng theo trường phái Bayes càng ngày càng phổ biến [4-11].  Trong một bài viết về ý nghĩa của trị số P, tôi đã bàn qua những vấn đề của trị số P và khiếm khuyết của trường phái thống kê cổ điển.  Thật ra, những vấn đề của trị số đã được nêu lên từ những 50 năm qua trong y văn, và giới nghiên cứu y khoa càng ngày cành nhận thức được những hạn chế của nó.  Trong khoảng 3 thập niên trở lại đây, giới nghiên cứu càng quan tâm đế việc ứng dụng định lí Bayes trong diễn giải kết quả nghiên cứu.  Có người cho rằng trường phái Bayes sẽ “thống trị” nghiên cứu khoa học trong thế kỉ 21 (cũng giống như trường phái thống kê cổ điển thống trị khoa học trong thế kỉ 20).  Do đó, trong bài này tôi sẽ bàn về cách diễn giải kết quả nghiên cứu lâm sàng theo trường phái Bayes.

1.  Khái niệm Bayes qua qui trình tiên lượng

Có lẽ cách tốt nhất để làm quen với trường phái Bayes là qua ví dụ về tiên lượng bệnh (prognosis) [3].  Tập san New England Journal of Medicine mới công bố một công trình nghiên cứu về tiên lượng bệnh lao phổi (TB) ở những bệnh nhân nhiễm HIV.  Trong công trình nghiên cứu, họ thu thập dữ liệu từ 1748 bệnh nhân HIV ở 3 nước Thái Lan, Cambodia, và Việt Nam; trong số này có 267 người (hay 15.2%) được chẩn đoán có TB và 1481 không có TB.  Để đánh giá giá trị tiên lượng của các triệu chứng lâm sàng, các nhà nghiên cứu hỏi mỗi bệnh nhân HIV có những triệu chứng như ho trong vòng 4 tuần qua, hoặc sốt trong vòng 4 tuần qua, hoặc ra mồ hôi ban đêm từ 3 tuần trở lên.  Kết quả cho thấy:

  • Trong số 267 người có TB, có 249 người có ít nhất 1 triệu chứng; nói cách khác, độ nhạy (sensitivity) là 249 / 267 = 93.2%;
  • Trong số 1481 người không có TB, 950 người có ít nhất 1 triệu chứng (và 531 người không có triệu chứng); tức độ đặc hiệu (specificity) là 531 / 1481 = 35.8%.

Câu hỏi đặt ra là: nếu bác sĩ gặp một bệnh nhân nhiễm HIV, và nếu bệnh nhân có một trong những triệu chứng trên, thì xác suất tiên lượng mà bệnh nhân mắc bệnh TB là bao nhiêu?

Chúng ta biết rằng, trước khi có thông tin về triệu chứng lâm sàng, xác suất bệnh nhân có TB là 15.2%, vì đó là thông số chung của quần thể.  Thuật ngữ của trường phái Bayes gọi thông số này là prior information hay thông tin tiền định.  Trong bối cảnh tiên lượng, prior information chính là tỉ lệ hiện hành (prevalence).

Nếu sau khi khám, bệnh nhân có 1 trong những triệu chứng trên, thì xác suất mắc bệnh không còn là 15.2%, mà là một ước số khác.  Ước số tiên lượng này có thể tính dễ dàng bằng Định lí Bayes.  Định lí Bayes phát biểu rằng xác suất mà bệnh nhân mắc bệnh TB tùy thuộc vào 3 thông số: (a) thông tin tiền định; (b) độ nhạy; và (c) độ đặc hiệu, hoặc dương tính giả (false positive). Để khỏi dài dòng, có thể tạm gọi:

  • Thông tin tiền định là prior,
  • Độ nhạy là se,
  • Độ đặc hiệu sp,
  • Xác suất mắc bệnh sau khi biết se và sp là posterior probability.

Định lí Bayes phát biểu như sau: (CT 1).

Bayes-h1

Theo nghiên cứu trên, prior = 0.152,  se = 0.932, và se = 0.358.  Do đó, xác suất mà bệnh nhân mắc bệnh TB là 0.206 hay khoảng 21%: (CT 2).

Bayes-h2

Thuật của Bayes gọi xác suất mắc bệnh sau khi đã biết độ nhạy, độ đặc hiệu và thông tin tiền định là xác suất hậu định (posterior probability), hay trong thuật ngữ chẩn đoán là giá trị tiên lượng dương tính (positive predictive value, PPV).

Nếu gọi hiện tượng mắc bệnh TB là D, có triệu chứng là positive, và không có triệu chứng là negative, những thông số trên có thể thể hiện bằng ngôn ngữ của xác suất như sau:

  • Độ đặc hiệu:sp = Pr(negative | notD)
  • Độ nhạy:se = Pr(postive | D)
  • Xác suất hậu định, hay PPV = Pr(D | posttive)

Chú ý rằng Pr có nghĩa là xác suất, và dấu “|” có nghĩa là “với điều kiện”.  Do đó, khi viết có nghĩa là độ nhạy là xác suất mà bệnh nhân có triệu chứng lâm sàng dương tính nếu bệnh nhân mắc bệnh TB.  Xác suất này rất khác với PPV mà ý nghĩa là xác suất bệnh nhân có TB nếu triệu chứng lâm sàng là dương tính.

Với cách diễn đạt trên, nếu xem độ nhạy và độ đặc hiệu là bằng chứng (evidence), thì PPV hay xác suất tiên lượng hậu định có thể mô tả theo công thức chung như sau:

[Xác suất hậu định] = [Xác suất tiền định] × [Bằng chứng]

Đây chính là định lí Bayes được phát biểu bằng một ngôn ngữ dễ hiểu nhất.  Diễn giải kết quả nghiên cứu lâm sàng cũng không khác mấy với diễn giải kết quả tiên lượng và chẩn đoán.  Thay vì tìm hiểu có bệnh hay không có bệnh, nghiên cứu lâm sàng tìm hiểu giả thuyết đúng hay sai; độ nhạy chính là power, và tỉ lệ dương tính giả chính là trị số trong nghiên cứu lâm sàng.

2. Giả thuyết và bằng chứng

Tất cả các công trình nghiên cứu lâm sàng đối chứng ngẫu nhiên (RCT) đều có mục tiêu kiểm định một giả thuyết khoa học (hay còn gọi là test of hypothesis).  Chẳng hạn như nghiên cứu về hiệu quả của ramipril [12] trong việc phòng ngừa tử vong, giả thuyết đặt ra là ramipril giảm nguy cơ tử vong. Tạm thời đặt kí hiệu giả thuyết là H.

Sau khi thu thập và phân tích dữ liệu, các nhà nghiên cứu phát hiện rằng tỉ số nguy cơ tương đối [relative risk] tử vong ở bệnh nhân được điều trị bằng ramipril là 0.84 (với khoảng tin cậy 95% là 0.75 đến 0.95; P=0.005).  Có thể xem đây là dữ liệu thật, là bằng chứng, với kí hiệu E.

Với bằng chứng trên đây, có thể kết luận rằng rampiril giảm nguy cơ tử vong?  Câu trả lời đơn giản là: chưa.  Chưa là vì nhiều lí do, trong đó có lí do dữ liệu.  Trị số = 0.005 có nghĩa là nếu giả thuyết (ramipril giảm tử vong) là sai, thì xác suất mà bằng chứng (tức ramipril giảm tử vong) xảy ra là 0.005 hay 0.5%.  Do đó, trị số không nói cho chúng ta biết gì về mức độ khả dĩ của giả thuyết H.

Trong nghiên cứu lâm sàng câu hỏi cần đặt ngược lại là: với bằng chứng E, xác suất mà giả thuyết H đúng là bao nhiêu?  Nói cách khác, chúng ta cần biết xác suất hậu định của giả thuyết HĐể trả lời câu hỏi quan trọng trên, chúng ta cần đến Định lí Bayes.  Như mô tả qua ví dụ về tiên lượng, xác suất hậu định của giả thuyết tùy thuộc vào xác suất tiền định của  bằng chứng E.  Viết theo ngôn ngữ xác suất, phát biểu trên là: (CT 3).[1]

Pr(H | E) = Pr(H)xPr(E | H)          [1]

Công thức trên có 3 vế mà tôi sẽ giải thích như sau:

  • Thứ nhất, Pr(H | E) là xác suất hậu định của giả thuyết hay posterior probability. Pr(H | E) là xác suất mà giả thuyết đúng với điều kiện bằng chứng E (cũng giống như xác xuất mắc bệnh nếu có triệu chứng lâm sàng).
  • Thứ hai, tương tự như trong ví dụ về tiên lượng TB, nếu Pr(D) là xác suất mắc bệnh trước khi có thông tin về triệu chứng, thì Pr(H) là xác suất giả thuyết đúng trước khi chúng ta có bằng chứng E. Pr(H) còn được gọi là prior information hay prior probability (xác suất tiền định).
  • Thứ ba, Pr(E | H) chính là xác suất về bằng chứng xảy ra nếu giả thuyết đúng, và thuật ngữ Bayes gọi là likelihood hay khả dĩ.

Phát biểu [1] trên cũng có thể viết theo ngôn ngữ Bayes như sau:

[posterior probability] = [prior probability] × [Likelihood]

2.1  Xác định Pr(H)

Trong phát biểu trên, chúng ta đã biết Pr(E | H), nhưng chưa biết Pr(H), tức xác suất mà giả thuyết đúng là bao nhiêu.  Do đó, vấn đề then chốt là làm sao xác định Pr(H), và đây chính là vấn đề gây ra nhiều tranh cãi dai dẵng trong trường phái Bayes.  Tuy nhiên, đối với những nghiên cứu lâm sàng, trước khi tiến hành nghiên cứu, các nhà khoa học thường có vài ước tính về khả năng của một giả thuyết.

Trong các nghiên cứu lâm sàng theo mô hình RCT, thông số quan trọng để thể hiện một giả thuyết là tỉ số nguy cơ tương đối (relative risk hay RR).  Chẳng hạn như để thể hiện giả thuyết thuốc có hiệu quả giảm nguy cơ tử vong, nhà nghiên cứu có thể phát biểu giả thuyết bằng cách viết RR < 1. Do đó, khi nói đến thông tin tiền định trong phân tích Bayes là nói đến thông tin về RR. Chẳng hạn như đối với hiệu quả của ramipril, ý kiến đơn giản nhất là không ai biết được ramipril tăng hay giảm nguy cơ tử vong, nhưng không ai tin rằng ramipril có thể hay giảm nguy cơ tử vong trên 50% hay tăng nguy cơ tử vong trên 50%.  Nói cách khác, theo ý kiến này thì RR có thể dao động từ 0.5, 0.6, 0.3, …, 1.5, và xác suất cho các RR đó bằng nhau.  Ở đây, có 11 giá trị khả dĩ cho RR, do đó xác suất mỗi RR là 1/11 = 0.09.  Theo thuật ngữ thống kê, đây là uniform prior distribution.  Có thể thể hiện luồng ý kiến này bằng bảng sau đây: (Bảng).

RR = 0.5 0.6 0.7 1.3 1.4 1.5
Pr(RR) 0.09 0.09 0.09 0.09 0.09 0.09

Tuy nhiên, trong thực tế, để tiện cho việc phân tích, các thông tin tiền định thường được mô tả bằng các luật phân phối xác suất.  Luật phân phối phổ biến nhất trong các nghiên cứu mô hình RCT là luật phân phối chuẩn (normal distribution).  Ngoài ra, thay vì mô tả phân phối RR, người ta thường mô tả bằng đơn vị logarithm của RR.  Nếu giả thuyết RR = 1 thì tương đương với cách phát biểu logRR = 0.  Ý kiến (hay thông tin tiền định) đều có thể mô tả qua luật phân phối xác suất với đơn vị logRR:

Luồng ý kiến “trung dung” (uninformative prior).  Theo luồng ý kiến này, ramipril có thể không có hiệu quả giảm nguy cơ tử vong, hay RR = 1.  (Vì nếu biết rằng ramipril có hiệu quả thì không có lí do gì để  làm nghiên cứu!) Tuy nhiên, luồng ý kiến này không biết RR dao động trong khoảng nào, có thể từ 0.01 đến 100.  Có thể sử dụng luật phân phối chuẩn để thể hiện ý kiến này.  Nên nhớ rằng phân phối chuẩn có 2 thông số: trung bình và độ lệch chuẩn.  Tạm kí hiệu số trung bình là mprior và độ lệch chuẩn là sprior.  Sau vài tính toán đơn giản, có thể thấy rằng luật phân phối chuẩn (của logRR) để thể hiện ý kiến trung dung trên là:

mprior = 0  và sprior = 10

Luồng ý kiến hoài nghi thấp (mild skepticism).  Theo luồng ý kiến này, ramipril có thể không có hiệu quả giảm nguy cơ tử vong, hay RR = 1, nhưng xác suất mà RR dao động trong khoảng 0.95 và 1.05 là khoảng 10%.  Nói theo ngôn ngữ xác suất, ý kiến này là Pr(0.95 < RR < 1.05) = 0.10, hay, theo đơn vị logRR: Pr(-0.05 < logRR < 0.05) = 0.10. Với ý kiến này, có thể thấy rằng luật phân phối chuẩn (của logRR) để thể hiện ý kiến hoài nghi trên là:

mprior = 0  và sprior = 0.40

Luồng ý kiến hoài nghi trung bình (moderate skepticism).  Theo luồng ý kiến này, ramipril có thể không có hiệu quả giảm nguy cơ tử vong, hay logRR = mprior = 0.  Nhưng xác suất mà RR dao động trong khoảng 0.95 và 1.05 là khoảng 50%.  Nói theo ngôn ngữ xác suất, ý kiến này là Pr(-0.05 < logRR < 0.05) = 0.50.  Với ý kiến này, chúng ta có thể thể hiện bằng một phân phối chuẩn, với 2 thông số:

mprior = 0  và sprior = 0.07

Luồng ý kiến hoài nghi cao độ (high skepticism).  Theo luồng ý kiến này, ramipril có thể không có hiệu quả giảm nguy cơ tử vong, hay logRR = mprior = 0.  Nhưng xác suất mà RR dao động trong khoảng 0.95 và 1.05 là khoảng 90%.  Nói theo ngôn ngữ xác suất, ý kiến này là Pr(-0.05 < logRR < 0.05) = 0.90.  Với ý kiến này, chúng ta có thể thể hiện bằng một phân phối chuẩn, với 2 thông số:

mprior = 0  và sprior = 0.03

Nói tóm lại, có thể có 4 luồng ý kiến (trước khi một công trình nghiên cứu thực hiện).  Bốn luồng ý kiến đó có thể mô tả qua luật phân phối chuẩn, với 2 thông số trung bình và độ lệch chuẩn.  Có thể tóm lược 4 luồng ý kiến như là 4 thông tin tiền định như sau: (B.1).

Bảng 1: Lượng hóa nguồn ý kiến (prior information)

Luồng ý kiến

 

  Trung bình của logRR (mprior) Độ lệch chuẩn của logRR (sprior)
Trung dung 0 10
Hoài nghi thấp 0 0.40
Hoài nghi trung bình 0 0.07
Hoài nghi cao độ 0 0.03

2.2  Xác định Pr(E | H) hay khả dĩ (likelihood)

Như đề cập trên, những gì nghiên cứu thu thập được có thể xem là bằng chứng E.  Trong trường hợp nghiên cứu HOPE, chính là RR [giảm] tử vong liên quan đến ramipril.  Số liệu công bố cho thấy RR = 0.84, với khoảng tin cậy 95% dao động trong khoảng 0.75 đến 0.95. Nhưng RR cần phải được hoán chuyển sang đơn vị logRR để dễ phân tích và tính toán.  Từ số liệu trên, có thể thể hiện thông số trên qua luật phân phối chuẩn với trung bình là:

mdata = log(0.84) = -0.174

và độ lệch chuẩn có thể ước tính từ khoảng tin cậy 95% như sau: (CT.4)

Bayes-h3

 

2.3  Xác định Pr(H | E)

Sau khi đã có những thông số về thông tin tiền định và bằng chứng, có thể xác định khả năng của một giả thuyết bằng công thức

[Xác suất hậu định] = [Xác suất tiền định] × [Bằng chứng]

Nhưng vì xác suất tiền định và bằng chứng đều được thể hiện bằng luật phân phối chuẩn, cho nên xác suất hậu định cũng có thể xác định từ đó.  Thật ra, chỉ cần vài tính toán, có thể xác định xác suất hậu định như sau:

N(mposterior, sposterior)N(mprior, sprior) × N(mdata, sdata)

Trong đó là viết tắt từ luật phân phối chuẩn, mposterior và sposterior là 2 thông số của logRR hậu định.  Sau vài thao tác đại số, dễ dàng thấy chỉ số trung bình và độ lệch chuẩn của thông số logRR hậu định là: (CT.5).

Bayes-h4

Thay thế mdata= -0.174,  sdata= 0.06, và thông số tiền định mprior = 0  và sprior = 10, chúng ta có: (CT.6).

Bayes-h5

Vì xác suất hậu định tuân theo luật phân phối chuẩn, cho nên 2 thông số trên có nghĩa là hàm phân phối chuẩn của xác suất hậu định là: (CT.7).

Bayes-h6

Trong đó, là số logRR khả dĩ.  Hàm f(x) cung cấp một số ước tính rất có ích.  Chẳng hạn như chúng ta có thể đặt câu hỏi: xác suất mà ramipril giảm nguy cơ tử vong trên 10% là bao nhiêu?  Giảm nguy cơ tử vong trên 10% có nghĩa là RR < 0.90 hay logRR < -0.105.  Do đó, đáp số cho câu trả lời là: (CT.8).

Bayes-h7

Tuy công thức có vẻ phức tạp, nhưng thật ra, tất cả những tính toán có thể thực hiện bằng phần mềm Excel hay R một cách rất dễ dàng. Đáp số cho tích phân trên là 0.874.  Nói cách khác, khả năng mà ramipril giảm nguy cơ tử vong trên 10% là 87.4%.

Nhưng xác suất hậu định tùy thuộc vào xác suất tiền định.  Do đó, chúng ta cũng có thể tính xác suất hậu định cho mỗi luồng ý kiến trong phần trên như Bảng 2.

Bảng 2: Thông số tiền định, bằng chứng, và thông số hậu định

 

Mức độ hoài nghi Thông số tiền định (prior distribution) Thông số bằng chứng (likelihood) Thông số hậu định (posterior distribution) Xác suất ramipril giảm nguy cơ tử vong trên 10%
Trung dung N(0, 10.0) N(-0.174, 0.06) N(-0.174, 0.06) 0.874
Hoài nghi thấp N(0, 0.40) N(-0.174, 0.06) N(-0.170, 0.059) 0.862
Hoài nghi trung bình N(0, 0.07) N(-0.174, 0.06) N(-0.100, 0.046) 0.454
Hoài nghi cao độ N(0, 0.03) N(-0.174, 0.06) N(-0.035, 0.027) 0.004
Ghi chú: N(a, b) có nghĩa là phân phối theo luật phân phối chuẩn với trung bình và độ lệch chuẩn b.

Kết quả phân tích trên cho thấy nếu chúng ta khởi đầu bằng một ý kiến trung dung, sau khi xem qua bằng chứng thực tế, chúng ta có thể kết luận rằng khả năng ramipril giảm nguy cơ tử vong tối thiểu 10% là 87.4%.  Nhưng với sự hoài nghi thấp, khả năng này giảm chút ít xuống còn 86.2%. Với hoài nghi cao độ, khả năng mà ramipril giảm nguy cơ tử vong tối thiểu 10% chỉ 0.4%.  Nói cách khác, những phân tích trên đây cho thấy xác suất hậu định rất tùy thuộc vào ý kiến hay thông tin tiền định.  Do đó, vấn đề xác định thông tin tiền định cực kì quan trọng.  Trong thực tế, thông tin tiền định thường được đúc kết cẩn thận từ y văn hay các nghiên cứu trong quá khứ.  Những kết quả phân tích tổng hợp (meta-analysis) là những thông tin rất có ích để xác định thông tin tiền định.

Phân phối về thông tin tiền định (prior distribution), bằng chứng (current likelihood) và kết quả hậu định (posterior distribution) có thể minh họa qua 3 biểu đồ dưới đây (chú ý, trong mỗi biểu đồ, “mean” là giá trị logRR).

Bayes-h8

Một trong những điểm mạnh của phương pháp Bayes là có thể ước tính khả năng cho bất cứ ngưỡng hiệu quả lâm sàng nào.  Trong phân tích ví dụ trên, chúng ta xem giảm nguy cơ tử vong trên 10% là ngưỡng có ý nghĩa lâm sàng, nhưng chúng ta cũng có thể tính khả năng cho các ngưỡng khác như giảm 5%, 10%, 15%, 20%, v.v… Bảng sau đây trình bày khả năng về hiệu quả của ramipril đối với các ngưỡng lâm sàng vừa kể (dựa vào thông tin tiền định “trung dung”): (Bảng 3)

Bảng 3: Khả năng ramipril giảm nguy cơ tử vong trên 5%, 10%, và 20%

 

Ngưỡng lâm sàng Khả năng
Giảm ≥ 5% 0.979
Giảm ≥ 10% 0.874
Giảm ≥ 15% 0.578
Giảm ≥ 20% 0.209
Giảm ≥ 25% 0.030
Giảm ≥ 30% 0.001

Kết quả trên đây cho thấy khả năng ramipril quả thật giảm nguy cơ tử vong trên 5% là khá “chắc chắn”, nhưng khả năng ramipril giảm nguy cơ tử vong trên 25% thì rất thấp.

3. Diễn giải kết quả nghiên cứu lâm sàng

Để diễn giải kết quả nghiên cứu, cần phải phân biệt giữa khác biệt có ý nghĩa thống kê (statistical significance) và ý nghĩa lâm sàng (clinical significance).  Một khác biệt nhỏ có thể có ý nghĩa thống kê (do số cỡ mẫu quá lớn) nhưng hoàn toàn không có ý nghĩa lâm sàng.  Ngược lại, một khác biệt có thể không có ý nghĩa thống kê (do cỡ mẫu nhỏ hay các khiếm khuyết về nghiên cứu), nhưng có ý nghĩa lâm sàng.  Do đó, trước khi đánh giá hiệu quả một thuật điều trị hay can thiệp, cần phải xác định mức độ ảnh hưởng có thể xem là có ý nghĩa lâm sàng.

Định nghĩa thế nào là có ý nghĩa lâm sàng là vấn đề khó khăn.  Một phần của sự khó khăn là do thiếu những tiêu chuẩn cụ thể, và một phần khác là do tùy thuộc vào bối cảnh của vấn đề.  Trong lĩnh vực tim mạch, phần lớn những công trình nghiên cứu lâm sàng đều được thiết kế để nhằm phát hiện một khác biệt về nguy cơ tử vong từ 20% đến 30%, dù một số chuyên gia cho rằng nếu một thuốc có thể giảm nguy cơ tử vong 10% hay thậm chí 5% vẫn có thể xem là có ý nghĩa lâm sàng.  Đối với một chỉ tiêu lâm sàng như tử vong, thiết tưởng một biện pháp can thiệp có thể giảm 10% nguy cơ tử vong có thể xem là có ý nghĩa lâm sàng.

Chúng ta xem 2 luồng ý kiến: trung dung và hoài nghi trung bình làm hai quan điểm về hiệu quả của điều trị.  Chúng ta ước tính xác suất mà thuốc (hay biện pháp can thiệp) giảm nguy cơ tử vong trên 10%.  Gọi xác suất này cho luồng ý kiến trung dung là Ptệ nhất, và cho luồng ý kiến hoài nghi trung bình là Ptốt nhất. Theo một đề nghị mới đây, nếu một phát hiện với Ptệ nhất > 0.95 và Ptốt nhất > 0.95 thì có thể xem đó là bằng chứng rất thuyết phục, không còn nghi ngờ; nếu Ptệ nhất < 0.95 và Ptốt nhất > 0.95 thì có thể xem đó là bằng chứng thuyết phục.  Chi tiết phân hạng bằng chứng có thể xem dưới đây: (Bảng 4).

Bảng 3Thang xếp hạng bằng chứng qua phương pháp Bayes

Hạng Xác suất Ý nghĩa
***** Ptệ nhất > 0.95, Ptốt nhất > 0.95 Không còn nghi ngờ
**** Ptệ nhất < 0.95, Ptốt nhất > 0.95 Rõ ràng, bằng chứng thuyết phục
*** Ptệ nhất > 0.50, Ptốt nhất < 0.95 Có bằng chứng
** Ptệ nhất < 0.50, Ptốt nhất > 0.50 Đáng nghi ngờ
* Ptệ nhất < 0.50, Ptốt nhất < 0.50 Chưa đủ bằng chứng

Tham khảo: Diamond GA, et al. Bayesian Classification of Clinical Practice Guidelines. Arch Intern Med 2009; 169: 1436-1437.

Dựa vào nguyên lí trên, bảng sau đây tóm tắt kết quả chính của một số công trình nghiên cứu nổi tiếng trong lĩnh vực tim mạch [12-21].  Mỗi nghiên cứu đều có mục đích kiểm định giả thuyết can thiệp giảm nguy cơ tử vong. Tất cả các nghiên cứu này đều có “ý nghĩa thống kê”, hiểu theo nghĩa trị số P thấp hơn 0.05, và khoảng tin cậy 95% không bao hàm 1. Tuy nhiên, khi phân tích và diễn giải theo trường phái Bayes (với tiêu chí giảm nguy cơ tử vong trên 10%) thì kết quả của tất cả các nghiên cứu này chỉ có thể xếp vào nhóm “có bằng chứng”.  Không một kết quả nào được xem là “bằng chứng thuyết phục”. (Bảng 5).

Bảng 4Thang xếp hạng bằng chứng của một số nghiên cứu nổi tiếng

  RR và khoảng tin cậy 95% Trị số P Ptệ nhất: Xác suất thuốc giảm nguy cơ tử vong >10% (trung dung) Ptốt nhất: Xác suất thuốc giảm nguy cơ tử vong >10% (hoài nghi) Xếp hạng bằng chứng hiệu quả
PURSUIT [13] 0.91 (0.82 – 1.00) 0.04 0.413 0.145 *
HPS [14] 0.88 (0.82 – 0.94) 0.0003 0.741 0.463 ***
GUSTO [15] 0.86 (0.79 – 0.94) 0.001 0.847 0.524 ***
LIFE [16] 0.86 (0.77 – 0.96) 0.021 0.790 0.377 ***
HOPE [12] 0.79 (0.72 – 0.87) <0.001 0.996 0.914 ***
BHAT [17] 0.74 (0.59 – 0.91) 0.005 0.961 0.373 ***
4S [18] 0.72 (0.60 – 0.86) 0.0003 0.992 0.608 ***
MADIT-II [19] 0.72 (0.56 – 0.92) 0.016 0.961 0.321 ***
ASCOT-LLA [20] 0.65 (0.51 – 0.83) 0.0005 0.996 0.489 ***
Lyon Diet Heart [21] 0.32 (0.17 – 0.52) 0.0003 1.000 0.275 ***

Bảng trên đây còn cho thấy phân tích Bayes cung cấp thông tin ngoài kết quả của khoảng tin cậy 95%. Chẳng hạn như nghiên cứu 4S và MADIT-II có cùng RR (0.72) và tương đương khoảng tin cậy 95%, nhưng xác suất 4S giảm nguy cơ tử vong trên 10% (với luồng ý kiến hoài nghi) cho 4S là 61%, cao hơn so với MADIT-II (khoảng 32%).

Nói tóm lại, phương pháp phân tích và suy luận theo trường phái Bayes khác với trường phái tần số ở phát biểu về một kết quả nghiên cứu.  Đối với trường pháp tần số (hay thống kê cổ điển), một kết quả nghiên cứu có thể “có ý nghĩa thống kê” hay “không có ý nghĩa thống kê” dựa vào một ngưỡng của trị số (như P < 0.05 hay P < 0.01), nhưng không cho chúng ta biết khả năng của giả thuyết.  Trường phái Bayes cung cấp cho chúng ta một “đáp án” trực tiếp liên quan đến giả thuyết khoa học hay mức độ ảnh hưởng của một thuật can thiệp.  Đối với trường phái thống kê cổ điển, mỗi kết quả nghiên cứu được diễn giải một cách đơn lẻ, không cần xem xét đến các kết quả khác hay kết quả của nghiên cứu trước. Tuy nhiên, đối với trường phái Bayes, kết quả nghiên cứu phải được xem xét cùng với các kết quả nghiên cứu trước hoặc kiến thức hiện hành.  Hiện nay, phân tích và suy luận theo trường phái Bayes càng ngày càng phổ biến trong các nghiên cứu lâm sàng.  Nhiều công trình nghiên cứu lâm sàng đối chứng ngẫu nhiên được thiết kế theo mô hình Bayes.  Một số tập san y khoa quốc tế cũng khuyến khích các nhà nghiên cứu và tác giả nên sử dụng phân tích Bayes trong việc diễn giải kết quả nghiên cứu.  Các chuyên gia tiên đoán rằng trường phái phân tích Bayes sẽ trở thành một phương pháp nghiên cứu chuẩn trong thế kỉ 21.

Tuy nhiên, phương pháp Bayes cũng có những hạn chế làm cho việc ứng dụng trường phái Bayes hơi khó khăn.  Chẳng hạn như đối với phương pháp phân tích Bayes, việc quan trọng nhất là phải cung cấp các thông tin tiền định, và thông tin này có ảnh hưởng đến việc suy luận về kết quả hậu định.  Vấn đề đặt ra là thông tin tiền định đến từ đâu và tính khách quan của thông tin này.  Tuy nhiên, trong thời kì có nhiều nghiên cứu và nguồn thông tin như hiện nay, các phân tích tổng hợp (meta-analysis) thường là những nguồn thông tin tiền định quí báu.  Nếu không có thông tin tiền định, chúng ta vẫn có thể sử dụng các luật phân phối thống kê (như mô tả trong phần 2 của bài viết này), chẳng hạn như phân phối theo luồng ý kiến trung dung, và trong trường hợp này thì kết quả phân tích của Bayes không khác nhau kết quả phân tích của trường phái cổ điển.  Tuy nhiên, một lợi thế của trường phái Bayes là có thể ước tính khả năng của bất cứ một ảnh hưởng lâm sàng nào và ước số này có ý nghĩa lớn cho các quyết định lâm sàng.

Ngày nay, y khoa đặt nặng vào các chỉ tiêu lâm sàng (clinical outcome) và hướng dẫn (hay phác đồ) điều trị.  Định hướng này chịu sự ảnh hưởng lớn của phương pháp suy luận xác suất trong quyết định lâm sàng.  Một quyết định lâm sàng sáng suốt phải dựa vào bằng chứng khoa học, phải cân đối giữa dữ liệu nghiên cứu và các giá trị đạo đức cá nhân, và phương pháp Bayes là một cách tiếp cận lí tưởng đáp ứng các yêu cầu đó.

Tài liệu tham khảo

1. Howson C, Urbach P. Scientific Reasoning: The Bayesian Approach. La Salle, IL: Open Court, 1989.

2. Goodman SN. Toward evidence-based medical statistics. 1: the P value fallacy. 2: the Bayes factor. Ann Intern Med 1999;130:995-1013.

3. Browner W, Newman T. Are all significant P values created equal? The analogy between diagnostic tests and clinical research. JAMA 1987;257:2459-63.

4. Spiegelhalter DJ, Myles JP, Jones DR, Abrams KR. Bayesian methods in health technology assessment: a review. Health Technol Assess 2000;4:1-130.

5. Diamond GA, Forrester JS. Clinical trials and statistical verdicts: probable grounds for appeal. (correction in Ann Intern Med 1983;98: 1032). Ann Intern Med 1983;98:385-94.

6. Brophy JM, Joseph L. Placing trials in context using Bayesian analysis: GUSTO revisited by Reverend Bayes. JAMA 1995;273:871-5.

7. Nguyen TV, Pocock NA, Eisman JA.  On the interpretation of bone mineral density measurements and its change. Special Article: J Clin Densitometry 2000; 3:107-19.

8. Nguyen TV, Nelson AE, Howe CJ, Seibel MJ, Baxter RC, Handelsman DJ, Kazlauskas R, Ho KK. Within-subject variability and analytic imprecision of insulinlike growth factor axis and collagen markers: implications for clinical diagnosis and doping tests. Clin Chem 2008 Aug;54(8):1268-76.

9. Nguyen TV. Interpretation of Randomized Controlled Trials of Fracture Prevention. IBMS BoneKEy, August 1, 2009; 6(8): 279 – 294.

10.   Nguyen ND, Wang CY, Eisman JA, Nguyen TV. On the association between statin and fracture: a Bayesian consideration. Bone. 2007 Apr;40(4):813-20.

11.   Nguyen TV. Pharmacogenetics of anti-resorptive therapy efficacy: a Bayesian interpretation. Osteoporos Int 2005 Aug;16(8):857-60.  Invited Editorial.

12.   The Heart Outcomes Prevention Evaluation Study Investigators.  Effects of an agiotensin converting enzyme inhibitor, ramipril on cardiovascular events in high-risk patients.  New Engl J Med 2000; 342:145-53.

13.   The Platelet Glycoprotein IIb/IIIa in Unstable Angina Receptor Suppression Using Integrilin Therapy (PURSUIT) Trial Investigators. Inhibition of platelet glycoprotein IIb/IIIa with eptifibatide in patients with acute coronary syndromes. N Engl J Med 1998;339:436-43.

14.   The Heart Protection Study Collaborative Group. The MRC/BHF Heart Protection Study of cholesterol lowering with simvastatin in 20,536 high-risk individuals: a randomized placebo-controlled trial. Lancet 2002;360:7-22.

15.   The GUSTO Investigators. An international randomized trial comparing four thrombolytic strategies for acute myocardial infarction. N Engl J Med 1993;329:673-82.

16.   Dahlof B, Devereux RB, Kjeldsen SE, et al., the LIFE Study Group. Cardiovascular morbidity and mortality in the Losartan Intervention For Endpoint reduction in hypertension study (LIFE): a randomized trial against atenolol. Lancet 2002;359:995-1003.

17.   The Beta-blocker Heart Attack Trial Research Group. A randomized trial of propranolol in patients with acute myocardial infarction: I. Mortality results. JAMA 1982;247:1707-14.

18.   The Scandinavian Simvastatin Survival Study Group. Randomized trial of cholesterol lowering in 4,444 patients with coronary heart disease: the Scandinavian Simvastatin Survival Study (4S). Lancet 1994;344:1383-9.

19.   Moss AJ, Zareba W, Hall J, et al. Prophylactic implantation of a defibrillator in patients with myocardial infarction and reduced ejection fraction. N Engl J Med 2002;346:877-83.

20.   Sever PS, Dahlof B, Poulter NR, et al. Prevention of coronary and stroke events with atorvastatin in hypertensive patients who have average or lower-than-average cholesterol concentrations, in the Anglo-Scandinavian Cardiac Outcomes Trial-Lipid Lowering Arm (ASCOT-LLA): a multicentre randomized controlled trial. Lancet 2003;361:1149-58.

21) de Lorgeril M, Salen P, Martin JL, et al. Mediterranean diet, traditional risk factors, and the rate of cardiovascular complications after myocardial infarction: final report of the Lyon Diet Heart Study. Circulation 1999;99:779-85.

BÌNH LUẬN

WORDPRESS: 0