Tạo bảng tính giá trị lý thuyết bằng Excel

bang tinh

Trong bài trước, tôi đã giải thích về mô hình dự báo, LLN và ULN. Bài này sẽ đi vào chi tiết cách tính Mean, ULN, LLN và một số hàm thông dụng trong Excel giúp tạo bảng tính tự động giá trị lý thuyết để diễn giải kết quả thăm dò chức năng hô hấp tại phòng khám.

I. Những cách tính giá trị LLN và ULN 

Tất cả các mô hình dự báo đều cho phép tính giá trị trung bình lý thuyết (Mean predicted, trong thống kê kí hiệu là Mu hay M) của biến số X cho một bệnh nhân bất kì.

Giá trị dự báo trung bình được dự báo bằng 1 phương trình hồi qui. Độ phức tạp của mô hình tùy thuộc vào bản chất của biến số X, có những mô hình cực kì phức tạp khi sử dụng hàm mũ, làm Logarithm, có mô hình rất đơn giản chỉ gồm 1 biến số, ví dụ tuổi hay chiều cao, có mô hình nhiều biến số, thậm chí có mô hình còn sử dụng những tham số hiệu chỉnh (Spline factors) để điều chỉnh từng điểm giá trị một để có hình ảnh gần với sự thật nhất có thể.

Dù được tính bằng cách nào, ý nghĩa của giá trị M là : giá trị có xác suất cao nhất trong quần thể. Giả sử chúng ta có 100 người cùng chung tuổi, giới tính, chiều cao, cân nặng, M là giá trị trung bình của biến số X, thì xác suất ta tìm thấy giá trị X = M sẽ là cao nhất trong 100 người này.

LLN là giá trị của X ở bách phân vị thứ 5, và ULN là giá trị của X ở bách phân vị thứ 95. Có nghĩa là xác suất tìm ra người có giá trị X = LLN hay X = ULN là cực kì thấp, đó là những trường hợp cá biệt trong quần thể. Nếu giá trị đo được (measured) của X còn thấp hơn cả LLN, thì có thể kết luận đó là bất thường bệnh lý.

Như vậy bài toán đặt ra là xác định giá trị của percentile thứ 5 và 95. Bài toán này có thể được giải một cách gần đúng theo nhiều cách dựa vào đường cong phân phối. Cách tính LLN và ULN sẽ tùy thuộc vào phương pháp thống kê (loại phân phối) mà các tác giả của mô hình đã sử dụng. Có 3 phân phối thông dụng nhất đó là Gaussian, Gamma và Box-Cox.
Trong y văn có 4 phương pháp thông dụng để tính LLN và ULN:

(1) Dựa vào Residual Standard deviation (RSD)

Trong những mô hình loại này, tác giả sử dụng phân phối chuẩn và cung cấp cho chúng ta giá trị của SD hay RSD. RSD là độ lệch chuẩn của khác biệt giữa giá trị dự báo do mô hình tính ra so với giá trị thực tế quan sát được. Nếu mô hình cung cấp phương trình dự đoán giá trị trung bình (Mean predicted) và giá trị RSD, ta có thể tính được LLN và ULN theo công thức:

LLN = Mean predicted – 1.645*RSD

ULN = Mean predicted + 1.645*RSD

Ví dụ:
Phương trình dự báo giá trị FRC (L) đo bằng kỹ thuật pha loãng khí Hélium cho nam giới của tác giả Cordero (1999) có dạng hồi qui tuyến tính đa biến:

M của FRC = 0.089*HEIGHT-0.033*WEIGHT+0.018*AGE-10.185

Giá trị RSD = 0,55

Nội dung của phương trình này như sau:

Intercept = -10,185
3 biến số độc lập Height, Weight, Age lần lượt nhận hệ số: +0,089 – 0.033 và +0.018

Bây giờ nếu bạn có bệnh nhân 40 tuổi, cao 175 cm, nặng 60 kg
Phương trình dự báo cho phép tính Mean predicted FRC = 4,13 L
Như vậy LLN = 4,13 – 1,645*(0,55) = 3.225 L
ULN = 4,13 + 1,645*(0,55) = 5.03475 L

Diễn giải kết quả : Nếu giá trị FRC đo được của bệnh nhân > 5.03475 tức là có sự tăng bất thường thể tích khí cặn chức năng trong phổi.

Ghi chú: Có khi bản thân RSD được dự báo bằng 1 phương trình độc lập, như vậy giá trị của RSD cũng thay đổi cho mỗi bệnh nhân.

(2) Dựa vào SEE (standard error of estimation)

Nếu mô hình cung cấp phương trình dự đoán giá trị trung bình (Mean predicted) và giá trị SEE, ta có thể tính được LLN và ULN theo công thức:
LLN = Mean predicted – 1.96*SEE
ULN = Mean predicted + 1.96*SEE

Ví dụ:
Phương trình dự báo giá trị TLCO (mlCO/min/mmHg) cho nữ giới của Quanjer (1999) có dạng hồi qui tuyến tính đa biến:
0.2441*HEIGHT-0.1463*AGE-8.2
Nội dung của phương trình này như sau:
Intercept = -8.2
2 biến số độc lập Height, Age lần lượt nhận hệ số: 0.2441 , -0,1463
Giá trị SEE = 3,49

Bệnh nhân nữ 30 tuổi, cao 170 cm, ta có thể dự đoán mean predicted TLCO = 28,91 ml/min/mmHg
LLN = 0.2441*170-0.1463*30-8.2-3.49*1.96 = 22.07 ml/min/mmHg
ULN= 0.2441*170-0.1463*30-8.2+3.49*1.96 = 35.75 ml/min/mmHg

Diễn giải kết quả : Nếu giá trị đo được < 22.07 ml/min/mmHg tức là bệnh nhân có rối loạn chức năng trao đổi khí (giảm TLCO)

(3) Sử dụng 3 phương trình độc lập cho M, LLN và ULN

Trong một dạng mô hình khác, các tác giả cung cấp cho chúng ta 3 phương trình dự đoán riêng biệt cho Mean predicted, LLN và ULN. Ở trường hợp này ta có thể tính ra cả 3 giá trị cùng lúc một cách trực tiếp

(4)Phương pháp LMS

Sử dụng 3 chỉ số: Mu (Mean hay giá trị trung bình),Lambda (L hay Skewness -độ lệch ) và Sigma (S hay phương sai)

Trong mô hình này : Giá trị dự báo trung bình (M) cũng được dự báo bằng 1 phương trình hồi qui (các biến số có thể là chiều cao, tuổi, cân nặng, giới tính, BMI, …)

2 thông số S, L có thể được cung cấp dưới dạng giá trị cố định hay phương trình dự báo

Trong trường hợp chỉ có S, ta có thể giả định phân phối chuẩn để tính L gần đúng bằng công thức của phân phối Gaussian:
L = ((4-π)/2)*(σ*(2/ π)^0.5)^3/(1-(2* σ^2/ π))^3/2

Khi biết M, L và S, ta tính được LLN và ULN theo công thức như sau:

LLN= M*(1-1.645*L*S)^(1/L)
ULN= M*(1+1.645*L*S)^(1/L)

Ví dụ điển hình của phương pháp LMS là mô hình dự báo của Quanjer (hiệp hội GLI, 2012) cho thông số hô hấp ký, cho mọi lứa tuổi từ (3-95 tuổi) và 5 chủng tộc khác nhau. Đây là mô hình chính xác nhất hiện nay trên thế giới. Tôi sẽ không đưa ra ví dụ cụ thể vì các tác giả cung cấp bảng Excel và phần mềm ứng dụng của riêng họ, bạn có thể tải về sử dụng dễ dàng từ trang web của Global lung function initiatives.

Một ví dụ khác là mô hình rất mạnh của Koopman (2011) cho trẻ em 6-18 tuổi và tất cả các kỹ thuật thăm dò chức năng, trong đó các tác giả sử dụng phân phối Gamma. Việc tính bách phân vị cho phân phối Gamma khá phức tạp, trong bảng Excel cung cấp bởi nhóm tác giả, họ phải dùng hàm Gamma inverse là một thuật toán ngược của Excel để xác định bách phân vị. Tuy nhiên các bạn cũng có thể dùng phương pháp LMS cho phân phối Gamma, vì đã có Mu, Sigma và hệ số K.

Hệ số Skewness (L hay Lambda) có thể tính gần đúng như sau:

Lambda = Skewness = 2/(K)^0.5

Ví dụ: Trong mô hình Koopman
M của TLCO = (EXP(34.8048-6.8925*Ln(HEIGHT)-8.6557*Ln(12*AGE)+0.1043+1.7893*Ln(HEIGHT)*Ln(12*AGE)))/0.3348

Sigma = EXP(-1.63-0.0348*AGE)

Hệ số K của phân phối Gamma = 51.7180887794166
Ta sẽ tính được Lambda = 2/(51.7180887794166)^0.5 = 0,27810

Với bệnh nhi nam 10 tuổi, cao 120 cm :

M (TLCO) = 13,162 ml/min/mmhg
Sigma = 0,13835
LLN = M*(1-1.645*L*S)^(1/L) = 10,404 ml/min/mmhg
ULN = M*(1+1.645*L*S)^(1/L) = 16,41185 ml/min/mmhg

Một số trường hợp đặc biệt:

(1) Biến số X bị chuyển dạng bằng hàm logarithm

mô hình này đưa ra phương trình dự đoán có dạng:

Ln(X) = hàm số với 1 hay nhiều biến độc lập (tuổi, giới tính, cân nặng…)

Hay:

Log(X) = hàm số với 1 hay nhiều biến độc lập (tuổi, giới tính, cân nặng…)

Để sử dụng được giá trị của X, ta phải chuyển đổi ngược lại:

Với Ln(X), ta có thể tính M của X bằng hàm Exponentiel

M= EXP(Ln(M))

Ví dụ :

mô hình dự báo giá trị lý thuyết cho TLCO của Kim Young Jee (2012) có dạng:

Ln(TLCO) = 0.796+0.012*HEIGHT+0.018*AGE+0.011*SEX*AGE

Nội dung của mô hình:
Biến số TLCO đã bị chuyển dạng thành Ln(TLCO)
Intercept = 0.796
Chiều cao, tuổi nhận hệ số: 0.012 và 0.018Biến số giới tính nhân cho tuổi nhận hệ số 0.011, Nam giới thì Sex = 1, Nữ giới thì Sex=0

Như vậy ta tính M bằng cách dùng hàm EXP cho toàn bộ phương trình

M(TLCO) = EXP(0.796+0.012*HEIGHT+0.018*AGE+0.011*1*AGE)

SEE (standard error of estimate) của mô hình = 0,1354

Như vậy:
LLN = EXP(0.796+0.012*HEIGHT+0.018*AGE+0.011*1*AGE-1,96*0,1354)
ULN = EXP(0.796+0.012*HEIGHT+0.018*AGE+0.011*1*AGE+1,96*0,1354)

Cho 1 bệnh nhân nam, 14 tuổi cao 150 cm thì:
Giá trị trung bình lý thuyết TLCO = 20,3
LLN = 15,43 và ULN = 26,24

Lưu ý rằng SEE hay RSD được sử dụng trên phương trình gốc, sau đó ta dùng hàm EXP cho cả nhóm

II. Cách lập công thức trong Excel:

Với mỗi mô hình bạn có thể tạo ra 1vài ô để nhập giá trị của biến độc lập (tuổi, chiều cao, cân nặng…), 1 vài ô cho RSD hay SEE, Lambda, Sigma và ít nhất 4 ô kết quả cho: Mean predicted (trung bình dự báo), LLN, ULN và %M

Trong ô kết quả bạn có thể lập công thức bắt đầu bằng dấu “=”

Một số hàm thông dụng:

Các phép tính cơ bản: +, -, *, /

LN(X) : logarithm cơ số e

LOG(X) : logarithm cơ số 10

X^(…) : hàm mũ

EXP(X) : hàm exponentiel

(X<A)*(Y1)+(X>A)*(Y2) : Hàm điều kiện : Nếu X nhỏ hơn A thì chọn giá trị Y = Y1, nếu X lớn hơn A thì sẽ chọn giá trị Y2

(X)^0.5 : căn bậc 2

Nếu các bạn có hứng thú với đề tài này, có thể liên lạc với tác giả để nhận bảng Excel mẫu của một số mô hình thông dụng.

Chúc các bạn thành công

2 comments

  1. Nói thêm: Sử dụng công thức trong Excel còn giúp tính giá trị Mean, LLN va ULN cho hàng loạt trường hợp, điều này rất có ích khi làm một nghiên cứu lâm sàng cần báo cáo giá trị lý thuyết hoặc giá trị % theo lý thuyết của 1 nhóm bệnh nhân.

  2. Ghi chú: Đối với TLCO: 1 số mô hình sử dụng đơn vị không chuẩn là mmolCO/min/kpa thay vì mlCO/min/mmhg, hệ số qui đổi giữa chúng là:

    DLCO (mlCO/min/mmHg) = DLCO (mmol/min/kpa) / 0,3348

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: