(Bản gốc: Defining, Identifying, and Evaluating Clinical Trials of Stuttering Treatments: A Tutorial for Clinicians)
Mark Onslow – Australian Stuttering Research Centre, The University of Sydney
Mark Jones – Queensland Clinical Trials Centre, University of Queensland, Australia
Sue O’Brian; Ross Menzies; Ann Packman – Australian Stuttering Research Centre, The University of Sydney
Mục đích: Để phát triển một phương pháp không tốn nhiều công sức cho các nhà lâm sàng thực hiện đánh giá nghiên cứu về tính hiệu nghiệm về điều trị nói lắp.
Phương pháp: Thử nghiệm lâm sàng là đơn vị đầu ra cơ bản nhất, có thể diễn giải được về mặt lâm sàng và hữu ích nhất của nghiên cứu về điều trị nói lắp. Chúng tôi định nghĩa một thử nghiệm lâm sàng về điều trị nói lắp và xác định 3 cấp độ bằng chứng thử nghiệm lâm sàng. Chúng tôi sử dụng phân loại này để xác định và đánh giá các thử nghiệm lâm sàng về điều trị nói lắp.
Phân loại của chúng tôi dựa trên 2 nguyên tắc cơ bản của thử nghiệm lâm sàng được sử dụng để đánh giá về chăm sóc sức khỏe, đó là: ngẫu nhiên hóa và hệ số ảnh hưởng.
Kết quả: Các thử nghiệm lâm sàng được công bố về các điều trị nói lắp đã được xác định và phân bổ vào 1 trong 3 cấp độ bằng chứng.
Kết luận: Chúng tôi phác thảo một phương pháp 3 bước, bán tự động, dựa trên Internet để xác định việc công bố một báo cáo về tính hiệu nghiệm của điều trị nói lắp. Đối với một báo cáo được xác định như vậy, một bảng kiểm gồm 10 mục được áp dụng để xác minh tình trạng của nó với tư cách là một thử nghiệm lâm sàng và để phân bổ nó vào 1 trong 3 cấp độ bằng chứng thử nghiệm lâm sàng. Phân loại trong bài viết này làm giảm gánh nặng về công việc cho việc áp dụng bảng kiểm 136 mục trong một phân loại hiện có.
Từ khóa: mức độ nghiêm trọng của nói lắp, trẻ em, người lớn, thử nghiệm lâm sàng, tính hiệu nghiệm.
Các học giả trong lĩnh vực nghiên cứu về nói lắp có thể cung cấp cho các nhà lâm sàng các đánh giá tổng quan về nghiên cứu liên quan đến tính hiệu nghiệm của các điều trị khác nhau. Các đánh giá tổng quan này có thể hỗ trợ nhà lâm sàng cung cấp điều trị dựa trên bằng chứng cho khách hàng của họ. Đã có một số nỗ lực để xem xét các báo cáo về điều trị nói lắp mà các nhà lâm sàng có thể tham khảo. Các đánh giá này đã sử dụng một số tiêu chí khác nhau để xác định xem liệu một báo cáo có đáng cân nhắc về mặt lâm sàng hay không, và một số phương pháp khác nhau để đánh giá giá trị của báo cáo.
Andrew, Guitar và Howie (1980) đã dựa trên các đo lường thống kê sinh học về hệ số ảnh hưởng trong việc đánh giá các báo cáo có sẵn tại thời điểm đó. Báo cáo được xem xét nếu chúng có ít nhất 3 người tham gia và dữ liệu trước điều trị và sau điều trị là có sẵn. Đối với 42 báo cáo không dùng thuốc đáp ứng các tiêu chí đó, Andrew và cộng sự sử dụng hệ số ảnh hưởng để đánh giá giá trị của các điều trị được thiết kế để giảm bớt nói lắp. Một phương pháp tiếp cận khác chỉ đơn giản là lập danh mục các tính năng cơ bản của từng báo cáo về điều trị, chẳng hạn như số lượng người tham gia và độ tuổi của họ, thời gian theo dõi, kết quả tóm tắt, v.v. (Bloodstein, 1995; RJ Ingham, 1984; St. Louis & Westbrook, 1987). Phương pháp này không tập trung vào việc định lượng giá trị của mỗi báo cáo một cách có hệ thống, có lẽ là để cho các nhà lâm sàng, những người tham khảo các danh mục này, có thể chọn những điều trị mà họ có thể kiểm tra một cách chặt chẽ hơn từ nguồn mà tài liệu này được công bố. Sau đó, các nhà lâm sàng sẽ tự quyết định xem điều trị nào có giá trị và điều trị nào họ có thể sử dụng như lựa chọn đầu tiên.
Có thể lập luận rằng, cách tiếp cận hữu ích nhất để đánh giá các báo cáo về tính hiệu nghiệm của điều trị nói lắp bao gồm phương pháp để đánh giá chất lượng của chúng. Tiêu chí nổi tiếng của Bloodstein (1995) là một ví dụ của cách tiếp cận này, mặc dù nó không được áp dụng trong việc phân loại các báo cáo về điều trị. Gần đây, Bothe, Davidow Bramlett và Ingham (2006) đã trình bày một phương pháp để xác định điểm mạnh và điểm yếu của các báo cáo và để đưa ra hướng dẫn cho các nhà nghiên cứu. Bothe và cộng sự đã phát triển năm “tiêu chí phương pháp” và năm “tiêu chí kết quả.” Thông thường, để một báo cáo được lựa chọn thì bốn trong số năm tiêu chí phương pháp cần phải được đáp ứng. Điều này đã xảy ra với 39 trên 162 báo cáo. Sau đó, số lượng các tiêu chí kết quả được đáp ứng đã xác định chất lượng của phương pháp luận của một báo cáo. Một bài báo liên quan đã thực hiện hướng dẫn của Bothe và cộng sự cho Công cụ Lượng giá và Đánh giá Nghiên cứu về Điều trị Nói lắp dựa trên bảng kiểm (a checklist-based Stuttering Treatment Research Evaluation and Assessment Tool – STREAT; Davidow, Bothe, & Bramlett, 2006). Bảng kiểm STREAT có 136 mục, gồm 7 tiêu đề chính và 15 tiêu đề phụ, với nhiều mục yêu cầu phản hồi dạng văn xuôi. Mục đích của bài báo này là phát triển một phân loại thay thế để các nhà lâm sàng đánh giá nghiên cứu về tính hiệu nghiệm nói lắp mà không tốn nhiều công sức.
Chúng tôi trình bày thử nghiệm lâm sàng như đơn vị đầu ra cơ bản, có thể diễn giải được về mặt lâm sàng và hữu ích nhất của nghiên cứu về điều trị nói lắp, và đưa ra định nghĩa của thử nghiệm lâm sàng về điều trị nói lắp. Chúng tôi chỉ định ba cấp độ bằng chứng thử nghiệm lâm sàng và chúng tôi sử dụng phân loại này để xác định và đánh giá các thử nghiệm lâm sàng về điều trị nói lắp, tại thời điểm viết, cho bốn nhóm tuổi. Từ trước đến nay, các khuyến nghị về cách đánh giá nghiên cứu về tính hiệu nghiệm của điều trị nói lắp được lấy từ trọng tâm đặc-thù-theo-ngành-và-rối-loạn, dựa trên sự đồng thuận của những chuyên gia khác nhau trong các bài viết của ngành bệnh học về ngôn ngữ và lời nói (hoặc NNTL) về nói lắp (ví dụ, Bloodstein, 1995; Bothe, Davidow, Bramlett , & Ingham, 2006; Conture & Guitar, 1993; Curlee, 1993; Davidow và cộng sự, 2006; J. C. Ingham & Riley, 1998; R. J. Ingham, 1984; Onslow & Packman, 1999; Starkweather, 1993). Định nghĩa của chúng tôi về một thử nghiệm lâm sàng cho một điều trị nói lắp dựa trên và hoàn toàn phù hợp với các công trình đó. Tuy nhiên, phân loại để đánh giá các thử nghiệm lâm sàng về điều trị nói lắp của chúng tôi dựa trên hai nguyên tắc cơ bản được sử dụng để đánh giá chăm sóc sức khỏe nói chung: ngẫu nhiên hóa và hệ số ảnh hưởng.
Chúng tôi phác thảo một phương pháp để các nhà lâm sàng được thông báo ngay lập tức về việc công bố một thử nghiệm lâm sàng và đánh giá nó mà không tốn nhiều công sức. Chúng tôi phác thảo một phương pháp phần nào tự động, ba bước và dựa trên Internet để xác định việc công bố báo cáo về tính hiệu nghiệm của điều trị. Đối với một báo cáo được xác định như vậy, một danh sách kiểm gồm 10 mục được áp dụng để xác minh tình trạng là một thử nghiệm lâm sàng của báo cáo và phân bổ báo cáo vào một trong ba cấp độ bằng chứng thử nghiệm lâm sàng.
Vì mục đích chung của chúng tôi là giảm gánh nặng công sức cho các nhà lâm sàng trong việc xác định và đánh giá các thử nghiệm lâm sàng về điều trị nói lắp, chúng tôi đã cố gắng cải thiện tính dễ đọc của bài viết này bằng cách sử dụng chú thích. Tách biệt với tường thuật của chúng tôi, những chú thích này trình bày phần lớn các chi tiết và lý luận thống kê nền tảng, và các thông tin logic cho các khuyến nghị của chúng tôi. Chúng tôi bắt đầu bằng cách xác định và phân định một thuật ngữ lặp lại là “tính hiệu nghiệm”1.
Điều trị tổng thể
Bothe, Davidow, Bramlett và Ingham (2006) đã đề cập đến một khái niệm về “chất lượng thử nghiệm”. Thay vào đó, cho mục đích lâm sàng, chúng tôi trình bày khái niệm về thử nghiệm lâm sàng NNTL2. Trong bối cảnh này, chúng tôi muốn định nghĩa một thử nghiệm lâm sàng như là một đánh giá về tính hiệu nghiệm của toàn bộ can thiệp. Chúng tôi loại trừ bất kỳ báo cáo nào mà không tìm hiểu tính hiệu nghiệm của một Toàn bộ điều trị khỏi xem xét của chúng tôi về thử nghiệm lâm sàng. “Toàn bộ điều trị” chỉ các điều trị được mô tả một cách hoàn chỉnh trong một báo cáo hoặc được tạo thành hướng dẫn một cách độc lập. “Toàn bộ điều trị” bao gồm ứng dụng thực tế của gói điều trị được xác định trước, thường liên quan đến hướng dẫn được lập trình, như trong chương trình điều trị được báo cáo bởi Boberg và Kully (1994). “Toàn bộ điều trị” cũng bao gồm các báo cáo liên quan đến việc áp dụng các biến số một cách nhất quán để giảm bớt nói lắp, mà không sử dụng hướng dẫn được lập trình, để thực hiện cho đến khi có một đáp ứng có ý nghĩa về mặt lâm sàng cho can thiệp đó. Một ví dụ của trường hợp thứ hai là việc áp dụng tạm ngưng (time-out) không được lập trình cho trẻ em của Martin, Kuhl, và Haroldson (1972).
Chúng tôi không xem xét các báo cáo trong đó các phần của các điều trị được đánh giá bằng thực nghiệm, thay vì để xác định tính hiệu nghiệm của toàn bộ gói [điều trị]. Ví dụ, G. D. Riley và Ingham (2000) đã so sánh thời gian điều trị chuỗi lời nói kéo dài với huấn luyện vận động lời nói để xác định hiệu ứng thanh học của mỗi điều trị. Tuy nhiên, các điều trị đã không được trình bày hoàn chỉnh. Tương tự như vậy, J. Riley và Riley (1999) đã báo cáo về một nhóm người đã nhận được huấn luyện vận động lời nói tiêu chuẩn trong 12 tuần [giúp] giảm khoảng một nửa [số lần] nói lắp của họ, thay vì xác định tính hiệu nghiệm của Toàn bộ điều trị. Ngoài ra, các báo cáo của Harris, Onslow, Packman, Harrison và Menzies (2002) và Franken, Kielstra-Van der Schalka và Boelens (2005) đều bị loại trừ vì họ đưa ra cho trẻ em một phần gồm 12 tuần của hai điều trị đã được tạo thành hướng dẫn mà thông thường, cần nhiều thời gian hơn để có tính hiệu nghiệm. Tương tự, báo cáo của Lattermann, Euler và Neumann (2008) đã so sánh 16 tuần của một điều trị với 16 tuần không điều trị.
Chúng tôi không cho rằng kết quả của các thí nghiệm lâm sàng và các nghiên cứu lâm sàng khác không được quan tâm trên lâm sàng. Ngược lại, chúng có thể hữu ích trong vốn lâm sàng của hiểu biết về những điều trị nào cần xem xét. Ví dụ, báo cáo của Harris và cộng sự (2002) cung cấp thông tin rằng một điều trị nhất định có ảnh hưởng trong khoảng thời gian 12 tuần vượt trội về mặt lâm sàng so với phục hồi tự nhiên. Dưới đây, chúng tôi cho thấy cách thử nghiệm lâm sàng như vậy cho phép suy luận thống kê sơ bộ để bổ sung bằng chứng thử nghiệm lâm sàng trong nói lắp. Tuy nhiên, các thí nghiệm như vậy không cung cấp thông tin cơ bản mà nhà lâm sàng quan tâm: kết quả có thể xảy ra với khách hàng nếu một điều trị được thực hiện một cách hoàn chỉnh. Điều này đưa chúng ta đến chủ đề kết quả.
Kết quả
Trong các thử nghiệm lâm sàng, kết quả là lợi ích sức khỏe theo dự định của một điều trị. Thử nghiệm lâm sàng đòi hỏi tính đặc hiệu/tính cụ thể của kết quả chính. Trong nghiên cứu sức khỏe y tế, kết quả chính đối với các bệnh có thể gây tử vong có thể bao gồm tuổi thọ sau bệnh và đối với các bệnh không gây nguy hiểm tới tính mạnh, kết quả chính có thể bao gồm một đo lường của chất lượng cuộc sống. Đối với các rối loạn với các thành phần sinh hóa, chẳng hạn như bệnh tiểu đường, kết quả chính có thể bao gồm dữ liệu sinh hóa. Đối với các thử nghiệm lâm sàng trong NNTL, kết quả chính thường là, nhưng không nhất thiết là, các đo lường lời nói hoặc ngôn ngữ.
Bao nhiêu kết quả?
Đối với “tiêu chuẩn vàng” là thử nghiệm ngẫu nhiên có đối chứng (RCT), nên có một kết quả chính. Nhiều tạp chí không cho phép công bố một RCT nếu tiêu chí này không được đáp ứng (The CONSORT Group, 2008). Suy luận thống kê trong RCT thường dựa trên một kết quả chính và việc có nhiều hơn một kết quả chính làm mất giá trị của suy luận thống kê khiến cho thử nghiệm không thể diễn giải được. Điều này là do giả thuyết chính của RCT có liên quan đến kết quả chính, được sử dụng để thiết lập số người tham gia để phân tích dữ liệu thử nghiệm (để biết chi tiết về các thử nghiệm lâm sàng trong nói lắp, xem Jones, Gebski, Onslow, & Packman, 2002). Tối đa hai kết quả chính được xem là chấp nhận được (The CONSORT Group, 2008).
Điều này không có nghĩa là việc công bố RCT nhất thiết phải tạo ra thông tin thưa thớt liên quan đến một hoặc hai kết quả. Ngược lại, trong RCT, thực hành tiêu chuẩn để chỉ định một số “kết quả phụ” được quan tâm ngoài các kết quả chính cho một tiên nghiệm. Những kết quả phụ này có thể được sử dụng để cung cấp thêm thông tin phong phú về lợi ích sức khỏe của điều trị. Hạn chế về kết quả chính trong RCT cũng không loại trừ việc nhiều hơn một kết quả được sử dụng trong các phương pháp thử nghiệm ít nghiêm ngặt hơn, điều này sẽ được thảo luận dưới đây. 3.
(còn nữa)
1 Trong bài báo này, các thuật ngữ “efficacy” (tính hiệu nghiệm) và “efficacious” (hiệu nghiệm) được sử dụng theo đúng nghĩa chặt chẽ nhất và không được sử dụng thay thế cho “effectiveness” (tính hiệu quả) và “effective” (hiệu quả), điều đôi khi xảy ra.
2 Bothe, Davidow, Bramlett, và Ingham (2006) và Bothe, Davidow, Bramlett, Franic và Ingham (2006) đã phát triển các phân loại riêng biệt cho các điều trị không dùng thuốc và có dùng thuốc. Tuy nhiên, vì mục đích của chúng tôi là hướng đến những người thực hành NNTL, chúng tôi chỉ quan tâm đến báo cáo đầu.
3 Nhà lâm sàng là người sử dụng nghiên cứu thử nghiệm lâm sàng cần thận trọng với khả năng gây nhầm lẫn của phân tích thống kê xảy ra sau: khả năng bị thuyết phục rằng bằng chứng thống kê đã được phát hiện về tính hiệu nghiệm của điều trị mà không có giả thuyết chính và kết quả chính liên quan. Sự khác biệt giữa năng lực nghiên cứu lâm sàng mang tính khám phá để cung cấp thông tin thay vì gây nhầm lẫn cho nhà lâm sàng có thể không rõ ràng. Điều này được nhấn mạnh trong báo cáo của Blomgren, Roy, Callister và Merrill (2005) liên quan đến Chương trình Sửa đổi Nói lắp Thành công (Successful Stuttering Modification Program – SSMP), trong đó có 14 đo lường kết quả cho 19 người tham gia. Những thay đổi đáng kể ở 4 kết quả này từ trước điều trị đến sau điều trị đã giúp đưa ra kết luận rằng “những phát hiện chỉ ra rằng SSMP, về cốt lõi, là một điều trị giải lo âu” (tr. 520). Nhà lâm sàng đọc báo cáo có nên hình thành quan điểm rằng bằng chứng sơ bộ về điều trị giải lo âu cho nói lắp đã được phát hiện hay giá trị của một điều trị như vậy đã được chứng minh trong một thử nghiệm lâm sàng không? Hai quan điểm này sẽ có ảnh hưởng khác nhau đến thực hành lâm sàng.
American Journal of Speech-Language Pathology • Vol. 17 • 401-415 • November 2008 • © American Speech-Language-Hearing Association 401. 1058-0360/08/1704-0401
Nguồn bản tiếng Anh: https://pubs.asha.org/doi/full/10.1044/1058-0360%282008/07-0047%29
Lưu ý: Bản quyền bản dịch thuộc Dự án “Phát triển Đào tạo Ngôn ngữ trị liệu tại Việt Nam” của tổ chức Ủy ban Y tế Hà Lan – Việt Nam (MCNV)