Non-inferiority çalışması; nedir ne değildir??

3270

Non-inferiority çalışması ne demek?
Bu tedavi, X tedavisine göre non-inferiordur cümlesini zaman zaman, özellikle de ilaç mümessillerinden duyuyorsunuzdur. Peki nedir non-inferiority? Türkçesi “daha kötü olmayan” şeklinde çevrilebilirse de kulağa evrensel kullanılan şekli daha sıcak geliyor doğrusu.
Kalitesinden ve güvenlik standartlarının yüksekliğinden emin olduğunuz ve satın almaya neredeyse karar verdiğiniz bir motosiklet var diyelim. Satıcı size çok daha ucuz başka bir motosikleti teklif ettiğinde hemen ikna olup diğer motosikleti tercih eder misiniz? Sizin motosikletinizin ABS’si var, oldukça dengeli bir motosiklet vs. Doğal olarak yeni motosikletin sadece güzelliği ile değil, güvenlik performansı gibi önemli özellikleriyle de ilgilenirsiniz. Size deseler ki, diğer (yeni çıkan) motosikletin güvenlik test performans sonuçları sizin beğendiğinizden sadece %1 daha düşük, ancak bununla birlikte fiyatı ise %30 daha ucuz. Muhtemelen bu minik güvenlik zafiyetini önemsiz kabul edip çok daha ucuz olduğu için yeni olan diğer motosikleti tercih edebilirsiniz. Eğer bu yüzdeler tam tersi olsaydı, yani %1 daha ucuz ve %30 daha düşük güvenlik test sonuçları söz konusu olsaydı eminim ki yeni motosikleti asla kabul etmeyecektiniz. Buradaki kritik kavram “tolere edebileceğiniz güvenlik marjı” dır. Güvenlik test sonuçlarındaki %1’lik düşüklük sizin için önemsizken %30 önemli olabilir pekala.

Geleneksel randomize kontrollü çalışmalarda (RKÇ) yeni bir tedavinin plasebodan ya da standart tedavi yönteminden üstün olup olmadığı test edilir. Test edilen değişken genellikle mortalite gibi, morbidite gibi etkinlik sonlanımlarıdır. Yeni tedavinin diğerlerine kıyasla (genelde plasebodur diğer kol) daha etkin olup olmadığını test eden çalışmalara “Superiority çalışmaları” diyoruz. Ancak bugün non-inferiority çalışmalarını konuşacağız.

Tedavi etkinliği nedir?
Kısaca bir tedaviden fayda beklemeyi tanımlayan bu kavramı daha anlamlı kılan şeyse bu “fayda” nın kontrol grubuna kıyasla ne kadar olduğudur. Çoğunlukla bunu plasebo ile kıyaslar ve kontrol grubu olan plasebo grubuna kıyasla anlamalı “fayda” sağlıyorsa o tedavinin etkin olduğundan söz edebiliriz. Ancak bazen bir tedaviyi plasebo grubu ile karşılaştırmak etik olmayabilir. Örneğin plasebo verildiği durumda hastada ciddi bir hayati risk söz konusu olabilirse, eğer Adolf Hitler dünyasında yaşamıyorsanız, plasebo grubu oluşturarak bu çalışmayı dizayn edemezsiniz. Bu durumda yeni tedavi seçeneğini, daha önceden “faydalı” olduğu gösterilmiş bir tedavi seçeneği ile karşılaştırmak gerekir. Bu çalışmalara non-inferiority çalışmaları diyoruz ve yeni bir tedavinin kontrol grubunda verilen diğer tedaviden “kabul edilemeyecek düzeyde daha az etkili” olup olmadığını test eder. Eğer kabul edilebilir, tolere edilebilir düzeyde daha az etkinse yeni tedavinin non-inferior olduğu yorumu yapılır. Aslında yeni ilaç eskisinden inferior da olabilir ama hastaya zarar verecek düzeyde inferior değildir demektir non-inferiority.
Zamanla superiority çalışmaları yerine daha çok bu çalışma tipine ait çalışmalar yapılacağından bu konunun önemli olduğunu düşünüyorum.

Neden non-inferiority çalışmaları “moda” oluyor?
1970’lere kadar bir çok hastalıkta ilaçların etkili olup olmadığı kanıta dayalı olarak bilinmiyordu. Bu sebeple ilacın plasebo grubuna kıyasla etkinliğinin test edilmesi öncelik arz ediyordu. Geçmişteki plasebo kontrollü bir çok çalışma bize çeşitli tedavi seçeneklerinin plaseboya kıyasla anlamlı şekilde tedavi etkinlikleri olduğunu göstermiş oldu. Bunlar aslında superiority çalışmalarına dahil olan ve bize tedavi verilmeyen kola (plasebo grubu) kıyasla tedavi verilmesinin (ilaç-tedavi grubu) daha iyi bir fayda sağlayıp sağlamadığını göstermeyi amaçlayan çalışmalardı.
Artık bir çok hastalıkta plaseboya kıyasla çok etkin tedaviler olduğunu biliyoruz. Akut MI hastasında söz gelimi yeni bir anti platelet tedavi ajanının etkinliği test edilirken bir gruba hiç antiplatelet tedavi vermeme şansımız olamaz, böyle bir çalışmayı etik açılardan tasarlayamayız (hastalara antiplatelet tedavi vermemek zarar verecektir). Özetle, etkin tedavisi olan bir hastalıkla ilgili tedavi çalışmalarında kontrol grubunun plasebo olmasından ziyade gold standart önceki tedavi olması daha etiktir ve çalışmalar giderek bu tipte yapılıyor. Örneğimizden devam edecek olursak, yeni antiplatelet ilacı plasebo ile değil de eski, etkinliği kanıtlanmış antiplatelet ajanla karşılaştırmamız daha uygun olacaktır.

Tabi ki yeni ilacın eski ilaçtan çok üstün olduğunu iddia ederek superiority çalışması da tasarlamak mümkün ancak bu hem medikal olarak kolay gerçekleştirilebilir bir iddia değil hem de çalışma yapması yukarıda bahsettiğim örneklem sayısı çokluğundan dolayı kolay değildir. Aslında daha önceki superiority çalışmaları ile etkinliği gösterilmiş ilaçlarla ilgili ne yazık ki çoğunlukla maliyet, yan etki ya da uygulama güçlüğü gibi zorluklar da mevcuttur. Buradan yola çıkarak yeni bir ilaçta, ana sonlanım üzerinden bir etkinlik üstünlüğü aramak yerine ikincil sonlanımlar konusunda bir üstünlük hedeflenmesi mantıklı bir hedeftir. Ama bunun için öncelikle ana etkinlik sonlanımında (mortalite gibi) diğer ilaca benzer etkinlikte olduğunun gösterilmesi gerekir. Yani, daha yeni çıkan ilaçlar ana sonlanımlar açısından etkinlik konusunda iddialı olmayıp başka parametrelerde avantajlı olup eski ilacın yerini almayı hedefleyebilirler; daha ucuz olmak, kullanım kolaylığına sahip olmak, yan etki profilinin daha güvenilir olması gibi. Bu senaryoda iddia ana sonlanım açısından “önceki ilaçtan daha etkin olmak” yerine, “en az onun kadar iyi olmak” şeklinde olabiliyor: Biz buna tam olarak non-inferiority diyoruz. Non-inferiority çalışmaları yeni ilacın diğer ilaçtan daha üstün olduğunu değil ama en az diğer ilaç kadar etkili olduğunu (veya kabul edilebilir bir oranda daha az etkin olduğunu) ve başka sebeplerle diğer ilaca alternatif olabileceği tezini test ederler.

Non-inferiority ve superiority çalışma tasarımlarının temel farkları
Superiority çalışmasında yokluk hipotezi “ilaçlar arasında fark yoktur” şeklindedir ve siz bunun yanlış olduğunu kanıtlamaya çalışarak bir ilacın diğerinden “üstün” olduğu yorumunu yapmak isteyebilirsiniz. Ancak çalışmanızda yokluk hipotezinizi kabul etmek durumunda kalırsanız ilaçlar arasında fark yoktur demiş oluruz. Ancak buradan tam olarak “ilaçlar denktir” sonucu da çıkaramayız. Non-inferiority çalışmasında ise yokluk hipotezimiz farklıdır, “bu ilaç önceki ilaçtan inferior dur (yani daha başarısızdır)” şeklindedir. Bunun aksini ispat edip yeni ilacın önceki ile arasında önemli düzeyde fark olmadığını ve aynı zamanda inferior olmadığını (ya da non-inferior olduğunu) kanıtlamaya çalışırız.
Superiority çalışmalarında körlük 2 ilacın etkinliğini karşılaştırmada gözlemci bias riskini azaltmak için elzemdir. Non-inferiority çalışmalarında da körlük önerilmekle beraber superiority çalışmalarındaki kadar önem arz etmez çünkü ortada “daha iyi” olduğu iddia edilen bir ilaç yoktur.

Non-inferiority çalışmalarında örneklem büyüklüğü
nceki superiority çalışmalarda iki kol arasındaki etkinlik farkının “büyük” olması beklendiğinden örneklem büyüklüğü hesabında bazen binleri (bazen on binleri) bulan hasta gerekliliği olurken, non-inferiority çalışmalarında 2 tedavi kolu (birisinin etkinliği zaten bilinen) karşılaştırıldığı için ve çok az “fark”ın arandığı çalışmalardır. Non-inferiority çalışmalarında, superiority çalışmalarına kıyasla görece daha az örneklem gereklidir (ortalama 1/10). Örneklem büyüklüğü gruplar arasında beklenen farkın büyüklüğünden etkilenir. Non-inferiroity çalışmalarının en başında, kabul edilebilir farkın çalışma öncesinde hem klinik anlamlılık (subjektif) hem de istatistiksel (objektif) anlamlılık dikkate alınarak belirlenmesi gereklidir. Bu fark (en az önceki ilaç kadar iyi demek için tolere edilebilecek etkinlik farkı), superiority çalışmalarında yokluk hipotezini reddetmek için gerekecek farktan çok daha küçük olacağından dolayı non-inferiority çalışmalarında örneklem büyüklüğü daha azdır. Bu da non-inferiority çalışmalarını daha fizibıl kılıyor.

Non-inferiority çalışmalarında ilaç etkinliğini yorumlama
Bu tip çalışma sonuçları yorumlanırken “non-inferiror” yerine hatalı şekilde “daha üstündür” yorumu yapılır. Yeni antihipertansif ilaç ortalama olarak SKB’yi 15 mmHg düşürürken kontrol kolunu oluşturan daha eski ilaç %10 düşürüyor olsun. Aradaki 5 mmHg lık farka rağmen yeni ilacın eskisine kıyasla daha etkin/üstün olduğu yorumunu yapamayız. Çünkü örneklem büyüklüğüne göre bu değişebilir hatta %95 GA sıfırı içererek aralarında hiç fark olmayabilir de. Bu sebeple ilacın üstün olduğunu söyleyebilmek için muhtemelen daha çok örnekle ve güven aralığının 0’ı içermeyen çalışmalara ihtiyaç vardır.

Eğer iki ilaç arasında fark bulunmazsa, bu iki ilacın “denk” (equivalant) olduğu da söylenemez çünkü örneklem büyüklüğü sebebiyle hatalı bir sonuç bulunmuş olma ihtimali yine söz konusudur. İlaçların denk olduğunu söyleyebilmek için, iki ilacın etkinliği arasındaki farkın “tolere edilebilen” (denklik marjı) sınırlar içerisinde olduğunu göstermek gerekir. Non-inferiority çalışmaları, yeni ilacın eski ilaca kıyasla daha az etkin olmadığını, denklik marjının dışına çıkmayacak ölçüde etkinliğinin olduğunu göstererek kanıtlamayı amaçlar. Sonuç olarak, bir çalışmada 2 ilaç arasında bulunan fark “denklik marjı” nın içerisinde kalıyorsa yokluk hipotezi reddedilir ve yeni ilacın non-inferior (en az diğer ilaç kadar etkili) olduğu yorumu yapılır.
Aşağıdaki Şekil 1’de bir çalışma sonuçlarında olası senaryolar görülüyor. Bazen yeni ilaç standart tedaviden üstün (superior), bazen non-inferior bazen de standart ilaçla denk bulunabilir. Bu şekilde yer almayan dördüncü bir senaryoda eğer “denk etki” senaryosundaki çizginin kenarı (güven aralığı çizgisi) sağ taraftaki delta sınırını “kontrol daha iyi” yönünde aşmış olsaydı ilacın inferior olduğu yorumunu yapacaktık.

Şekil 1. Superiority, noninferiority ve denk/ekivalan etkinlik.

Non-inferiority çalışmalarında tolere edilebilir farkın (denklik marjı ya da non-inferiority marjı) belirlenmesi
Bu fark, çalışmaya başlanmadan önce tanımlanmış olmalıdır. Aksi yaklaşım, yani çalışma tamamlandıktan sonra bu marjın belirlenmesi kabul edilir bir yöntem değildir. Ancak bunu belirlemek çok da kolay olmayabilir. Yeni ilacın non-inferior olabilmesi için belirlenecek marj sınırı hem istatistiksel hem de klinik anlamlı bir sınır olmalıdır. Marjı büyük aldığınızda yeni ilacın non-inferior olduğunu söylersiniz ama plasebodan çok farklı olmayabilir. Yani yeni ilaca kontrol ilaca göre non-inferior derken aynı zamanda etkili olduğunu da söylemiş oluruz ama marj çok genişse etkin olmayan (plasebo ile benzer etkinliği olan) bir ilaca da plaseboya kıyasla etkin demiş olma riski söz konusudur. O sebeple bu marjın, yani kontrol tedaviden daha az etkinlik sınırının plasebodan daha etkin olacak bir noktada olması beklenir (Şekil 2).

Şekil 2. Non-inferiority marjı (delta)

Kabul edilebilir marjın (deltanın) belirlenmesinde evrensel kabul edilmiş bir yöntem yoktur. Açıkçası bunu belirlemek araştırmacıya düşer ve her zaman belirlediği “marj” ın uygunluğu diğer araştırmacılar tarafından kabul görmeyebilir ki non-inferiority çalışmalarının en büyük zorluğu buradadır. Birçok otör ve ilaç düzenleme otoriteleri şöyle bir oran kullanılmasını öneriyor; kontrol grubu ilacın plasebo ile arasında olan minimum etkinlik farkının %50’sinin denklik marjı için kullanılabileceği belirtiliyor. Minimum etkiden kasıt, non-inferiority çalışmasından önceki RKÇ’de hesaplanan güven aralığında belirtilen ve standart tedavinin olası en az tedavi etkisini gösteren değerdir. Örnekle gidelim:
Non-inferiority çalışmasında yeni çıkan B ilacını, daha önceden plaseboya kıyasla etkinliği gösterilmiş olan A ilacıyla karşılaştırıyor olalım ve B ilacının standart tedavi olan A ilacından non-inferior olduğunu göstermeyi amaçlamış olalım. A ilacının daha önce yapılmış olan plasebo kıyaslı RKÇ’sindeki etkinliği bizim için non-inferiority çalışmamızda “kabul edilebilir marj” ın belirlenmesinde işimize yarayacak. A ilacı stroke riskini %3 azaltıyor olsun. Bunun tespit edildiği RKÇ’de %3 değerinin bir de %95 güven aralığı olacaktır ve ilaç stroke riskini %3 (%95 GA %2-4) azaltıyor olarak bulunmuş olsun diyelim. Bunun anlamı A ilacı stroke riskini %3 azaltıyor olarak bulunmuş ama bu etki %2 de olabilir (minimum tedavi etkisi) %4 de olabilir (maksimum tedavi etkisi). B ilacını A ile kıyaslayacağımız non-inferiority çalışmamızda kabul edilebilir marjı (delta) %2 ya da %3 alırsak ve bu aralıkta bir etkinlik azlığını non-inferiority sınırı kabul edersek, ve b ilacının noninferior olrak tespit edersek, B ilacı plasebodan üstün olmadığı halde üstünmüş gibi bir yorum yapmış oluruz (Senaryo X). Deltayı hesaplarken önerilen ise A ilacının (standart tedavi) minimum tedavi etkinliğinin (örneğimizde %2) %50’si kadar bir marjı kabul etmemiz şeklindedir. Örneğimizde bu kuralı uygulayınca marjı %1 olarak hesaplamış oluruz (%2’nin %50 si %1 eder) (Senaryo Y). Doğru olan Y senaryosundaki gibi bir delta değerine göre non-inferiority marjı belirlemektir ancak klinik sonlanımın hassaslığına göre bu %50 kuralı esnetilebilir ancak bunun nedeninin izah edilmesi ve okurların ikna edilmesi gereklidir. Bu sebeple %50 kuralını bir çok çalışmada uygulayabiliriz ve bu tercih sebebiyle nadiren bir eleştiri alırız. Ancak kaynakçaların en altında yer alan JAMA’nın yayını olan kitapta ise sizi kendi marjınızı belirlemede daha özgür davranmanız konusunda cesaretlendirdiğini belirtmeden geçemeyeceğim. Çünkü %50 kuralı her klinik sonlanım için yeterli bir değer olmayabilir.

Şekil 3.

Şekil 4.

Özetle yeni bir tedavinin, kontrol tedavi grubuna kıyasla non-inferior olduğunu söyleyebilmemiz için, etkinliğinin plasebodan fazla olması kaydıyla, non-inferiority marjının içerisinde olması gereklidir. Yeni ilaç için “Non-inferior” yorumu yapabilmemiz için standart tedavinin minimum tedavi etkisinin yarısından daha az bir oranda kabul edilebilir bir etkinlik azlığı kabul edilebilir.
Non-inferiority çalışmalarında biz yeni ilacı sadece kontrol grubu ilaçla karşılaştırdığımızdan, ve non-inferior olduğuna karar verdiğimiz durumda, somut olarak değil ancak hipotetik olarak yeni ilacın aynı zamanda plasebodan etkin olduğunu da söylemiş oluyoruz. Bu sebeple non-inferiority marjının doğru şekilde belirlenmesi çok önemlidir.

Etkinlik analizi
Daha fazla detaya kaçmadan (zaten kaçtık biraz sanki :)) son bir istatistiksel ayrıntıya daha değinmek istiyorum. Superiority çalışmalarında intention to treat analizi önerilir. Bu yaklaşımın randomize edilen her vakanın analize dahil edilmesi ile bias riskini azalttığı düşünülür. Non-inferiority çalışmalarında ise hem intention to treat hem de per protocol analizlerinin ikisinin de yapılması ve ikisinde de yeni ilacın non-inferiority marjını aşmadığı gösterilirse ancak non-inferior odluğu yorumunun yapılması önerilir.

Kaynaklar
Hahn, Seokyung. “Understanding noninferiority trials.” Korean journal of pediatrics vol. 55,11 (2012): 403-7. doi:10.3345/kjp.2012.55.11.403
https://www.karger.com/Article/FullText/312869
User’s Guides to the Medical Literature, Essentials of Evidence Based Clinical Practice, 3rd Edition, Gordon Duyatt, Drummond Rennie, Maureen O. Meade, Deborah J. Cook. JAMA Evidence 2015

Gökhan Aksel
DuruKafa yazarı, Türkiye Acil Tıp Dergisi Eş-Baş Editörüdür :) Okur, yazar, araştırır, acil tıp yapar, fotoğraf çeker, kedi kumu temizler, istatistik yapar, bilim sever, grafik yapar, kara kalem çizer, köpek eğitir, resim yapar ama büyük resmi göremez. Hayvanların insanlardan daha iyi olduğunu bilecek kadar akıllı, dünyanın yuvarlak olduğunu sanacak kadar da saftır. Aşı karşıtlarını öbürsüleştirdiği ise doğrudur.