| Biyoinformatik

  • Ana Sayfa
  • İLETİŞİM

Mikrodizin İfade Profillemesi Analizinde Uygulama Performansı

mehmet | 26 Aralık 2009 | 14:07

Mikrodizin İfade Profillemesi analizlerinde yaygın olarak R platformu üzerinde çalışan Bioconductor paketleri kullanılmaktadır.  Bu analizlerde kullanılan verinin büyüklüğü ve çokluğu göz önüne alındığında analiz uygulamasının çalışma süresi ciddi sıkıntı yaratmaktadır. Bu yazıda bu analiz süresiyle ilgili uygulama performansına dair bir takım bilgiler bulacaksınız.

R bir “scripting” dilidir. Uygulamanızı R sintaksına göre yazıp bunu R “yorumlayıcısı” ile çalıştırsınız.  Bu tip bir yorumlayıcıya ihtiyaç duyan uygulamalar derlenerek çalışan uygulamalardan çok daha yavaş çalışır. Bunun yanısıra, R kendi içinde “C” vb bir dilde yazılmış ve derlenmiş kodların çalışmasına izin verir. Böylelikle uygulamanızın bir kısmında yorumlayıcıyı devre dışı bırakıp işlemerinizi doğrudan işlemci üzerinde yapabilirsiniz.  Bir diğer konu da artık günlük hayatın parçası olan 64bit işlemciler. 64bit işlemciler ile yapılan işlemlerde aynı anda daha fazla veri hafızada tutup işlenebiliyor. Bunun da uygulamanın performansına bir katkı yapmasını bekliyoruz.

Aşağıdaki örneklerde, mikrodizin ifade profillemesi analizinde gerçekleştirilen ve önemli bir yere sahip olan önişleme aşamasının R kodları ve bunların çalışma sürelerine ilişkin bilgileri göreceksiniz. Öncelikle 32bit ve 64bit R yorumlayıcısının 54 adet CEL dosyasını veri olarak kullandığı  analiz sonuçlarını inceleyelim.

exp_profiling.R
library("affy")
affyData = ReadAffy()
eset = expresso( affyData, bgcorrect.method="rma", pmcorrect.method="pmonly", normalize.method="quantiles", summary.method="medianpolish" )
es = exprs(eset)
write.csv( es, "eset.csv" )

32bit R sonuçları

$ time /usr/bin/R –file=exp_profiling.R

real 10m43.529s
user 10m37.707s
sys 0m5.685s

real 10m43.529s
user
10m37.707s
sys
0m5.685s

64bit R sonuçları

$ time /usr/bin/R64  –file=exp_profiling.R

real 9m38.853s
user 9m33.906s
sys 0m4.783s

64bit R ile analiz işlemini yaklaşık 65s daha hızlı yapabiliyoruz. Bir de yukarıdaki örnekte ekspresyon seviyelerini veren algoritmanın C diliyle yazılıp derlenerek R içinden çağrılabilen versiyonu rma() fonksiyonunu kullanarak bir analiz işlemi gerçekleştirelim.

exp_profiling_usingC.R

library("affy")
affyData = ReadAffy()
eset = rma( affyData )
es = exprs(eset)
write.csv( es, "eset.csv" )

32bit R sonuçları

$ time /usr/bin/R –file=exp_profiling_usingC.R

real 1m2.180s
user 0m58.069s
sys 0m4.031s

64bit R sonuçları

$ time /usr/bin/R64  –file=exp_profiling_usingC.R

real 0m53.866s
user 0m49.856s
sys 0m3.000s

Buradaki 32bit ile 64bit arasındaki yaklaşık 8 saniyelik fark R yorumlayıcısından kaynaklanmakta olup derlenen kodun hızına baktığımızda bir önceki örnekteki yorumlanan koda oranla yaklaşık 9 dakika daha hızlı bir şekilde sonuç verdiğini görmekteyiz. Buradan hareketle mikrodizin ifade profillemesi analizinde önişleme aşamasında kullanılan tüm algoritmaların C vb bir dilde yazılıp derlenerek kullanması analiz süresini kısaltacaktır.

Analizlerin Yapıldığı Platform

MAC OS X 10.5.8
2 x 2.26 GHx Quad-Core Intel XEON
16 GB 1066 MHz DDR3

 


Yorumlar
Henüz yorum yok
Kategori
HGM
RSS Yorumlar RSS Yorumlar
Trackback Trackback

HGM | Biyoinformatik

» www.hgmbiyoinformatik.com.tr

 

probecat.com

Probecat™, detaylı "Mikrodizin İfade Profillemesi" analizi yapabilmek için HGM tarafından geliştirilmiş web tabanlı bir uygulamadır.

» www.probecat.com

HGM | Ekip

Doç.Dr. H. Gökhan İLK
Doç.Dr. Hilal ÖZDAĞ
Mehmet KORKMAZ
Zeynep ÖZKESERLİ

 

Get Adobe Flash playerPlugin by wpburn.com wordpress themes
Copyright © 2009 - HGM Biyoinformatik | Ankara Üniversitesi Teknoloji Geliştirme Bölgesi B1-07, 06830, Gölbaşı, Ankara | Tel:+90.312.4853210 | Faks: +90.312.4852082