Sebagai manusia, kita masing-masing memiliki triliunan sel. Dan setiap sel memiliki nukleus dengan informasi genetik individu –DNA – yang dapat bermutasi untuk menciptakan kelainan. Jika manusia dilahirkan dengan banyak kelainan di dalam sel, atau jika mutasi berkembang dari waktu ke waktu, penyakit akan terjadi. Lebih rumit lagi, sel-sel seringkali merupakan campuran dari DNA normal dan abnormal – sebuah mozaik, boleh dikatakan begitu, dan seperti bentuk seninya, montase kompleks ini sulit dipahami. Namun, tim peneliti yang dipimpin oleh Joseph Gleeson, MD, Rady Professor of Neuroscience di UC San Diego School of Medicine dan direktur penelitian neuroscience di Rady Children’s Institute for Genomic Medicine, telah menggunakan Triton Shared Computing Cluster (TSCC) di San Diego Supercomputer Center (SDSC) di UC San Diego untuk pemrosesan data dan pelatihan model guna mengungkap metode baru untuk pengenalan mosaik DNA.
Gleeson dan timnya baru-baru ini menemukan gen dan jalur baru dalam malformasi perkembangan kortikal, spektrum gangguan yang menyebabkan hingga 40 persen epilepsi fokal yang resistan terhadap obat. Penelitian mereka menunjukkan bagaimana model yang dihasilkan komputer dapat secara efisien meniru pekerjaan pengenalan manusia dengan cara yang jauh lebih efisien dan diterbitkan minggu ini di Nature Genetics. Sebuah studi terkait diterbitkan awal bulan ini di Nature Biotechnology.
Kami mulai dengan alokasi uji coba pada superkomputer Comet SDSC bertahun-tahun yang lalu dan telah menjadi bagian dari komunitas TSCC selama hampir satu dekade. TSCC memungkinkan kami untuk memplot model yang dihasilkan oleh program pengenalan komputer yang disebut DeepMosaic dan simulasi ini memungkinkan kami untuk menyadari bahwa setelah kami melatih program superkomputer untuk mengidentifikasi area sel yang tidak normal, kami dapat dengan cepat memeriksa ribuan varian mosaik dari setiap genom manusia – ini tidak akan mungkin jika dilakukan dengan mata manusia.”
Xiaoxu Yang, peneliti pascadoktoral di Laboratorium Penyakit Otak Anak Dr. Gleeson
Jenis pengetahuan yang dihasilkan komputer ini dikenal sebagai pembelajaran mendalam berbasis jaringan saraf convolutional dan telah ada sejak tahun 1970-an. Saat itu, jaringan saraf sudah dibangun untuk meniru pemrosesan visual manusia. Hanya butuh beberapa dekade bagi para peneliti untuk mengembangkan sistem yang akurat dan efisien untuk jenis pemodelan ini.
“Tujuan pembelajaran mesin dan pembelajaran mendalam seringkali untuk melatih komputer untuk tugas prediksi atau klasifikasi pada data berlabel. Ketika model yang dilatih terbukti akurat dan efisien, peneliti akan menggunakan informasi yang dipelajari – daripada anotasi manual untuk memproses data besar. sejumlah informasi,” jelas Xin Xu, mantan asisten peneliti sarjana di laboratorium Gleeson dan sekarang menjadi ilmuwan data di Novartis. “Kami telah menempuh perjalanan jauh selama 40 tahun terakhir dalam mengembangkan pembelajaran mesin dan algoritme pembelajaran mendalam, tetapi kami masih menggunakan konsep yang sama yang mereplikasi kemampuan manusia untuk memproses data.”
Xu mengacu pada pengetahuan yang dibutuhkan untuk lebih memahami penyakit yang disebabkan ketika mosaik abnormal mengambil alih sel normal. Yang dan Xu bekerja di laboratorium yang bertujuan untuk melakukan hal itu – lebih memahami mozaik yang menyebabkan penyakit – seperti epilepsi, gangguan otak bawaan, dan banyak lagi.
“Pendekatan pembelajaran mendalam jauh lebih efisien dan kemampuannya untuk mendeteksi struktur dan koneksi tersembunyi di dalam data terkadang bahkan melampaui kemampuan manusia,” kata Xu. “Kami dapat memproses data jauh lebih cepat dengan cara ini, yang membawa kami lebih cepat ke pengetahuan yang dibutuhkan.”
Sumber:
Universitas California San Diego
Referensi jurnal: