Antimicrobial peptide activity prediction using machine learning methods
Abstract
Antimicrobial peptides (AMPs) are considered as promising alternatives to conventional antibiotics in order to overcome the growing problems of antibiotic resistance. Computational prediction approaches receive an increasing interest to identify and design the best candidate AMPs prior to the in vitro tests. In this thesis, using the multiple properties of the peptides we aimed to develop machine learning approaches that can predict the antimicrobial activities of the peptides. We have created two datasets for the peptides showing antimicrobial activity against Gram-negative and against Gram-positive bacteria separately. In our first study, ten different physico-chemical properties of the peptides were calculated, and used as features of the peptides. Following the data exploration and data preprocessing steps, a variety of classification models were build with 100-fold Monte Carlo Cross-Validation; and the performance of these models were evaluated. In the second study, we proposed a novel method called AMP-GSM. The method was tested for three datasets, and the prediction performance of AMP-GSM was comparatively evaluated with several feature selection methods and several classifiers. In the last study, using motif matching score with the models of activity against Gram-positive and Gram-negative bacteria, we created novel peptides and predicted the target selectivity of these peptides. The studies presented in this thesis advance the field of computational research by making it easier to predict the possible antimicrobial effects of peptides and to design AMPs in wet laboratory environments. Antimikrobiyal peptitler (AMP'ler), artan antibiyotik direnç sorununun üstesinden gelmek için geleneksel antibiyotiklerin yerine kullanılabilecek umut verici alternatifler olarak kabul edilmektedir. Hesaplamalı tahmin yaklaşımları, in vitro testlerden önce en iyi aday AMP'leri belirlemek ve tasarlamak için artan bir ilgi görmektedir. Bu tezde, peptitlerin birden çok özelliklerini kullanarak, peptitlerin antimikrobiyal aktivitelerini tahmin edebilen makine öğrenimi yaklaşımları geliştirmeyi amaçladık. Gram negatif ve Gram pozitif bakterilere karşı antimikrobiyal aktivite gösteren peptidler için iki ayrı veri seti oluşturduk. İlk çalışmamızda peptitlerin on farklı fiziko-kimyasal özelliği hesaplanmış ve peptidlerin özniteliği olarak kullanılmıştır. Veri keşfi ve veri ön işleme adımlarının ardından, 100-katlı Monte Carlo Çapraz Doğrulama ile çeşitli sınıflandırma modelleri oluşturuldu; ve bu modellerin performansı değerlendirildi. İkinci çalışmada, AMP-GSM adlı yeni bir yöntem önerdik. Yöntem, üç ayrı veri seti için test edildi ve AMP-GSM'nin tahmin performansı, çeşitli öznitelik seçim yöntemleri ve çeşitli sınıflandırıcılar ile karşılaştırmalı olarak değerlendirildi. Son çalışmada, Gram pozitif ve Gram negatif bakterilere karşı aktivite modelleriyle motif eşleştirme skorunu kullanarak yeni peptidler yarattık ve bu peptidlerin hedef seçiciliklerini tahmin ettik. Bu tezde sunulan çalışmalar, peptidlerin olası antimikrobiyal etkilerini tahminlemeyi ve ıslak laboratuvar ortamlarında AMPleri dizayn etmeyi kolaylaştırarak hesaplamalı araştırma alanını ilerletmektedir.
URI
http://acikerisim.agu.edu.tr/xmlui/bitstream/item/eba02f34-d258-43a4-8565-eb720b8f3534/803359.pdf?sequence=1&isAllowed=yhttps://hdl.handle.net/20.500.12573/1879