dc.contributor.author | Aydin, Zafer | |
dc.contributor.author | Kaynar, Oguz | |
dc.contributor.author | Gormez, Yasin | |
dc.date.accessioned | 2023-04-28T08:52:23Z | |
dc.date.available | 2023-04-28T08:52:23Z | |
dc.date.issued | 2018 | en_US |
dc.identifier.isbn | 978-1-5386-1501-0 | |
dc.identifier.issn | 2165-0608 | |
dc.identifier.other | WOS:000511448500138 | |
dc.identifier.uri | https://hdl.handle.net/20.500.12573/1586 | |
dc.description.abstract | Proteinlerin üç boyutlu yapılarının tahmin edilmesi
teorik kimya ve biyoenformatik için önemli problemlerden
biridir. Üç boyutlu yapı tahminin en önemli aşamalarından biri
ise ikincil yapı tahminidir. İkincil yapı tahmininde başarı
oranının artırılması kullanılan sınıflama algoritması kadar,
hesaplanan özniteliklere de bağlı olmaktadır. Öznitelik çıkarmak
için sıkça kullanılan çoklu hizalama yöntemlerinde ise
hesaplanan değerler, hizalama için kullanılan veri tabanına göre
farklılık göstermektedir. Bu nedenle öznitelik matrisleri
oluşturulurken uygun veri tabanın seçilmesi önem
kazanmaktadır. Bu çalışmada CB513 veri seti kullanılarak iki
farklı hizalama yöntemi ve üç farklı veri tabanı yardımı ile 5
farklı veri seti oluşturulmuş ve bu veri setleri iki aşamalı hibrit
bir sınıflandırıcı kullanılarak karşılaştırılmıştır. Elde edilen
sonuçlar doğrultusunda en iyi başarı oranı HHBlits hizalama
yönteminin ilk aşamasında hesaplanacak PSSM değerleri için
UniClust ve yapısal profil matrisleri için yine HHBlits’in ilk
aşamasında NR veri tabanı kullanıldığında elde edilmiştir. | en_US |
dc.description.abstract | Three-dimensional structure prediction is one of
the important problems in bioinformatics and theoretical
chemistry. One of the most important steps in the threedimensional structure prediction is the estimation of secondary
structure. Improving the accuracy rate in protein secondary
structure prediction depends on computed attributes as well as
the classification algorithms. In multiple alignment methods,
which are often used to extract an attribute, the calculated values
differ according to the database used for the alignment. For this
reason, it is important to use a suitable database against which
the target proteins are aligned to compute profile feature vectors.
In this study, 5 different datasets are generated for the CB513
benchmark with the aid of two different alignment methods and
three different databases. The profile features are fed as input to
a two-stage hybrid classifier. According to the experimental
results, the highest accuracy rate is obtained when UniClust
database is used at the first stage of HHBlits alignment to
calculate PSSM values and NR database is used at the first stage
of HHBlits alignment to calculate structural profile matrices. | en_US |
dc.language.iso | tur | en_US |
dc.publisher | IEEE | en_US |
dc.rights | info:eu-repo/semantics/closedAccess | en_US |
dc.subject | Secondary Structure Prediction | en_US |
dc.subject | Protein Structure Prediction | en_US |
dc.subject | Multi Alignment | en_US |
dc.subject | Protein Database | en_US |
dc.subject | İkincil Yapı Tahmini | en_US |
dc.subject | Protein Yapı Tahmini | en_US |
dc.subject | Çoklu Hizalama | en_US |
dc.subject | Protein Veri Tabanı | en_US |
dc.title | Comparison of NR and UniClust Databases for Protein Secondary Structure Prediction | en_US |
dc.type | other | en_US |
dc.contributor.department | AGÜ, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü | en_US |
dc.contributor.authorID | 0000-0001-7686-6298 | en_US |
dc.contributor.institutionauthor | Aydin, Zafer | |
dc.identifier.startpage | 1 | en_US |
dc.identifier.endpage | 4 | en_US |
dc.relation.journal | 2018 26TH SIGNAL PROCESSING AND COMMUNICATIONS APPLICATIONS CONFERENCE (SIU) | en_US |
dc.relation.publicationcategory | Makale - Uluslararası Hakemli Dergi - Kurum Öğretim Elemanı | en_US |