Tree-net: Bottleneck feature supervised network for biomedical image segmentation
Özet
In this thesis, we introduce Tree-NET, a novel approach for medical image segmentation utilizing bottleneck feature supervision. This method enhances traditional segmentation algorithms by keeping supervision between bottleneck features of the network. The primary goal is to improve the model's ability to learn discriminative and robust features while simultaneously reducing computational costs. Bottleneck feature supervision involves compressing the input and label data using Autoencoders and then supervising the bottleneck features with a segmentation network named "Bridge-Net," which can be any segmentation model of choice. We applied Tree-NET to two critical medical image segmentation tasks: skin lesion segmentation and polyp segmentation. Our experiments demonstrate significant improvements in segmentation accuracy and efficiency. For instance, the U-NET backboned Tree-NET uses only 154.43 MB for executing and storing the model, which is almost 3.5 times smaller than the original U-Net while having a close number of trainable parameters. In skin lesion segmentation, Tree-NET achieved dice, Intersection-over-Union (IoU), and accuracy scores of 0.893, 0.751, and 0.977 respectively. For polyp segmentation, the scores were 0.856, 0.795, and 0.923 for dice, IoU, and accuracy respectively. Compared to traditional segmentation models, the empirical results show that Tree-NET achieves higher accuracy with reduced training time and computational cost, thus representing a significant advancement in medical image analysis by providing more reliable and efficient tools for clinical applications. Bu tezde, tıbbi görüntü segmentasyonu için yeni bir yaklaşım olan Tree-NET tanıtılmaktadır. Bu yöntem, geleneksel kodlayıcı-çözücü mimarilerini, ağ içerisindeki ara özellik temsillerine veya dar boğazlara gözetim ekleyerek geliştirir. Ana hedef, modelin ayırt edici ve sağlam özellikler öğrenme yeteneğini artırırken aynı zamanda hesaplama maliyetlerini ve eğitim süresini azaltmaktır. Dar boğaz özellik gözetimi, girdileri ve etiket verilerini Otomatik Kodlayıcılar kullanarak sıkıştırır ve ardından "Bridge-Net" olarak adlandırılan bir segmentasyon ağı ile dar boğaz özelliklerini denetler, bu ağ temelde herhangi bir segmentasyon modeli olabilir. Bu yaklaşım, daha az hesaplama kaynağı tüketimi, daha yüksek doğruluk sonuçları sağlarken, neredeyse aynı toplam eğitilebilir parametre sayısını korur. Tree-NET'i iki kritik tıbbi görüntü segmentasyonu görevi olan cilt lezyon segmentasyonu ve polip segmentasyonuna uyguladık. Deneylerimiz, segmentasyon doğruluğunda ve verimliliğinde önemli iyileşmeler göstermektedir. Örneğin, U-NET tabanlı Tree-NET, modeli çalıştırmak ve depolamak için yalnızca 154.43 MB kullanır, bu da orijinal U-NET mimarisinden neredeyse 3.5 kat daha küçüktür. Cilt lezyon segmentasyonunda, Tree-NET sırasıyla 0.8938, 0.7518 ve 0.9776 dice, IoU ve doğruluk seviyelerine ulaşmıştır. Polip segmentasyonunda ise, dice, Intersection-over-Union (IoU) ve doğruluk için sırasıyla 0.8564, 0.7956 ve 0.9236 puanlarına ulaşmıştır. Geleneksel segmentasyon modelleriyle karşılaştırıldığında, ampirik sonuçlar Tree-NET'in daha yüksek doğruluk, daha düşük eğitim süresi ve hesaplama maliyeti ile daha yüksek performans gösterdiğini, bu nedenle tıbbi görüntü analizinde önemli bir ilerlemeyi temsil ettiğini ve klinik uygulamalar için daha güvenilir ve verimli araçlar sağladığını göstermektedir.