Bilgisayarlı Görü

Elif Meşeci
4 min readOct 1, 2021

Çevremize baktığımızda bir çok nesne görürüz ve beynimiz tüm bu nesnelerin ne olduğunu anında ayırt edebilir. Bilgisayarlı görünün amacı insanlar gibi makinelerin de gördüğü nesneyi algılayıp ne olduğunu ayırt edebilmesidir.

Bilgisayarlı Görü tanımlarına bakacak olursak;

“Görüntülerden fiziksel nesnelerin açık, anlamlı tanımlarının inşası “— (Ballard ve Brown, 1982)

“Bir veya daha fazla dijital görüntüden 3B dünyanın özelliklerinin hesaplanması” — (Trucco ve Verri, 1998)

“Algılanan görüntülere dayalı olarak gerçek fiziksel nesneler ve sahneler hakkında faydalı kararlar vermektir.” — (Sockman ve Shapiro, 2001).

Aslında gün içinde bilgisayarlı görüden yararlanan bir çok teknolojiyi kullanıyoruz. Örneğin arama motorlarında bir görseli arattığımızda alakalı görselleri bulmak için o görseli analiz eden algoritmalar kullanılır. Daha sık kullandığımız bir şey ise yüz tanıma; bir çoğumuz telefon kilidini yüz algılama seçeneğiyle açıyoruz. Bu daha önce yüzümüzü makineye tanıtmamız ve her ekranı açmak istediğimizde yüzümüzün algılanıp analiz edilmesiyle gerçekleşiyor. Facebook yüz tanıma sisteminde de aynı şekilde daha önceki verilerden yararlanarak fotoğraftaki insanların kim olduğu tahmin ediliyor.

Google lens ile görüntü arama ekranı

👀Peki makineler nasıl görür ?

  • Renkler sayılarla temsil edilir: Bilgisayar bilimlerinde her renk belirli bir HEX değeriyle temsil edilir. Makineler, görüntü piksellerinin hangi renklerden oluştuğunu anlamak için bu şekilde programlanır.
  • Görüntü Segmentasyonu: Benzer renk gruplarını tanımlamak ve görüntüyü bölümlere ayırmak, yani ön planı arka plandan ayırmak için yapılır. Renk gradyanı tekniği, farklı nesnelerin kenarlarını bulmak için kullanılır.
  • Köşeleri bulma: Segmentasyondan sonra, görüntüler belirli özellikler için aranır. Basit bir deyişle, algoritmalar belirli bir açıda buluşan ve görüntünün belirli bir bölümünü tek bir renk tonuyla kaplayan çizgileri arar. Köşeler olarak da adlandırılan özellikler, görüntüde yer alan daha ayrıntılı bilgileri bulmaya yardımcı olan yapı taşlarıdır.
  • Dokuları bulma: Herhangi bir görüntüyü doğru bir şekilde tanımlamak için görüntüdeki dokuyu belirlemek gerekir. İki nesne arasındaki doku farkı, bir makinenin bir nesneyi doğru şekilde sınıflandırmasını kolaylaştırır.
  • Tahminde bulunma: Görüntüyü veri tabanında bulunanlarla eşleştirerek en çok benzeyen nesne tahmin olarak sunulur.
  • Sonunda, makine daha büyük ve net resmi görür ve uygulanan algoritmik talimatlara göre resmi tanımlamanın doğru olup olmadığını kontrol eder.

Bilgisayarlı Görünün Kullanım Alanları

🌟 Görüntü Sınıflandırma : Bir görüntünün hangi sınıfa ait olduğunu tahmin edilir.

🌟 Nesne Algılama : Nesne algılama için öncelikle görüntünün hangi sınıfa ait olduğunu belirlemek için görüntü sınıflandırma kullanılır. Ardından bir görüntüde veya videodaki görünümleri algılanır ve sınırlayıcı kutu içerisine alınır.

🌟 Nesne Takibi : Belirli bir nesne algılandığında onu takip eder. Genellikle sıralı yakalanan görüntülerde veya gerçek zamanlı videolarda nesne takibi yapılır.

🌟 Segmentasyon: Belli bir sınıfa ait görüntülerin renklendirilerek arka plandan ayrılmasıdır.

🌟 İçerik tabanlı görüntü alma: Görüntülerin veri etiketleri yerine içeriğine baz alarak büyük veri depolarından görüntülere göz atmak, aramak ve görüntüleri almak için kullanılır.

Referanslar:

How to do everything in Computer Vision | by George Seif | Towards Data Science

--

--

Elif Meşeci

Artificial Intelligence Specialist at SimurgAI || Computer Engineer