Fiziki algılarımızın işlenmesi büyük ölçüde beynimizin içinde gerçekleşir, bu algılar arasında görme insan için çok önemlidir. Gözün görevi, ışığı bir görüntü olarak işlenmek üzere beyine ulaştırabilecek şekilde yakalamaktır. Bu sinyaller, sinir hücreleri üzerinden beyne taşınır ve beyinde bu sinyalleri okumak üzere özelleşmiş diğer sinir hücrelerince değerlendirilirler. Bu değerlendirme sonucunda bazı kimyasallar oluşturulur ve biz de buna uygun tepkiler (düşünce, refleks, vb.) geliştiririz. Yani lezzetli yemek görünce ağzımız sulanır, tehlike görünce kaçar ya da savaşırız. Hatta Oscar Wilde’ın “Tekrar bir ilk izlenim kazanmak için asla ikinci bir şansınız olmayacak” sözüyle de insanlarla ilgili değerlendirmelerimizde görmenin önemi ile ilgili harika bir tespit yapılmaktadır.
Görme yeteneği olarak verebileceğim örneklerden biri de babama ait. 40 yıldan fazla kuyumculuk deneyimi ile anlık olarak baktığı altın ziynet eşyasının gerçek ya da sahte olduğunu anlamak bir yana içerisindeki saf altın oranını tam doğrulukla söyleyecek kadar görebilmekte kendisi.
Kısacası görmek bakmaktan fazlası.
Bilgisayarla görme temel olarak diğer yapay zeka alanlarındaki çalışmalara benzer şekilde insan beyninin görme ile ilgili yapabildiklerini makinelere yaptırmaktır. İnsan beyninin temel fonksiyonlarından biri olan görsel tanı makineler için zor bir iştir; ışık koşulları değişebilir ya da tanınması gereken nesneler farklı pozisyonlarda durabilir. Ancak son 10 yılda bu alanda ciddi gelişmeler kaydedilmiştir. Doğal görme işlemi oldukça karışıktır. Bu konuda daha fazla bilgi almak için Neşeli Günler (1978) filminden bir sahne ile konuyu açıklayan Bilgisayarlar Düşünebilir mi? Bölüm 1: Yapay Zekâ Nedir, Bilgisayarla Görme Neden Zor? - Sarkaç (sarkac.org) yazısını okumanızı öneririm.
Bilgisayarla görme genel olarak nesne tanıma, hata tespiti ve sınıflandırma işlemleri için kullanılmaktadır. Bunlara örnekler şehircilikte taşıt plaka tanıma, endüstride ürünlerin kalite kontrolü, askeri alanda İHA vb. sistemlerde tanıma, tarımda tarladaki mahsul durumu için hava görüntülerinin işlenmesi, tıp alanında X-Ray görüntülerinin yorumlanması verilebilir. Covid-19’un ilk günlerinde PCR testi yanında pozitif vaka tespitinde kullanılan yöntemlerden biri de akciğer görüntülerinin yorumlanması olmuştu. Herkese açık olan görüntü verileri ile eğitilen yapay zeka algoritmalarından biri olan derin öğrenme özellikle bu alanda da çok başarılı sonuçlar alınmıştır, merak edenler bu görüntülere ve sistemin nasıl çalıştığına GitHub - lindawangg/COVID-Net: COVID-Net Open Source Initiative adresinden ulaşabilir.
Kuralların önceden tanımlandığı akıllı sistemlerde geçiş kontrolü, kabalalık alanların denetlenmesi, şüpheli paket tespiti ya da araç takibi gibi görüntü analizleri akıllı şehirler’de sunulan çalışmalar olarak bir süredir kullanımdaydı. Bu sistemlerin bir parçası olan yüz tanıma sistemleri ise gizliliğin ihlali durumları nedeniyle oldukça eleştirildi ( bu konuya ilgi duyuyorsanız “Person of Interest” dizisini mutlaka izlemelisiniz). Öte yandan 2020 yılında Covid-19 Pandemisi ile görüntü analizinin bir başka kullanımı yaygınlaşmaya başladı. İş yeri sağlığı ve güvenliği sistemlerinin parçası olarak maske ve mesafe kontrolü de artık bilgisayarla görme ile yapılıyor.
Otomotiv Endüstrisi için bilgisayarla görme çözümlerinin kullanımını 3 ana başlıkta yoğunlaştığını görmekteyiz.
Bitmiş ürünü görsel olarak inceleyerek müşteride memnuniyetsizlik, kalitesizlik maliyeti ve güven eksikliğini önceleyecek kontroller insanlar tarafından yapılmaktadır.İnsana dayalı kalite kontrol faaliyetinin yapay zeka ve bilgisayarla görme ile otomatik hale getirilmesi karlılıkta da etkili bir iyileştirme sağlamaktadır. Işık yoğunluğu ve açısı, uygun kamera sistemleri ve lensleri ile doğru uygulanmış projelerde görsel problemlerden kaynaklanan kalite sorunlarına bağlı müşteri memnuniyetsizliği oluşmamaktadır. Bu alandaki kişisel deneyimlerim küresel çapta hizmet veren şirketlerde dahi insandan kaynaklanan hataların en az %30 gibi bir oranda bu sistemler aracılığı ile ortadan kaldırılabildiği olmuştur. Aşağıdaki görsel IBM Watson IoT merkezindeki örnek bir çalışmadan alınmıştır.
Giderek yaygınlaşan uygulamalardan biri de ihlalleri tespit ederek sistemlerin insandan kaynaklanacak hatalarda iş kazalarını engelleyen çözümleri olarak karşımıza çıkmaktadır. Manuel pres hattında yapılacakgerçek zamanlı uygulamalar bunlara örnek verilebilir.
Bilgisayarla görme teknikleri yardımıyla son yıllarda sürücüsüz otomobillerin geliştirilmesine odaklanılmıştır. Otonom arabalar, etrafındaki tüm nesneleri kameralarla takip edebilmeli ve sürüş ortamında olup bitenlere göre tepki verebilmelidir. Yapay zeka ve bilgisayar görme algoritmaları otonom araçlarda sürüş sahnesi algısı, yol planlama ve hareket kontrolü için imkan sunmaktadır. Bu algoritmalarla ilgili kapsamlı bir araştırmaya 1910.07738.pdf (arxiv.org) ulaşılabilir. Gelişen ve giderek maliyetleri azalan IoT sensörleri, radar, lidar, sonar teknolojileri bu alanda çalışmaları hızlandırmaktadır. Buna da en iyi örneği Tesla’nın çalışmaları Autopilot | Tesla gösterilebilir. Araç sürmek çok keyifli de olsa kazaların çoğunun yorgun sürücülerden kaynaklanıyor olması çoğu zaman bana araçların otonom olmasının ne kadar iyi olacağını düşündürüyor.
Teknolojik iyimser olarak bilgisayarla görmenin üretkenlik patlamasını başlatmış olduğunu düşünüyorum. Bir yandan da heyecan verici bilgisayarla görme konusunda kat edilebilecek daha çok yol olduğunu rahatlıkla söyleyebilirim. Yazıyı bu konuya ilgi duyanların ücretsiz olarak yararlanabilecekleri Edx üzerindeki eğitimler Learn Computer Vision with Online Courses and Lessons | edX ile bitirmek isterim.