Görüntü İşleme Tekniklerinde Yapay Zeka Kullanımı

İnsan beyninin algıladığı, işlediği ve yorumladığı en önemli bilgi türü görsel verilerdir. Psikolog Albert Mehrabian’a göre; iletişimin %93’ü sözel olmayan verilerden sağlanıyor ve beyin görsel bilgileri yazılı verilere kıyasla 60.000 kat daha hızlı işliyor.

Görsel verinin bu gücü, ürün ve içerik pazarlama gibi birçok sahada pazarlama stratejisi olarak kullanımını da yaygınlaştırdı. Görsel materyallerin insan faktörünün olduğu her alanda etkili bir araç olması, gelişen teknoloji ile birlikte görsellerin oluşturulmasının ve yayılmasının kolaylaşması gibi faktörler milyonlarca görseli barındıran veri yığınları oluşturuyor. Elde edilen bu veri yığınları aynı zamanda yeni nesil teknolojiler için mükemmel bir veri tabanı sağlıyor.

Yapay zekanın da sahaya çıkışıyla, görsel verilerin içerdiği bilgiler sadece insan algısına hitap eden basit bir reklam aracı olmaktan çıkıp medikal tanı uygulamalarından malzeme bilimi teknolojilerine, savunma sanayisindeki sensör sistemlerinden film endüstrisine kadar geniş ölçekteki teknolojilerin kaynağına dönüşüyor.

Görüntü İşlemenin Temel Matematiği

Görüntü işleme teknikleri mevcut resimlerin analizi ile çeşitli bilgiler edinmeye yarayan sistemlerdir. Görüntü işleme teknikleri kullanım yerlerine göre, en basit algoritmalardan en karmaşık algoritmalara kadar farklı matematiksel ifadeler üzerinden çalışır. Bilgisayar düzleminde bir görüntü iki boyutlu bir matristen oluştur, f(x,y) olmak üzere yatay ve dikey doğruların oluşturduğu düzlemdeki noktalara karşılık gelen her bir nokta görselin piksel değerini temsil eder.

Renkli görüntülerde ise 3 boyutlu koordinat sistemi kullanılır ve renk skalası değerleri üzerinden bilgi edinilir. Her bir piksel o noktanın parlaklığı ve rengi konusunda bilgi verir. Basit bir fonksiyonun ifadesi olan görsellerin her biri kendine has matematiksel denklemlerdir.

Görüntü işleme sistemlerinin yoğunlaştığı nokta ise milyonlarca görsel kimliği arasındaki benzerlikleri veya farklılıkları bularak yeni bilgiler elde etmektir. Güçlü kişisel bilgisayarların, büyük boyutlu bellek cihazlarının ve grafik yazılımlarının kolay erişilebilirliği görüntü işleme sistemlerinin her geçen gün daha popüler olmasını sağlamaktadır.

Görüntü İşlemede Yapay Zeka

Görsel işleme ile elde edilmesi beklenen bilgiler fotoğraf üzerindeki bir kedinin ya da köpeğin etiketlenmesinden çok daha öteye gitmiştir. Beklentideki bu artışa neden olan faktörler, hem işlenebilecek veri sayısındaki artış hem de kullanılan algoritmaların gelişmesidir. Artık görsel işleme teknikleri ile kanserli hücre tanısı yapmak veya askeri sahalarda kullanılacak sensörler geliştirmek gibi hayati önem taşıyan sahalarda çalışabiliyoruz.

Görüntü işlemedeki bu ileri teknoloji, başta makine öğrenmesi olmak üzere, derin öğrenme ve yapay sinir ağları gibi yan başlıkların kullanımıyla mümkün olmaktadır.

Yüz tanıma teknolojileri, sürücüsüz araçlar veya Google’ın kamera ile çeviri modu makine öğrenmesi tabanlı görüntü işleme sistemlerinin en basit örnekleri arasında. Google Translateçeviri uygulamasındaki görüntü işleme sistemini makine öğrenmesi ve yapay sinir ağları algoritmalarıyla oluşturuyor. Google Translate’in kamera ile çeviri modu, herhangi bir dilin harflerinin görüntü işleme ve makine öğrenimi ile veri tabanına kaydedilmesini sağlar. Kamera ile sözcüğü taradığımızda sistem veri tabanında kayıtlı harfleri birleştirerek kelimeleri ortaya çıkarır. Kelime ya da cümlenin ortaya çıkmasından sonra klasik Google Translate uygulamasında olduğu gibi kendi dil işleme algoritmasıyla kelimeleri çevirir. Bu modun çalışabilmesi için önemli olan nokta kamerayla okuttuğunuz kelimelerin sistem tarafından tanınmasıdır ki bu da makine öğrenmesi sayesinde olur.

Yapay zeka, görüntü işlemede ileri teknoloji sağlamanın yanında işleme süresini de kısaltıyor. Askeri alanda kullanılan elektro-optik sensör sistemleri uzun yıllardan beri hareketli veya sabit hedeflerin belirlenmesinde kullanılıyordu. Günümüzde ise bu sistemler yapay zeka ile güçlendirilerek hem daha hızlı hem de daha kesin hedef tespiti yapmayı sağlıyor.

Görüntü İşleme Teknikleri

Son dönemlerde klasik görüntü işleme yöntemlerini destekleyecek veya tamamen yeni algoritmalar üzerinden yürüyecek yeni geliştirici teknikler oluşturulmuştur. Tekniklerin çoğu insansız uzay araçları, uzay sondaları ve askeri keşif uçuşlarından elde edilen görüntüleri geliştirmek amacıyla üretilmiştir. Ancak yaşanan gelişmeler görüntü işlemenin kullanıldığı her alanda etkisini göstermiştir.

Dijital bir görüntü, bilgisayar dilinde sınırlı sayıda bit tarafından temsil edilen bir dizi gerçek sayıdan ibarettir. Dijital görüntü işleme yöntemlerinin temel avantajı; çok yönlü tarama kabiliyeti, tekrarlanabilirliği ve orijinal veri hassasiyetinin korunmasıdır. Başlıca görüntü işleme teknikleri; görüntü önişleme, görüntü geliştirme, görüntü ayırma, özellik çıkartma ve görüntü sınıflandırılmasıdır.

Görüntü Önişleme ve Geliştirme

Uydulardan veya dijital kameralardan elde edilen görüntüler, görüntü yakalarken görüntüleme alt sistemlerinin ve aydınlatma koşullarının sınırlamaları nedeniyle kontrast ve parlaklık hataları yaratır, görüntüler farklı türde seslere sahip olabilir. Görüntü önişleme piksellerin geometrisi ve parlaklık değerleri ile ilgili hataların engellenmesini sağlar. Bu hatalar ampirik ya da teorik matematik modeller kullanılarak düzeltilir.

Görüntü geliştirme ise, görselin görünümünü iyileştirerek görüntünün insan veya makine yorumu için daha uygun forma dönüştürülmesini sağlar veya sonraki analizler için belirli görüntü özelliklerini vurgular. Görsel geliştirme temel olarak piksel parlaklık değerleri üzerindeki oynamalarla sağlanır. Kontrast ve kenar geliştirme, sözde renklendirme, gürültü filtreleme, keskinleştirme ve büyütme uygulamalara örnektir.

Geliştirme süreci verilerdeki içsel bilgi içeriğini arttırmaz. Sadece belirli görüntü özelliklerini vurgular. Geliştirme algoritmaları genellikle sonraki görüntü işleme adımları için bir hazırlık niteliğindedir ve uygulama ile doğrudan bağıntılıdır.

Görüntü Bölütleme

Görüntü bölütleme görüntüyü kendini oluşturan bileşenlere ve nesnelere ayırma işlemidir. Uygulama konusuna göre görüntü bölütleme işleminin ne zaman durdurulacağı belirlenir. Aranan nesne veya bileşen görüntüden elde edildiği anda bölütleme işlemi durdurulur. Örneğin, havadan hedef tespitinde ilk olarak yol ve araçlar bütünü olan fotoğraf, yol ve araç olarak ayrılır. Her bir araç ve yol tek başına bu görüntünün bölünmüş parçalarını oluşturur. Hedef kriterlerine göre uygun olan alt resme ulaşıldığında görüntü bölütleme işlemi durdurulur.

Görüntü bölütleme için görüntü eşiği oluşturma yöntemleri kullanılır. Bu sınırlama yöntemlerinde nesne pikselleri bir gri seviyesine arka plan ise farklı piksellere ayarlanır. Genellikle nesne pikselleri siyah ve arka plan beyazdır. Piksel farkından kaynaklanan bu ikili görüntüler gri ölçeğe göre değerlendirilerek görüntü ayrımı yapılır.

S (x, y), bölümlere ayrılmış görüntünün değeridir, g (x, y) pikselin gri seviyesidir ve T (x, y), koordinatlardaki eşik değeridir. En basit durumda T (x, y) koordinattan bağımsız ve tüm görüntü için bir sabittir.

Görüntülerin bölütlendirilmesi, yalnızca nesneler ve arka plan arasındaki ayrımı değil, aynı zamanda farklı bölgeler arasındaki ayrımı da içerir. Böyle bir ayrım için geliştirilen yöntem, havza segmentasyonu olarak bilinir.

Özellik Çıkartma

Özellik çıkartma, görüntü bölütlemenin bir üst versiyonu olarak düşünülebilir. Bu kez amaç sadece nesneleri arka plandan ayırmak değil; nesnenin boyutu, şekli, kompozisyonu, konumu gibi özelliklere göre nesneyi tanımlamaktır. Matematiksel ifadeyle, sınıf içi örüntü değişkenliğini en aza indirirken sınıf örüntüsünün değişkenliğini arttırmak için ham veri bilgisinden çıkarım yapma işlemidir. Bu sayede nesnenin kantitatif özellik ölçümleri, sınıflandırılması ve tanımlanması kolaylaşır. Tanıma sisteminin verimliliği üzerinde gözlemlenebilir bir etkiye sahip olduğu için özellik çıkarma safhası görsel işleme proseslerinde önemli bir basamaktır.

Görüntü Sınıflandırma

Sınıflandırma en sık kullanılan bilgi çıkarma yöntemlerinden biridir. En basit haliyle bir piksel ya da piksel grubunun gri değerine bağlı olarak etiketlenmesidir. Etiketleme sırasında bir nesnenin çoklu özellikleri kullanır ve bunun için veri tabanında aynı nesneye ait birçok görüntünün olması sınıflandırma işlemini kolaylaştırır. Uzaktan algılama teknolojisini kullanan araçlarda bilgi çıkarım tekniklerinin çoğu görüntülerin spektral yansıma özelliklerini analiz eder. Spektral analizler özelleştirilmiş bazı algoritmalar tarafından yapılır ve genel olarak, denetimli ve denetimsiz multispektral sınıflandırma olmak üzere iki farklı sistemle yapılır.

Dijital Görüntü İşlemede Yapay Zeka Desteği

Tüm bu yöntemler görüntü işlemenin temel prensibini oluşturan aynı zamanda görüntü işleme tanımını yapmamıza yardımcı olan yöntemlerdir. Teknolojik sahada görüntü işlemenin yaygınlaşması ve görüntü işleme uygulamalarındaki beklenti artışı yapay zekanın görüntü işleme prosesine girmesini zorunlu hale getirmiştir.

Kanser Tedavisi Planı Oluşturma

Prenses Margaret Kanser Merkezi son birkaç yıldır radyasyon tedavisi süreçlerini otomatikleştirmek için yapay zeka teknolojileri geliştiriyor. Merkezdeki araştırmacılar her bir hastaya özelleştirilmiş bireysel radyoterapi tedavi planı geliştirebilmek için yapay zeka ve görüntü işlemenin birleştirildiği bir teknoloji ürettiler.

AutoPlanning, makine öğrenimi ve görüntü işleme tekniklerini kullanarak hastalar arasında kantitatif ilişki kurar. Her bir hastanın hastalık bilgileri, tanı ve tedavi detaylarıyla ilişkilendirilmiş görsel veriler temel alınarak uygun tedavi planı oluşturulur. Radyasyon tedavisinin şeklini ve yoğunluğunu hastanın görüntüleriyle ilgili olarak modellemeyi öğrenir. Böylece, planlama süreleri saatlerden dakikalara düşürür. Özellikle, planlama aşamasında yaşanan problemlere en uygun çözümleri üretmek için binlerce yüksek kaliteli plandan oluşan bir veri tabanı kullanır.

Cilt Kanseri Tanısı

Standford Yapay Zeka Laboratuvarı bilgisayar bilimcileri, derin öğrenme ile görüntü işlemeyi bir araya getirerek cilt kanseri teşhisi yapabilen bir algoritma oluşturdular. Bu algoritma yaklaşık 130.000 cilt hastalığı görüntüsü içeren bir veri tabanı üzerinden potansiyel kanseri yüksek bir doğruluk payıyla görsel olarak teşhis edebiliyor.

Algoritma, her bir görüntü ile ilişkili ham pikseller olarak beslenir. Sınıflandırmadan önce görüntülerin çok az işlenmesini gerektirdiğinden bu yöntem klasik eğitim algoritmalarından daha kullanışlıdır. Derin öğrenmenin algoritmaya en büyük katkısı, programlanmış cevapları mevcut duruma uydurmaktan ziyade bir problemi çözmek için eğitilebilmesidir.

Neurala ile “Botlar için beyinler”

Neurala, ‘botlar için beyinler’ sloganıyla ev robotlarından sürücüsüz araçlara ve hatta oyuncaklara kadar farklı cihazlarda görsel bir beyin inşa etmeyi vaat ediyor. Neurala TagMe ve Neurala Brain adıyla karşımıza çıkan iki farklı araç üzerinden işiniz için önemli olan kavramları ve nesneleri algoritmaya öğretebiliyorsunuz.

TagMe aracından nesne ve kavramların tanımlanması manuel olarak örnekler üzerinden yapılıyor. Algoritma ona öğretilen veri tabanıyla gerekli olan nesne veya kavramları hızlı bir şekilde belirleyebiliyor. Neurala BrainNet ise sadece öğretilen nesneleri ve kavramları tanımakla kalmaz, daha önce hiç görülmemiş benzer nesneleri tanımlamak için bu bilgiden yola çıkar.

Pazarlama Sektöründe Görüntü Tanıma Teknolojileri

Catchoom sitesindeki bilgilere göre; alışveriş yapanların %83’ü mağazadayken cep telefonlarını kullanırken; %62’si ürünleri taratarak ilgili yorumlara ve ürün bilgilerine ulaşmak istiyor. Görüntü tanıma teknolojileri müşterinin ürünle ilgili yeterli bilgiye ulaşmasını sağlayarak, üstelik bunu çok kısa bir süre içerisinde yaparak, müşteri beklentilerinin büyük ölçüde karşılıyor.

Catchoom, görüntü tanıma teknolojileri ile pazarlama deneyimini değiştiren uygulamalar üreten öncü firmalar arasında. Bu uygulamalar gerek internet alışverişlerinde gerekse mağaza içi deneyimlerde kullanılabilir. Kullanıcıların mağazalarda buldukları ürünlerde ürün tanıtımlarını etkinleştiren uygulamalarda, kullanıcıların reklamlarda ve dergilerde gördükleri öğeleri doğrudan satın alması da mümkün.

Müşterilerin tarattığı ürünle ilişkili ürünleri saniyeler içerisinde veri tabanı eşleşmesinden bulunabiliyor. Manuel aramalara göre en büyük avantajı ürün tanıma ile incelenen ürünün özelliklerinin eksiksiz bir biçimde sistem tarafından tanınabiliyor olmasıdır. Müşterilerin %73’ü aradıkları ürünü 2 dakika içerisinde bulamazlarsa siteden çıkıyor. Hızlı ve doğru ürünün görüntü tanıma ile saniyeler içerisinde müşteriye sunulması müşteri deneyimlerini geliştirerek satış oranlarının arttırılmasında da kilit rol oynar.

Yapay Zeka Destekli Görüntü İşleme Teknolojilerinin Geleceği

Teknolojiye dayalı olarak; dijital görüntü işleme, yüz tanıma, nesne tanıma, desen tanıma, kod tanıma ve optik karakter tanıma araçlarının pazarı ve gelişimi büyümeye devam edecek. Görüntü tanıma pazarı araştırma raporuna göre; görüntü tanıma pazarının 2016 yılındaki 15,95 milyar dolardan 2021 yılında 38,92 milyar dolara çıkacağı tahmin edilmektedir. Kod tanıma teknolojisi segmentinin, 2016 ve 2021 arasında görüntü tanıma pazarına öncülük etmesi bekleniyor.

Kaynak: medium.com/türkiye