Machine Learning (Makine Öğrenmesi)
Makine öğrenmesi 1959 yıllarında temelleri atılmaya başlanmıştır.Arthur Samuel “Makine öğrenmesi:Bilgisayarlara kendi kendilerine öğrenme yeteneği sağlayan çalışma alanıdır.” sözü ile bu alan bir istihdam alanı olarak görülmeye başlanmıştır.Bu kadar eski bir bilgisayar dalıdır fakat günümüzde popülerliği yeni yeni artmıştır.Yine bu alanda çokça çalışmaları ve katkıları olan “Tom Mitchell (1988): Bir bilgisayar programı herhangi bir görevi yerine getirmeyi, bir performans ölçüsü kullanarak deneyimlerinden öğrenebilir” sözünüde sizinle paylaşmak isterim.
Tüm bu hikayerlerden sonra gerçek hayatta makine öğrenmesi siber güvenlikten tutunda web teknolojilerine kadar geniş bir iş dalıdır.Örnek verecek olursak bir desktop uygulaması içinde maillerinizin spam olup olmadığını anlamak için bu iş dalından faydalanılır.
Spam mailleri daha iyi bir şekilde kullanıcıya sunmak ve yönetmek için kullanıcının spam olarak işaretleyip işaretlediğiniz mailleri izleyen bir email programı düşünelim.Bu işlem için aşağıdaki adımlar takip edilir;
- Maillerin spam veya spam olmayan şeklinde kategorize edilmesi.
- Sizin mailleri spam veya spam değil olarak işaretlemenin izlenmesi
- Spam veya spam değil olarak doğru sınıflandırılan maillerin sayısı
Diğer Kullanım Alanları
Veri tabanı madenciliği diye çok popüler bir alt meslek dalı barındıran makine öğrenmesi bu alt alan bilişim teknolojilerin gelişmesiyle birlikte ve firmaların her şeyi loglaması ile başlamıştır.Örneğin internet tıklamaları,search textboxları medikal kayıtlar,biyoloji vs. tüm bu alanların bir yerde tutulması ve bunları hızlı sorgularla kullanıcıya anlaşılır bir analizden geçirilmesi gerekir.
Tam olarak programlanamayan yazılımlar;bu alanda son yıllarda oldukça önemli bir alt meslek dallarındandır.Örneğin otonom araçların sabit bir algoritmayla yazılmaması halinde bu alandaki teknik makine algoritmaları ile işlevsel hale gelir.Örnekleri çoğaltacak olursak doğal dil işleme,görüntü işleme,el yazısı tanıma sistemleri gibi bir çok uygulama bu alt meslek grubu içinde yer alabilir.
Makineler Nasıl Öğrenir ?
Öğrenme yöntemleri olarak bu yazımızda 3 gruba ayrılmış şekilde öğrenme algoritmalarından bahsedeceğiz fakat bunlar dışında birçok kategorize edilmiş algoritmalar bulunu.
Denetimli öğrenme (Supervised Learning)
Denetimli öğrenme ile ilgili algoritmaya hem veri verilir hemde o veriyi nasıl kullanıcağı belirtilir.Örneğin internet üzerinden sipariş edilen bir dolabın sadece tahta parçalarından gelmesi bu konunun veri özelliğidir içinden çıkan kağıt vasıtasıyla tahtaların birleştirilerek dolab yapılması ise denetimli öğrenmeye bir örnektir.
Denetimsiz öğrenme (Unsupervised Learning)
Bu modelde ise herhangi bir denetleyici unsuru yoktur.Bunun yerine model bilgileri keşfetmek için kendi başına çalışmasına izin verilir.Yine mobilya örneğinden gidecek olursak tahta parçaları girdi dolab çıktı olarak kabul edilmişti fakat burada böyle bir durum yok buradaki senaryoya bağlı olarak değişkenlik göstersede asıl amaç sınıflandırmaktadır.Siparis kutusundan çıkan tahtalar, bilgilendirme kağıdı,vidalar vs. kategorize edilme üzerine bu modele verilir.
Takviyeli Öğrenme (Reinforcement Learning)
Takviyeli öğrenmede ise denetimli ve denetimsiz modelden farklı olarak pekiştirmeli olarak model işlev görür.Burada ödül ve ceza temeli üzerine bir analiz söz konusudur.Asıl amacı çevreyle iletişime geçmek ve ödül almaktır.Aldığı ödüller doğrultusunda maksimum optimize edilmiş bir yol bulunur.Örneğin bir köpeğe eğitim verirken yatması gereken yer konusunda o amaca ulaşması durumunda köpeğe ödül verilmesi ve bu alışkanlığı kazandıktan sonra başka yerde yatamaması takviyeli öğrenmeye bir örnektir.
Sınıflandırma ve Regresyon
Bu kavramlar özellikle istatistik bilimin derinlerinde olmazsa olmaz kavramlardır.Buradanda makine öğrenmesi konusunun istatistik biliminde oldukça yararlandığının görebiliriz.Sınıflandırma ve regresyon bir veri kümesindeki verilerden tahmin üretme üzerine bir model oluşturmak için kullanılır.
Sınıflandırma;bir başlangıç değeri belirlenir ve bu değer üzerinden diğer verilerin sınıflandırılması üzerine çıkarılan şema işlemidir.Bu esnada bağımlı ve bağlımsız olmak üzere iki çeşit sınıflandırma mevcuttur.Başlangıç değerinin verildiği modellerde sınıflandırma bağımlı method üzerinde çalışır.Diğer durumdada bağımsız method üzerinde çalışır.
Regresyon;varsayılan veya bilinen bir çıktı değerine dayanan bir tahmin yöntemidir.Örneğin doların artış ve azalışını tahmin etmek için bu yöntemden yardım alabiliriz.Mesela 2018 yılında dolar 6.0 iken 2019 da 6.5 ve 2020 yılında 7.0 kur değerine sahip se 2021 yılındaki değeri tahmin etmek için bir regresyon grafiği oluşturabilir.
Sınıflandırma ağaçları ile regresyon ağaçları arasındaki ana fark bağımlı değişkendir.Sınıflandırmada bağımlı değişken bir optimizasyon değişkenidir fakat regresyon ise zorunludur.Öte yandan sınıflandırma ağaçlarında kategorik ve sırasız bağımlı değişkenler vardır.Regresyon ise sürekli değerler veya sıralı tam değerleri olan bağımlı değişkenlere sahiptir.