Tekno Haber AKINSOFT 10 Kasım 2020 (0) (167)

Veri Bilimi

Her geçen gün popülerliği artarak iş alanları genişleyen ve veriden bilgi üretme yöntemleri diyebileceğimiz veri biliminin, şirketlerin ve devletlerin ilgi alanı içerisinde popülerliğini artırarak gelişmeye devam edeceği belirtiliyor.

Veri, sosyal ve ekonomik fayda sağlaması adına teknoloji ve bilimin yenilenmesi sürecinin temel unsurudur. İşlenmemiş, analiz edilmemiş ve ham şeklinde ifade edebileceğiz veri, analizi gerçekleştirilip işlenmesiyle bilgiye dönüşür. Veriler tek başına bir anlam ifade etmemektedir ki ancak bilgiye dönüştürüldüğünde anlamlı halde gelir. Dolayısıyla bir verinin tek başına bir anlamı veya işlevi yoktur. Özellikle son dönemlerde veri bilimi kavramı ile sıkça karşılaşılmasının temel sebebi teknolojinin büyük bir hızla gelişmiş olmasıdır.

Nedir?

Günümüzde en popüler alanların başında gelen veri bilimi, gelişen teknolojide işletmelerin kusursuz kararlar alması ve bilgiyi faydalı hale getirerek toplum yararına dönüştürmesi için kullanabileceği öngörüleri üretir. Karmaşık sorunları çözüme ulaştırmak adına elde bulunan verileri bir değer oluşturacak bilgiye dönüştürmeyi amaçlayan veri bilimi, değer elde etmek üzere bilimsel yöntemler, çeşitli algoritmalar ve farklı sistemler kullanan disiplinler arası bir alandır. Matematik, istatistik bilimi, programlama gibi çeşitli alanlardan yararlanılarak verilerden anlamlı bilgiler çıkarılır. Bu doğrultuda veri bilimi kısaca verilerden anlamlı bilgiler çıkarmak olarak tanımlanabilir.

Veri bilimi, kurumların daha iyi kararlar almak, daha inovatif ürün ve hizmetler oluşturmak üzere yararlanabileceği öngörüler üretir ve trendleri ortaya çıkarır. Veri, inovasyonun temel taşıdır fakat değeri, veri bilimcinin verileri işleyerek elde edeceği bilgilerden ve bu doğrultuda kullanacağı yöntemlerden gelir.

Veri bilimci veya uzmanı ise elindeki veriyi matematik, istatistik, bilgisayar bilimi gibi pek çok araç aracılığıyla betimleyerek çıkarımlar yapabilen, öngörüsel ve önleyici modellemeler yapabilen kişiler olarak tanımlanabilir. Veri bilimciler başta web portalları, dijital uygulamalar, akıllı telefonlar, müşteriler olmak üzere diğer birçok kaynaktan elde edilen verileri analiz etmek üzere istatistik, alan uzmanlığı ve bilgisayar bilimi dahil olmak üzere bir dizi beceriyi bir araya getirir. Profesyonel bir veri bilimci matematik, istatistik, makine öğrenmesi, programlama, büyük veri ve açık kaynak yazılımlar konusunda donanımlı ve ayrıca meraklı, ilgili, doğru soru sorabilen, iletişim kabiliyeti yüksek, analitik bakış açısı ve problem çözme yeteneği güçlü olmalıdır.

Veri uzmanlarının görevleri arasında verileri analiz etmek için strateji geliştirme, verileri keşfetme, analiz etme ve görselleştirme, Python ve R gibi programlama dillerini kullanarak modeller oluşturma ve bu modelleri uygulama yazılımlarına dağıtma yer alır. En verimli ve etkili veri bilimi çalışması ekipler halinde yapılır ki veri uzmanlarının tek başına çalışması çok uygulanabilir değildir. Bu ekip çok farklı uzmanlık alanlarının temsilcilerinden oluşabilir. Öyle ki veri uzmanının yanı sıra iş analisti, veri mühendisi, BT mimarı ve yazılım geliştiricisi bu ekip içerisinde yer alabilir.

İstatistiksel analiz ve veri madenciliği alanlarından hareketle ortaya çıkan veri bilimi bir uzmanlık alanı, bir disiplin olarak çok yeni bir kavram. İlk kez 2002 yılında International Council for Science tarafından Data Science Journal’da yayınlandı. 2008 yılına gelindiğinde veri uzmanı kavramı ortaya çıktı ve kısa sürede alan üzerinde hızlı ilerlemeler sağlandı. İlerleyen süreçte özellikle üniversitelerde veri bilimi eğitimleri sunulmaya başlansa da bugün hala yeterince veri uzmanı bulunamıyor.

Modern teknoloji hızla daha fazla miktarda bilginin oluşturulabilmesini ve depolanabilmesini mümkün kıldığından veri hacminde yüksek oranda bir artış söz konusu. Öyle ki dünyada mevcut bulunan verilerin yüzde 90’ının son iki yılda oluşturulduğu değerlendiriliyor. Örneğin, sosyal platformların başında gelen Facebook’a insanlar her saat 10 milyondan fazla fotoğraf yüklüyor. Dünya genelinde bağlantı halindeki cihazların sayısının, 2025 yılına kadar 75 milyardan fazla büyüyeceği tahmin ediliyor. Bu teknolojilerin topladığı ve depoladığı verilerin zenginliği, dünya genelinde organizasyonların ve toplumların dönüşüme yönelik avantajlardan yararlanmasını sağlayabilir. Günümüz dünyasında sistemlere yüklenen veri hacimlerindeki artış devam ettikçe veri bilimi de her geçen gün önem kazanacaktır.

Veri Bilimci, bir programcıdan çok istatistik bilen, bir istatistikçiden çok programlama bilen kişidir.

Uygulamada Zorluklar

Veri bilimine yatırım yapmış olan şirketlerin birçoğu veri biliminden yeterli şekilde yararlanamıyor. Kimi işletmeler ise farklı nedenlerle uygulamada zorluklarla karşı karşıya kalabiliyor. Bazı şirketler ilgili uzmanları işe alma ve veri bilimi programları oluşturma konusunda bir yarış içerisinde ama birlikte etkin çalışmayan ve farklı yöntemleri kullanan çalışanlarla iş süreçlerinde aksaklıklar ve olumsuzluklar yaşıyorlar. Bu sebeplerle kurum yöneticileri, disiplinli bir sistem yönetimi oluşturmadan bu alana yönelik yatırımlarından bekledikleri şekilde verim alamayabilir ki bu durum farklı sorunları da beraberinde getirebilir. Bir diğer konu da BT yöneticilerinin erişim izni verme sürelerinin uzaması. Veri bilimcilere gerçekleştireceği çalışmalar için BT yöneticilerinin verilere erişim izni vermesi gerekli. Ancak bu izin çok uzun süreler alabiliyor ve bu durum veri bilimcilerin çalışmalarına engel teşkil edebiliyor. Ayrıca veri bilimciler ilgili verilere erişim sağladıktan sonra birbirinden farklı araçlar kullanarak analiz gerçekleştirebiliyor. Örneğin, bir uzman R dilini kullanarak model geliştirebilir ancak modelin kullanılacağı uygulama yazılımı farklı bir dilde yazılmış olabilir. Diğer bir sorun ise BT yöneticilerinin destek taleplerine çok fazla zaman ayırıyor olması. Açık kaynak araçların artmasına bağlı olarak BT’nin destek vermesi gereken araçlar da artıyor. Örneğin pazarlama biriminde görevli bir veri uzmanı, finans birimindeki bir veri uzmanından farklı araç ve yöntemler kullanabilir. Bu durum BT yöneticilerinin sürekli ortam yenilemesi ya da güncellemesi demek. Bu tür sorunların dışında belki de en önemli konu yöneticilerin veri bilimi kavramına uzak olmaları. Veri bilimi iş süreçleri çoğu zaman karar alma sürecine ve kullanılan sistemlere entegre edilemez. Dolayısıyla yönetici konumunda olanların veri bilimcilerle bilgi temelinde bir iş birliği kurması zorlaşır. Bu durum süreci anlamakta ve yönetmekte güçlük yaşayan yöneticilerin veri bilim alanına ve projelerine olumsuz yaklaşım göstermelerine sebep oluyor.

Veri Bilimi Platformu

Veri bilimciler çalışmalarında birçok araç türünü kullanır fakat genellikle web uygulama yazılımları olan açık kaynak defterlerini tercih ederler. Jupyter, RStudio ve Zepplin en yaygın defterler arasında yer alır. Defterler analiz çalışmalarında oldukça verimli ve kullanışlıdır ama veri bilimcilerin ekip halinde çalışması gereken durumlarda bazı sınırlamalar oluşur. Bu sınırlamaların aşılması için veri bilimi platformları oluşturuldu. Öyle ki birçok şirket platformlar olmadan çalışmaların yetersiz, güvenilirlikten uzak ve ölçeklendirilmesinin bir hayli zor olduğunun farkına vardı. Bu bilinç, tüm veri bilimi çalışmalarının temelinde yer alan ve yazılım merkezleri olan veri bilimi platformlarının ortaya çıkmasını sağladı. Platform, ekiplerin kodu, sonuçları ve raporları paylaşmasına imkan tanıyor, yönetim sürecini basitleştiriyor, açık kaynak araçlarını ve altyapısını kullanarak iş süreçlerinde karşılaşılan olumsuzlukları ortadan kaldırıyor. Örneğin, bir platform veri uzmanlarının modelleri API’ler halinde dağıtmasını sağlayarak farklı uygulama yazılımlarına entegre edilmelerini kolaylaştırabilir. Veri bilimciler böylelikle BT yöneticilerini bekleyerek zaman kaybetmeden araçlara, verilere ve altyapıya ulaşabilir.

Benzer Yazılar