ANKARA (AA) - Türkiye Açık Kaynak Platformu, "Türkçe Doğal Dil İşleme Projesi" kapsamında Türkçe Doğal Dil İşleme Veri Kütüphanesi ile makine öğrenme ve doğal dil işleme için model ve yazılımları karşılaştırma olanağı sunan bir platform olan "Mukayese" uygulamasını hayata geçirdi.
Sanayi ve Teknoloji Bakanlığından yapılan açıklamaya göre, Türkçe Doğal Dil İşleme Veri Kütüphanesi ve Mukayese Platformu uygulaması 21 Nisan'da Türkiye Açık Kaynak Platformu'nun YouTube sayfasında düzenlenen çevrim içi etkinlikle yazılım dünyasına tanıtıldı. Üç ayrı oturumun yer aldığı etkinlik Bakan Yardımcısı Mehmet Fatih Kacır'ın açılış konuşması ile başladı.
Kacır, konuşmasında Platform bünyesinde başlatılan ilk proje olan Türkçe Doğal Dil İşleme Projesi ile Türkçe metinlerin işlenmesi için gerekli kullanıcı dostu ve yüksek performanslı kütüphanelerin, veri kümelerinin hazırlanması, dağıtım altyapısının kurulması, verilerin ve araçların sağlanmasının amaçlandığını bildirdi.
Projenin birçok sektörün temel ihtiyacını karşılayacak niteliğe sahip olduğunu vurgulayan Kacır, "Biz burada Türkçe dil deposunu herkesin kullanımına açıyoruz. Açık kaynak yazılımların dokümantasyonunu yapıp, herkesin hızla kullanabileceği hale getiriyoruz." ifadelerini kullandı.
Kacır, "Mukayese" uygulamasının önemine işaret ederek, dünya genelinde Türkçe Doğal Dil İşleme araştırmacıları için bir referans platformu amaçladıklarını ve gelecek dönemde bu projeleri artırmayı hedeflediklerini belirtti.
Konuşmasında Türkiye Açık Kaynak Platformu bünyesinde yürütülen diğer çalışmalar hakkında da bilgi veren Kacır, Dijital Rozet Projesi, Kubernetes Orkestrasyonu Sistemi (KOS) Projesi, 42 Yazılım Okulları gibi faaliyetleri anlattı.
- Proje hakkında
Türkiye Açık Kaynak Platformu'nun temel projelerinden biri olan Türkçe Doğal Dil İşleme Projesi, Türkçe metinlerin işlenmesi için ihtiyaç duyulan veri kümelerinin hazırlanması, bu veri kümelerinin dağıtım altyapısının oluşturulması, yüksek performanslı kütüphanelerin oluşturulması, bu kütüphanelere dayanan kullanıcı dostu ve çevrim içi araçların sunulmasını amaçlıyor.
Doğal dilin işleme doğası gereği hedef dile uygun olarak üretilen veri setleri kullanılarak yazılım üretilen bir alan olması nedeniyle, İngilizce veya diğer diller için geliştirilen kütüphaneler Türkçeye doğrudan uygulanamıyor, söz konusu diller için oluşturulmuş veri kümelerinden faydalanmak mümkün olmuyor.
Türkiye Açık Kaynak Platformu'nun başlıca projelerinden olan Türkçe Doğal Dil İşleme ve Türkçe Dil Deposu ile Türkiye'de hem akademik çalışmalara katkı sağlanması hem de son kullanıcılar tarafından kolaylıkla erişilebilecek ve kullanılabilecek veri ve araç kütüphaneler oluşturularak alana destek verilmesi hedefleniyor.
Türkçe Dil Deposu Projesi'nin akademik paydaşları arasında Sabancı, Koç, Boğaziçi, İTÜ ve Mersin üniversiteleri yer alıyor. Projenin kamu ve özel sektörden paydaşları arasında ise Cumhurbaşkanlığı Dijital Dönüşüm Ofisi, Türk Hava Yolları, Aselsan, TÜBİTAK BİLGEM, Havelsan, Garanti BBVA, Turkcell, Microsoft, Koç Sistem, OBSS, Kodiks, Profelis, Kariyer.net bulunuyor.
"Mukayese" ise, Türkçe Veri Deposu üzerinde çalışan Doğal Dil İşleme uzmanlarından oluşan bir ekip tarafından oluşturuldu. Yazım denetiminden doğal dil anlamaya kadar uzanan görevler için kapsamlı bir dizi kıyaslama aracı ve veri kümesi sağlayarak yapay zeka araştırmalarını tekrarlanabilir ve kolay erişilebilir hale getirmeyi amaçlayan Mukayese uygulaması dünya genelinde Türkçe Doğal Dil İşleme araştırmacıları için bir referans platformu oluşturmayı amaçlıyor.
Kaynak: