Röportaj: Prof. Dr. Mehmet Şahin İle Çeviri Teknolojileri Üzerine – 3

Prof. Dr. Mehmet Şahin ile Temmuz 2022 tarihinde yapmış olduğumuz röportaj içeriğidir:

Yiğit Çakır:  Konuyu detaylarıyla açıkladınız hocam, teşekkürler. Diğer bir sorum ise öğrencilerin bu teknojilere yaklaşımının nasıl olması gerektiğine yönelik olacak. Şahsen, doğal dil işleme yöntemlerine ilgi duydum ve çok araştırma yaptım. Ancak, kodlama bilgisinin gerekli olduğunu fark ettiğim an duraksadım. Kodlama becerilerini geliştirmek, işin boyutunu bir tık üste taşımak isteyen öğrenciler için kayda değer bir fayda sağlar mı?

Mehmet Şahin: Sağlar. Otomasyon giderek artıyor. Bahsettiğim gibi bunlar büyük şirketlerin çalışmaları, veri bilimi özellikle önemsenmesi gereken bir alan. Örneğin bizim programlarımıza öğrencilerin dil puan türüyle hazırlandığını görüyoruz. “Ben hiç matematik anlamam, beceremem.” algısı da artık değişmeye başladı. Fen puan türüyle dil bölümünü seçen öğrenciler dahi var, sonradan fikir değiştirenler oluyor. Dolayısıyla sadece dile bağlı kalmamak lazım. Bilgisayar becerilerinizi geliştirebilirsiniz. Sonuçta gençsiniz, bizden çok daha rahat ve hızlı öğrenebilirsiniz. Örneğin, Marc Prensky’e göre siz dijital ortama doğanlar (digital natives) olarak adlandırılıyorsunuz. Siz neredeyse makine çevirisiyle doğdunuz, Google 2009 yılında Türkçeye de makine çevirisini dahil etti. Şu anki öğrencilerimiz ilkokula bile başlamamış olabilirler o tarihte. Biz ise internetle 1995’te tanıştık, ben yanılmıyorsam 22 yaşında bilgisayar sahibi oldum. Yani kodlama, programlama, veri güvenliği, verileri işleme, dil modelleri oluşturma, morfolojik çözümleyiciler gibi konuları öğrenmek kesinlikle işe yarar. Ülkemizin de buna gerçekten ihtiyacı var. Özellikle bütünce temelli çeviri çalışmalarında dil analizi yapan “corpus analysis“ dedikleri bütünce araçlarını geliştirecek, hem Türkçeyi hem diğer yabancı dilleri hem de yapay dilleri çok iyi bilecek insanlara ihtiyacımız var. Yapay zeka ve veri bilimi aslında çok önemsememiz gereken alanlar. Tabii, çok iyi çevirmen olursanız yine işsiz kalmazsınız. Edebiyat, kültür, dil, vb. alanlardaki bilginizi sağlam tuttuktan sonra size iş mi yok? Ancak, Türkiye’deki Çeviribilimi ve Mütercim ve Tercümanlık bölümlerinden her yıl kaç öğrencinin mezun olduğunu hesaplamaya kalksak, bütün bu insanların çeviri alanında çalışmasının giderek zorlaşacağını söyleyebiliriz. Bu sebeple, bahsettiğim alanlara da ağırlık verilmesi gerekir bence. Bu becerilerin kazanılması öğrencileri çok iyi yerlere getirebilir.

Yiğit Çakır: Anladım, çok teşekkürler hocam. Ben de zaman zaman araştırdım fakat Java, Python gibi programlar karşıma çıkınca bizim alanımızla olan ilişiğini; programlama ve kodlama bilgisinin sahiden gerekli olup olmadığını biraz sorguladım.

Mehmet Şahin: Tabii elzem değil fakat 5-10 senesi için gerekli olacağını düşünüyorum.

Yiğit Çakır: Anladım hocam. Öğrenci bu konuyla ilgiliyse ve kariyer planlarına alternatifler eklemeyi diliyorsa kodlama bilgisi gerekli.

Mehmet Şahin: Aslında dile baktığımızda dilin kendisinin de bir kod olduğuğunu görüyoruz, biz çeviri yaparak bir nevi kod çözümlüyoruz. Zaten makine çevirisinin dile bakış açısı da bu. Dili bir kodlar zinciri olarak görüyor,“ Bu veriyi farklı bir kodla da ifade edebilirim.” diyor. Örneğin, Warren Weaver’ın 1949’da yayınlandığı Memorandum’da ya da Norbert Wiener’la yaptığı mektup yazışmasında dediği bu. “Bu bir kod, İngilizce okuyorum; bakacağım, Rusça okuyacağım.“ diyor. Bu sebeple, dil becerisi olan kişilerin bunları da yapabileceğine inanıyorum.

Yiğit Çakır: Anladım hocam. Yani, doğal dilin de zamanında tamamen yapay dil olarak değerlendirildiği de oldu demek. Peki, yakın bir geçmişe kadar istatistiksel makine çevirileri gündemde olduğunu, nöral ağlarla yapay zeka gelişmesiyle NMT dediğimiz sistemlerin ortaya çıktığını biliyoruz. Bu bir süre daha böyle mi gider sizce? Bunun bir sonraki adımı nedir? Sizin gözlemleriniz, araştırmanız ne yönde?

Mehmet Şahin: Evet, bu işte beni biraz aşan bir konu. İstatistiksel makine çevirisi tamamen terk edilmiş değil, bazı bağlamlarda hala kullanılıyor. Özellikle veri hacmi yüksek olan projelerde kullanımı yaygın.  Nöral makine çevirisi sistemi ilk kez 2016’da duyuruldu fakat 2012’lerden bu yana üzerinde çalışılıyor. Hatta geçmişinin daha eski olduğu ve insan beyninin sinirsel ağının model alındığı da söyleniyor. İstatiksel makine çevirisine oranla çok daha karmaşık düzeyde hesaplamaların yapılarak olasılıkların hesaplandığı ve daha akıcı metinlerin oluşturulabildiği bir model ve hala geliştiriliyor. Google ekibinin yaptığı çalışmaları incelerseniz, her hafta yeni çalışmalar yaptıklarını gözlemlersiniz. Genel olarak bu çalışmalar nöral paradigma üzerinden yapılıyor ve teknik olarak oldukça hızla ilerleniyor. Mesela GPU’lardan bahsediliyordu, şimdilerde ise TPU’lardan bahsediliyor. Bence özellikle önümüzdeki üç beş sene içerisinde bir sıçrama daha olur. Özellikle bu salgın döneminde müthiş boyutta veri toplandı. Milyarlarca insan tüm işlerini internet üzerinden yaptı ve bunların çoğu arka planda işleniyor. Örneğin, biz Zoom’u sahiden bedava mı kullandık? Bedava olan bir şey varsa eğer, Social Dilemma filminde nasıl nitelendiriliyordu? “Ürün olan sizsiniz.“ Dolayısıyla, hepimiz ürün olduk. Bunların değerlendirilip, işlenip ortaya yeni ve ilginç bir şeyin çıkacağını düşünüyorum.

Yiğit Çakır: Anladım, çok teşekkür ederim. Bugüne dek edebiyat çevirisiyle makine çevirisini zihnimizde hiç yan yana konumlandıramadık. Sabri Gürses ile birlikte yürüttüğünüz araştırmalarınız, bu iki birbiriyle ilişkilendiremediğimiz alanın entegre edilebileceğini gösteren ve aralarında nasıl bir ilişki olduğunu portreleyen bir çalışma oldu. Bu iki ayrı dalın birbirileriyle olan ilişkisi için neler söyleyebilirsiniz?

Mehmet Şahin: Biz, Sabri Bey’le bu konuda bayağı çalıştık. 2018’den beri işliyoruz. Dünyaya baktığımızda edebi makine çevirisi çok cesaret edilemeyen bir alan olmuş. Yani, teknik çeviride makine çevirisinin ne kadar iyi olduğunu zaten biliyoruz. Ancak, edebiyat hani hep o kırmızı çizgi dediğimiz bir olgu olmuş çevirmenler için. „Bu kesinlikle çevrilemez“ dendikçe makine çevirisi için çalışan kişilerin de ilgisini cezbediyor haliyle. Yani, neden olmasın? 2015’ten bu yana konuyla ilgili çalışmalar sürmekte. Bu noktada konu yeniden veri hacmine geliyor. Veri hacmi artıkça doğruluk, akıcılık artıyor. Edebi metinlerin diğer metin türlerinden çok farklı olması sebebiyle de Generic, Google, Bing gibi sistemler istenilen sonucu vermede yetersiz kalıyor. Dolayısıyla, bu alanda yapılan çalışmalara baktığımızda, daha çok istatiksel ve son zamanlarda nöral ve isteğe uyarlanmış yani alana göre uyarlanmış sistemler (domain addapted systems) karşımıza çıkıyor.

Bu da daha önceki dediğinize geliyor. Bir sistemi hangi tür metinle beslerseniz o tarzda sonuç alabilirsiniz. Bugün yapılan projelere baktığınızda binlerce kitap kullanılarak eğitilen sistemler var. Tabii ki hala istenen sonuç alınamıyor zaten. Yakın zamanda da aşılması zor ama makine içerisinin sınırları şu anda test ediliyor diyebiliriz. Aslında bu son projemizde de edebi çeviri gerçekten makine çevirisinin kırmızı çizgisi mi, edebi çeviride ne derece kullanılabilir gibi konuları test ediyoruz. Ayrıca  edebi metinler başlığı altındaki her metnin de aynı olmadığını göz önünde bulundurmamız gerekiyor. Çok yüzeysel bir metin de olabilir; çok zengin alışılmadık, James Joyce’un Ulysses’i gibi bir metin de olabilir. Ancak, bizim asıl amacımız bu tür araçların hem sınırlarını hem de olası etkilerini belirlemek. Çünkü bu araçlar piyasada kullanılmaya başlandığı anda edebi çeviri -kitap çevirisi- sektörünün de etkileneceğini ve değişime uğrayacağını tahmin edebiliriz. O sebeple buna dair de çıkarımlar yapmamız gerekiyor, çıkarımların yapılması için deneylerin yapılması gerekiyor. Örneğin son zamanlarda çıkan, kitap çevirisinde makine çevirisi kullanılması vakası var. Osman Akınhay, Milan Kundera’nın biyografisini önce makine çevirisiyle Fransızcadan İngilizceye, sonrasında da Türkçeye çevirdiğini duyurdu. Çeviri çıktısı Fransızca editörleri tarafından tabii ki test edilmiş, kontrol edilmiş. Bunun deneyimli bir edebi çevirmen tarafından yapılması sektördeki değişimin de bir işareti olabilir. Araştırmam için gerekli bir bilgi olduğu için hatırlıyorum. Bu eser biyografi niteliğinde olduğu için tam olarak edebi bir metin kategorisinde yer aldığını söyleyemeyebiliriz. Sonuç olarak bu durum, makine çevirisinin edebi çeviri alanında sahneye girişi olarak değerlendirilebilir.