Röportaj: Prof. Dr. Mehmet Şahin İle Çeviri Teknolojileri Üzerine – 2

Prof. Dr. Mehmet Şahin ile Temmuz 2022 tarihinde yapmış olduğumuz röportaj içeriğidir:

Mehmet Şahin: Sonuç olarak bundan kaçamayız. Böyle bir teknoloji var, sürekli ilerliyor ve genç çevirmenlerin sektörde bu teknolojiyi kullanması beklenecek. Öğrenci bir çeviri şirketine girdiğinde, “Hayır, ben çeviri belleği kullanmadan, makine çevirisi kullanmadan çevirmek istiyorum, beni engellemeyin.” diyemeyecek. Bu açıdan sektörde böyle bir gereklilik söz konusu. Serbest çalışan çevirmenler de maalesef hayat telaşı ve hayatını kazanma motivasyonuyla daha kısa zamanda daha çok iş çıkarabilmek için bu araçları kullanmak zorunda kalacak. Her koşulda bir baskı var, bunun önüne geçemeyiz. Bizim bundan en zarar almadan ya da çevirinin kalitesine halel getirmeksizin nasıl çıkabileceğimizin yollarını aramamız lazım. Bu sebeple de çeviri bölümlerinde sadece programlara yönelik teknik eğitimin dışında etik, tarihsel, sosyolojik, emeğe dair etkilerini de tartışmamız gerekiyor. Yani sadece sertifika verilen bir yazılım programının öğretildiği bir ders olmamalı bu çeviri dersleri. Öğrenciler bu konuları tartışarak zaman içerisinde her şeyin bilincinde olursa mezun olduklarında ve ileride sektörde yanlış giden şeylerin olması durumunda bunları düzeltmek için bir aracı olabilirler. Akademi ve sektör arasında bir köprü olabilirler.

Yiğit Çakır: Yanıtınız için çok teşekkür ediyorum ve sizin araştırmalarınıza dair bir soruyla devam etmek istiyorum. Araştırmanızın edebiyat alanında makine çevirisini test etmek üzerine olduğunu hatırlıyorum. Ayrıca, okuduğum kaynaklara göre makineyi en çok hangi konulardaki verilerle beslersek, makine de o alanlarda gelişme gösterecektir deniyor. Örneğin çeviri motoruna 20 adet kira sözleşmesi ilettiğimizde, makine çevirisinin kira sözleşmelerinde uzmanlık kazanabileceğini söylemek doğru olur mu?

Mehmet Şahin: Makine çevirisi dediğimizde herkesin bahsettiği Google, Link, Yandex, DeepL gibi sistemler tabii ki milyonlarca dil verisi tarafından besleniyor. Eşleştirilmiş cümleler var. Bir de isteğe göre uyarlanmış, “domain adapted, customized makine çevirisi” sistemleri var. Belirttiğiniz gibi finans çevirisi yapan bir şirketse, finans metinleri; hukuk çevirisi yapan bir şirketse, hukuk metinlerini; tıpsa tıp metinlerini eşleştirerek, paralel metin kullanarak makine çevirisi sistemini eğitebilirsiniz. Biz bunu şu anki projemizde de gözlemliyoruz, makine çevirisi özelliğini kullanmak istiyorsanız veri hacminin çok yüksek olması gerekiyor.

Bugün Google gibi şirketlerin başarısının arkasında bu veriye olan erişimleri ve onları işleyebilme kapasiteleri yatıyor. Örneğin makine çevirisi şirketlerinin kendi temel dil modelleri var. Türkçe-İngilizce genel olarak dile dair belki beş milyon cümleden oluşan bir bütünceyle (corpusla) eğitilmiş bir makine çevirisi sistemleri bulunuyor. Siz kendi verilerinizi getirip “fine tuning” (ince ayar) yaparak o dil modelini biraz daha kendi amaçlarınız doğrultusunda özelleştiriyorsunuz. Tabii veri hacmi arttıkça, siz ona yeni metinler ekledikçe makine çevirisinin size  sunacağı sonuçlar iyileşiyor. Bir de çeviri belleği olarak bakacak olursak orada belki milyonlarca cümleye gerek kalmayabilir. Siz on yıldır aynı türde metinler çeviren bir çeviri şirketiyseniz, bütün çevirilerinizi iyi bir şekilde koruyup sisteme yüklediyseniz ve bu veriler güvenilir çevirmenler tarafından oluşturulduysa, TMX dosyaları veritabanınızda olduğu sürece yeni gelen çevirmenler bir metni yüklediğinde belki de o metnin %40’nın %60’ının veritabanında zaten eşleşmelerle önüne çıkacağını görecektir. Buna ek olarak, özel eğitilmiş bir makine çevirisi olduğunu düşünün. Artık çevirmenin yapacağı iş insan çevirmen olarak daha da az hale gelecektir. Bu da ücretlendirmeye yansıyacaktır. Bu konuda çeviri belleği programlarında ya da çeviri yönetimi programlarında ayarlar vardır. 

Örneğin, çeviri belleğinde %90 oranında eşleşme varsa, 1 lira değil de 0,20. Tl, %80 ise 0,30 TL ücretlendirilme yapılması gibi bir durum söz konusu olabilir. Bu eşleşmeler otomatik olarak hesaplanıyor ve çıkardığınız son metin ürünü 10 bin kelime dahi olsa size bin kelimelik bir ücret kadar verilebilir. Bunu hesaplayan programlar var. Ayrıca, insanların metne tam angaje olamaması, çok uzun metinlerin farklı çevirmenleri olması, kullanılan sistemler tarafından çeviri metninin parça parça bölünerek tayin edilmesi gibi durumlar da çevirmenin metinle olan ilişkisini etkileyen faktörler arasında. Bu konuyu ele alan çalışmalar da var. “Ben kendimi bir makinenin somunu gibi hissediyorum.“ diyen çevirmenler mevcut. Bir metni çevirerek bir şeyi, bir işi başardığını hissetmiyor; sanki fabrikada somun sıkan, vasıfsız bir işçi gibi hisseden bir topluluk da var. Yani bu geçiş sürecinde -geçiş sürecinden kastım, her şeyin giderek otomatikleştikleştiği günümüzde- ve otomasyonun arttığı bir sektörde bu tür sorunlar yaşanacak. Yeni ücretlendirme biçimlerine, psikolojik ve sosyolojik yönlere dair sorunlar ortaya çıkacaktır.

Yiğit Çakır: Evet hocam, otomasyonun giderek artmasıyla gelecekte bizi bahsettiğiniz sorunların beklemesi muhtemel. Peki, çevirmen makine çevirisi eşleşmeleri sebebiyle aldığı düşük ücret açığını, kazandığı hız sayesinde kapatamaz mı?

Mehmet Şahin: O araçları kullanarak çok daha az zamanda çok daha fazla metin üretmek mümkün. Bu da tabii ücretlendirmeyi de olumlu etkileyebilir. Ancak, makas giderek daralacak gibi geliyor bana. Belki 5 yıl sonra ne kadar çok çalışsanız da artık faydası olmayacak gibi. Bu tabii zamanla yaşayıp göreceğimiz bir şey. Bugün ya da yarın “Sabah uyandım, işşiz kaldım.“ demeyecek kimse. Tarih boyunca farklı meslek gruplarında bu tür şeyler yaşanmıştır.

Yiğit Çakır: Matbaanın çıkması, hattatların matbaa kullanmayı öğrenmeleri ya da adaptasyon sağlamaları gibi…

Mehmet Şahin: Evet gibi. Zamanla adaptasyon sağlanacak. Belki istihdamlar da ona göre yapılacak. Belki Çeviribilimi, Mütercim ve Tercümanlık bölümlerinin sayısı ve müfredatı değişecek. Farklı becerilerin de dahil edildiği daha hibrit programlar ortaya çıkacabilecek. Çünkü artık insanlar yavaş yavaş programlama, kodlama, yazılım, bilgisayarlı hesaplamalı dil bilim dedikleri “computational linguistics” gibi alanlara da yöneliyor. Bunu yaşayarak göreceğiz. Şimdiden bir tahminde bulunmak zor. Ama şurası kesin: Büyük şirketler son hızla, bütün kaynaklarını kullanarak dil modelleme işlemlerine kafayı takmış durumdalar. Meta AI, Amazon, Google, Facebook, Microsoft ve bunlara eklenebilecek pek çok şirket artık pastanın büyük payını götürüyorlar. Kullanıkları dil kaynakları onlara sadece onlara çeviri teknolojilerini geliştirmeleri alanında değil, daha farklı imkanlar da sunuyor. Bu, sadece buzdağının görünen parçası çünkü bu verileri ticari anlamda da kullanılabilecek araçları var. Örneğin, şimdilerde özellikle ses tanıma teknolojisi de çok revaçta. Bu projelerin hepsi onlara kâr getirecek şeyler. Gösterilen bu teknolojik gelişmeler, artık bu şirketlerin karşısında kimsenin duramayacağı gerçeği  sebebiyle hem riskli hem de biraz ürkütücü. Mesela bizim Türkiye olarak bir makine çevirisi sistemimiz yok. Bugün bize erişimi kapatsalar, ne olur? Sonuçta bunlar yaşanan şeyler. Bundan 100 yıl önce, 1922 yılında böyle bir çeviri programının olacağı söylense kimse inanmazdı. Gerçi 1930’larda elektronik sözlüklere benzeyen, makine çevirisi araçlarının temelleri olan ürünler geliştiriliyor. Örneğin, Troyanskii ve Artsrouni’nin 1933’te patent aldıkları ürünler var. Onlar aslında ilkel makine çevirisi olarak da sayılmakta. Yani bundan yüz yıl sonra neler olabileceğini kesin olarak tahmin etmemiz imkansız. Bununla ilgili tabii yazılan fütüristik, tuhaf şeyler var. Mesela Douglas Robinson’ın daha 1999’da yazdığı çeviriyle ilgili bilimkurgu türünde yazıları var. Dolayısıyla hazırlıklı olmalıyız ve bu tür teknolojilerin eğitime, topluma, dile etkilerini tartışmalıyız. Çünkü bu etkiler kaçınılmazlar.