Çoklu dillerdeki metinlerin tanınması


Çoklu dillerdeki metinlere ve belgelere, günümüzde eskiye göre çok daha sık rastlanmaktadır. Sürekli uluslararası yazışmalar yapıyor, yabancı dillerdeki farklı metinlerle ve belgelerle yoğun bir şekilde çalışıyoruz. Bir metnin aynı anda birkaç dilde yazılmış olması bile artık bizi şaşırtmıyor. Özellikle sektörel dergiler ve gazeteler, bilimsel kitaplar ve dergiler ya da dış ticarette kullandığımız hukuki belgeler sıklıkla iki veya daha fazla dilde hazırlanıyor…

FineReader 11 kullanırken, çoğu zaman söz konusu belgenin art arda farklı dillerde işlenmiş bir veya iki adet çok dilli belge olduğunu bile fark etmezsiniz; yazılım, varsayılan ayarlarıyla, tüm işi doğru bir şekilde halledecektir. Yine de, FineReader'da kullanılabilecek dil ayarlarının neler olduğunu ve hem en hızlı hem de en doğru sonucu almak için bunların nasıl kullanılabileceğini öğrenmekte fayda vardır.

En iyi sonucu almak için aşağıdaki önerileri uygulayın:

Kurulum sırasında FineReader, Windows dil ayarlarınızı denetler ve “Otomatik Seçim” listesinde yer alacak varsayılan tanıma dillerinin bir listesini oluşturur. Yine de, kurulum tamamlandıktan sonra bu listenin kullanmak istediğiniz dilleri içerip içermediğini kontrol etmeniz ve gerekiyorsa listede düzeltmeler yapmanız önerilir. Listeye çok fazla dil eklemeyin, gereksiz olanları (varsa) silin; aksi takdirde dönüştürme süresi uzayacak ve tanıma doğruluğu azalacaktır.



İpucu: “Otomatik Seç” listesini kontrol etmek için, “Araçlar”->”Seçenekler” menüsüne gidin ve Belge sekmesinde “Dilleri Düzenle” öğesine tıklayın. Listede değişiklik yapmak için, sağ taraftaki “Belirle” düğmesine tıklayın.


Henüz Otomatik Seçim listenizde bulunmayan farklı bir dilde yazılmış sadece bir veya birkaç metnin bulunduğu nispeten büyük bir belgeniz varsa, varsayılan “Belge Dili” ayarlarını tamamen değiştirmek yerine sadece bu sayfalar için gerekli olan tanıma dili ayarlarını yapmak faydalı olabilir. Varsayılan temel dil ayarlarınızı bozmadığından ve tanıma kalitesi daha yüksek olabileceğinden bu yöntem çok daha iyidir.

İpucu: Tanıma dilini sadece belli bir alan için ayarlamak isterseniz, ilgili alanın üzerine (veya Shift tuşunu basılı tutarak diğer alanların da üzerine) tıklayıp seçin ve aşağıdaki ekran görüntüsünün alt kısmındaki Alan Özellikleri sekmesinde yer alan seçiciyi kullanarak gerekli alan için tanıma dilini ayarlayın.


Mevcut tanıma dil(ler)inizden farklı bir dilde yazılmış bir belgeyi dönüştürürken, belgeyi işlemeye başlamadan önce gerekli algılama dillerini el ile belirterek otomatik dil seçimini kapatın.

İpucu: çok dilli belgelerin algılanması sırasında listeden bir belge dili silmek ya da listeye bir belge dili eklemek için, listeden o dili klavyedeki geri tuşuyla silmek ya da ilgili alana dilin adını yazmak yeterlidir. Bu işlem, mevcut diller listesinde aşağı inmek ve yanındaki kutucuğu işaretlemekten daha hızlı sonuç verebilir.

İnceleme: otomatik dil tespiti nasıl çalışır?

Belge algılama dil(ler)ini tespit etmek için FineReader öncelikle metnin ön tanıma işlemini yapar. Ardından, belgedeki her metin alanı için “Otomatik Seçim” listesindeki tüm dillere ait dâhili sözlüklerden gelen bilgileri kullanarak, gerçekten o alanda bulunabilecek kelimeleri içeren dillerin bir listesini oluşturur. Daha sonra belge baştan sona ve yalnızca önceki adımda bulunan dillerin tanıma dili ayarları kullanılarak yeniden tanınır. Bir başka ifadeyle, tüm belgenin baştan sona incelenmesi, her kısmındaki dillerin hangileri olduğunun işaretlenmesi ve her metin alanı için gerekli dillerin el ile ayarlanması gibi işlemleri otomatik olarak yapar. Bu yaklaşım da en iyi tanıma kalitesinin elde edilmesini sağlar; aynı işlemi otomatik olarak değil elle yaptığınızda bunun ne kadar uzun süreceğini düşünebiliyor musunuz?

Avantajları: