Class Zemberek


  • public class Zemberek
    extends java.lang.Object
    EN:This is a facade for accessing the high level functions of the Zemberek library. This class should be creatd only once per language.

    TR:Zemberek projesine ust seviye erisim icin kullanilan sinif. Ilk olsum sirasinda kokler okuma ve agac olusumu nedeniyle belli bir miktar gecikme yasanabilir. Bu sinifin her dil icin sadece bir defa olusturulmasi onerilir.

    • Constructor Detail

      • Zemberek

        public Zemberek​(DilAyarlari dilayarlari)
        Default constructor.
        Parameters:
        dilayarlari -
    • Method Detail

      • ayarOlustur

        public static ZemberekAyarlari ayarOlustur​(java.lang.String disKonfigurasyon)
                                            throws java.io.IOException
        Dosya sisteminden zemberek properties dosyasini yukleyip ZemberekAyarlari nesnesine atar.
        Parameters:
        disKonfigurasyon -
        Returns:
        Throws:
        java.io.IOException
      • cozumleyici

        public KelimeCozumleyici cozumleyici()
        return the word parser.
        Returns:
        cozumleyici
      • oneriUretici

        public OneriUretici oneriUretici()
        Accessor for the word suggestion producer.
        Returns:
        oneri uretici.
      • heceleyici

        public HeceIslemleri heceleyici()
        Accessor for the syllable extractor.
        Returns:
        heceIslemleri
      • kelimeDenetle

        public boolean kelimeDenetle​(java.lang.String giris)
        performs spell checking

        girisin imla denetimini yapar. Eger varsa denetleme cebini kullanir.

        Parameters:
        giris - giris kelimesi
        Returns:
        EN: true:spell checking successfull, false otherwise. TR: true:imla denetimi basarili. false: Denetim basarisiz.
      • kelimeCozumle

        public Kelime[] kelimeCozumle​(java.lang.String giris)
        performs morphological parsing of the word. Returns the possible solutions as a Kelime array. Kelime object contains the root and a suffix list. kok() method can be used for accessing the root. ekler() can be used for accessing the Ek object List.

        giris kelimesinin olasi tum (kok+ekler) cozumlemelerini dondurur.

        Parameters:
        giris - giris kelimesi
        Returns:
        Kelime sinifi cinsinden dizi. Eger dizinin boyu 0 ise kelime cozumlenemedi demektir. Kelime kokune erisim icin kok(), eklere erisim icin Ek cinsinden nesne listesi donduren ekler() metodu kullanilir.
        See Also:
        Kelime
      • kelimeCozumle

        public Kelime[] kelimeCozumle​(java.lang.String giris,
                                      CozumlemeSeviyesi strateji)
        performs morphological parsing of the word. Returns the possible solution(s) as a Kelime array. Kelime object contains the root and a suffix list. kok() method can be used for accessing the root. ekler() can be used for accessing the Ek object List.

        giris kelimesinin olasi tum (kok+ekler) cozumlemelerini dondurur.

        Parameters:
        giris - giris kelimesi
        strateji - EN:defines the parsing strategy. TR:cozumleme stratejisini belirler.
        Returns:
        Kelime sinifi cinsinden dizi. Eger dizinin boyu 0 ise kelime cozumlenemedi demektir. Kelime kokune erisim icin kok(), eklere erisim icin Ek cinsinden nesne listesi donduren ekler() metodu kullanilir.
        See Also:
        Kelime
      • asciiCozumle

        public Kelime[] asciiCozumle​(java.lang.String giris)
        giris kelimesinin ascii karakter toleransli olarak cozumleyip Kelime cinsinden(kok+ekler) cozumlemelerini dondurur. Birden cok cozumun oldugu durumda simdilik donen adaylarin hangisinin gercekten yazidaki kelime olup olmadigi belirlenmiyor. ancak donen sonuclar basitce kok kullanim frekansina gore dizilir. Yani ilk kelime buyuk ihtimalle kastedilen kelimedir.
        Parameters:
        giris - giris kelimesi
        Returns:
        Kelime sinifi cinsinden dizi. Eger dizinin boyu 0 ise kelime cozumlenemedi demektir. Kelime kokune erisim icin kok(), eklere erisim icin Ek cinsinden nesne listesi donduren ekler() metodu kullanilir. Kelimenin String cinsinden ifadesi icin icerik().toString() metodu kullanilabilir.
        See Also:
        Kelime
      • asciidenTurkceye

        public java.lang.String[] asciidenTurkceye​(java.lang.String giris)
        Brings the most probable tukish equivalents of a string that uses ascii look alikes of those characters.

        asciiCozumle ile benzer bir yapidadir. Farki String[] dizisi donmesi ve donus degerlerinin tekil olmasidir, yani ayni kelime tekrari olmaz.

        Parameters:
        giris - giris kelimesi
        Returns:
        EN:possible turkish equivalents of the ascii turkish string in a String array. TR:yazilan kelimenin olasi turkce karakter iceren halleri. String[] seklinde.
      • asciiyeDonustur

        public java.lang.String asciiyeDonustur​(java.lang.String giris)
        kelime icindeki dile ozel karakterleri ASCII benzer formalarina dondurur.
        Parameters:
        giris - giris kelimesi
        Returns:
        turkce karakter tasimayan String.
      • hecele

        public java.lang.String[] hecele​(java.lang.String giris)
        girilen kelimeyi heceler.
        Parameters:
        giris - giris kelimesi
        Returns:
        String dizisi. Eger dizi boyu 0 ise kelime hecelenememis demektir.
      • oner

        public java.lang.String[] oner​(java.lang.String giris)
        giris kelimesine yakin Stringleri dondurur. Yani eger kelime bozuk ise bu kelimeye benzeyen dogru kelime olasiliklarini dondurur. simdilik - 1 harf eksikligi - 1 harf fazlaligi - 1 yanlis harf kullanimi - yanyana yeri yanlis harf kullanimi. hatalarini giderecek sekilde cozumleri donduruyor. Bu metod dogru kelimeler icin de isler, yani giris "kedi" ise donus listesinde kedi ve kedi'ye benzesen kelimeler de doner. Ornegin "kedim", "yedi" .. gibi.
        Parameters:
        giris - giris kelimesi
        Returns:
        String sinifi cinsinden dizi. Eger dizinin boyu 0 ise kelime cozumlenemedi demektir.
        See Also:
        Kelime
      • dilTesti

        public int dilTesti​(java.lang.String giris)
        Basit sekilde giris kelime ya da kelime dizisinin Zemberek olusturulrken kullanilan dil ile benzerligi kestirir. Girilen kelime sayisinin azligi soznucun basarimini dusurur. donus farkli seviyelerde olabilir.
        Parameters:
        giris - giris string
        Returns:
        Donus integer 0-4 arasi deger alabilir. nesne olusturulurken kullanilan dil D ise 0 yazinin D dili olmadigi 4 ise kesin D oldugunu belirtir. ara degerler 1- yazi icinde D olabilecek kelimeler var, ama genel D degil. 2- yazi D, cok fazla yabanci ya da bozuk kelime var. 3- yazi D, yabanci ve bozuk kelimeler iceriyor.
      • dilBilgisi

        public DilBilgisi dilBilgisi()
        Zemberek olusumu sirasinda kullanilan DilBilgisi nesnesi doner. Bu nesne uzerinden dile ozel cesitli dil bilgisi islemlerine erisilebilir.
        Returns:
        bu nesneyi olustururken kullanilan DilBilgisi arayuzune sahip nesne.
      • kelimeUret

        public java.lang.String kelimeUret​(Kok kok,
                                           java.util.List ekler)
        Istenilen kok ve ek listesi ile kelime uretir.
        Parameters:
        kok - kok nesnesi
        ekler - ek listesi
        Returns:
        String olarak uretilen kelime.
      • kelimeAyristir

        public java.util.List<java.lang.String[]> kelimeAyristir​(java.lang.String kelime)
        Istenilen kelimenin olasi String acilimlarini bulur. Ornegin, "alayim" icin "al-a-yim" ve "ala-yim" cozumleri String dizileri seklinde uretilir. sonucta olusan diziler bir Listeye eklenir.
        Parameters:
        kelime - giris kelimesi
        Returns:
        Kok ve ek olusumlarini ifade eden String dizilerini tasiyan List. List Eger kelime ayristirilamiyorsa sifir uzunluklu String dizisi tasiyan tek elemanli liste doner. .
      • ayarlar

        public ZemberekAyarlari ayarlar()
        Zemberek konfigurasyon parametrelerini dondurur.
        Returns:
        ayarlar.
      • kokBulucu

        public KokBulucu kokBulucu()
        kok bulucu mekanizmayi dondurur.
        Returns: