Class Zemberek

java.lang.Object
net.zemberek.erisim.Zemberek

public class Zemberek extends Object
EN:This is a facade for accessing the high level functions of the Zemberek library. This class should be creatd only once per language.

TR:Zemberek projesine ust seviye erisim icin kullanilan sinif. Ilk olsum sirasinda kokler okuma ve agac olusumu nedeniyle belli bir miktar gecikme yasanabilir. Bu sinifin her dil icin sadece bir defa olusturulmasi onerilir.

  • Constructor Details

    • Zemberek

      public Zemberek(DilAyarlari dilayarlari)
      Default constructor.
      Parameters:
      dilayarlari -
  • Method Details

    • ayarOlustur

      public static ZemberekAyarlari ayarOlustur(String disKonfigurasyon) throws IOException
      Dosya sisteminden zemberek properties dosyasini yukleyip ZemberekAyarlari nesnesine atar.
      Parameters:
      disKonfigurasyon -
      Returns:
      Throws:
      IOException
    • cozumleyici

      public KelimeCozumleyici cozumleyici()
      return the word parser.
      Returns:
      cozumleyici
    • kelimeUretici

      public KelimeUretici kelimeUretici()
    • asciiToleransliCozumleyici

      public KelimeCozumleyici asciiToleransliCozumleyici()
    • oneriUretici

      public OneriUretici oneriUretici()
      Accessor for the word suggestion producer.
      Returns:
      oneri uretici.
    • heceleyici

      public HeceIslemleri heceleyici()
      Accessor for the syllable extractor.
      Returns:
      heceIslemleri
    • kelimeDenetle

      public boolean kelimeDenetle(String giris)
      performs spell checking

      girisin imla denetimini yapar. Eger varsa denetleme cebini kullanir.

      Parameters:
      giris - giris kelimesi
      Returns:
      EN: true:spell checking successfull, false otherwise. TR: true:imla denetimi basarili. false: Denetim basarisiz.
    • kelimeCozumle

      public Kelime[] kelimeCozumle(String giris)
      performs morphological parsing of the word. Returns the possible solutions as a Kelime array. Kelime object contains the root and a suffix list. kok() method can be used for accessing the root. ekler() can be used for accessing the Ek object List.

      giris kelimesinin olasi tum (kok+ekler) cozumlemelerini dondurur.

      Parameters:
      giris - giris kelimesi
      Returns:
      Kelime sinifi cinsinden dizi. Eger dizinin boyu 0 ise kelime cozumlenemedi demektir. Kelime kokune erisim icin kok(), eklere erisim icin Ek cinsinden nesne listesi donduren ekler() metodu kullanilir.
      See Also:
    • kelimeCozumle

      public Kelime[] kelimeCozumle(String giris, CozumlemeSeviyesi strateji)
      performs morphological parsing of the word. Returns the possible solution(s) as a Kelime array. Kelime object contains the root and a suffix list. kok() method can be used for accessing the root. ekler() can be used for accessing the Ek object List.

      giris kelimesinin olasi tum (kok+ekler) cozumlemelerini dondurur.

      Parameters:
      giris - giris kelimesi
      strateji - EN:defines the parsing strategy. TR:cozumleme stratejisini belirler.
      Returns:
      Kelime sinifi cinsinden dizi. Eger dizinin boyu 0 ise kelime cozumlenemedi demektir. Kelime kokune erisim icin kok(), eklere erisim icin Ek cinsinden nesne listesi donduren ekler() metodu kullanilir.
      See Also:
    • asciiCozumle

      public Kelime[] asciiCozumle(String giris)
      giris kelimesinin ascii karakter toleransli olarak cozumleyip Kelime cinsinden(kok+ekler) cozumlemelerini dondurur. Birden cok cozumun oldugu durumda simdilik donen adaylarin hangisinin gercekten yazidaki kelime olup olmadigi belirlenmiyor. ancak donen sonuclar basitce kok kullanim frekansina gore dizilir. Yani ilk kelime buyuk ihtimalle kastedilen kelimedir.
      Parameters:
      giris - giris kelimesi
      Returns:
      Kelime sinifi cinsinden dizi. Eger dizinin boyu 0 ise kelime cozumlenemedi demektir. Kelime kokune erisim icin kok(), eklere erisim icin Ek cinsinden nesne listesi donduren ekler() metodu kullanilir. Kelimenin String cinsinden ifadesi icin icerik().toString() metodu kullanilabilir.
      See Also:
    • asciiCozumle

      public Kelime[] asciiCozumle(String giris, CozumlemeSeviyesi seviye)
    • asciidenTurkceye

      public String[] asciidenTurkceye(String giris)
      Brings the most probable tukish equivalents of a string that uses ascii look alikes of those characters.

      asciiCozumle ile benzer bir yapidadir. Farki String[] dizisi donmesi ve donus degerlerinin tekil olmasidir, yani ayni kelime tekrari olmaz.

      Parameters:
      giris - giris kelimesi
      Returns:
      EN:possible turkish equivalents of the ascii turkish string in a String array. TR:yazilan kelimenin olasi turkce karakter iceren halleri. String[] seklinde.
    • asciiyeDonustur

      public String asciiyeDonustur(String giris)
      kelime icindeki dile ozel karakterleri ASCII benzer formalarina dondurur.
      Parameters:
      giris - giris kelimesi
      Returns:
      turkce karakter tasimayan String.
    • hecele

      public String[] hecele(String giris)
      girilen kelimeyi heceler.
      Parameters:
      giris - giris kelimesi
      Returns:
      String dizisi. Eger dizi boyu 0 ise kelime hecelenememis demektir.
    • oner

      public String[] oner(String giris)
      giris kelimesine yakin Stringleri dondurur. Yani eger kelime bozuk ise bu kelimeye benzeyen dogru kelime olasiliklarini dondurur. simdilik - 1 harf eksikligi - 1 harf fazlaligi - 1 yanlis harf kullanimi - yanyana yeri yanlis harf kullanimi. hatalarini giderecek sekilde cozumleri donduruyor. Bu metod dogru kelimeler icin de isler, yani giris "kedi" ise donus listesinde kedi ve kedi'ye benzesen kelimeler de doner. Ornegin "kedim", "yedi" .. gibi.
      Parameters:
      giris - giris kelimesi
      Returns:
      String sinifi cinsinden dizi. Eger dizinin boyu 0 ise kelime cozumlenemedi demektir.
      See Also:
    • dilTesti

      public int dilTesti(String giris)
      Basit sekilde giris kelime ya da kelime dizisinin Zemberek olusturulrken kullanilan dil ile benzerligi kestirir. Girilen kelime sayisinin azligi soznucun basarimini dusurur. donus farkli seviyelerde olabilir.
      Parameters:
      giris - giris string
      Returns:
      Donus integer 0-4 arasi deger alabilir. nesne olusturulurken kullanilan dil D ise 0 yazinin D dili olmadigi 4 ise kesin D oldugunu belirtir. ara degerler 1- yazi icinde D olabilecek kelimeler var, ama genel D degil. 2- yazi D, cok fazla yabanci ya da bozuk kelime var. 3- yazi D, yabanci ve bozuk kelimeler iceriyor.
    • dilBilgisi

      public DilBilgisi dilBilgisi()
      Zemberek olusumu sirasinda kullanilan DilBilgisi nesnesi doner. Bu nesne uzerinden dile ozel cesitli dil bilgisi islemlerine erisilebilir.
      Returns:
      bu nesneyi olustururken kullanilan DilBilgisi arayuzune sahip nesne.
    • kelimeUret

      public String kelimeUret(Kok kok, List ekler)
      Istenilen kok ve ek listesi ile kelime uretir.
      Parameters:
      kok - kok nesnesi
      ekler - ek listesi
      Returns:
      String olarak uretilen kelime.
    • kelimeAyristir

      public List<String[]> kelimeAyristir(String kelime)
      Istenilen kelimenin olasi String acilimlarini bulur. Ornegin, "alayim" icin "al-a-yim" ve "ala-yim" cozumleri String dizileri seklinde uretilir. sonucta olusan diziler bir Listeye eklenir.
      Parameters:
      kelime - giris kelimesi
      Returns:
      Kok ve ek olusumlarini ifade eden String dizilerini tasiyan List. Listinvalid input: '<'String[]> Eger kelime ayristirilamiyorsa sifir uzunluklu String dizisi tasiyan tek elemanli liste doner. .
    • ayarlar

      public ZemberekAyarlari ayarlar()
      Zemberek konfigurasyon parametrelerini dondurur.
      Returns:
      ayarlar.
    • kokBulucu

      public KokBulucu kokBulucu()
      kok bulucu mekanizmayi dondurur.
      Returns: