Package net.zemberek.erisim
Class Zemberek
- java.lang.Object
-
- net.zemberek.erisim.Zemberek
-
public class Zemberek extends java.lang.Object
EN:This is a facade for accessing the high level functions of the Zemberek library. This class should be creatd only once per language. TR:Zemberek projesine ust seviye erisim icin kullanilan sinif. Ilk olsum sirasinda kokler okuma ve agac olusumu nedeniyle belli bir miktar gecikme yasanabilir. Bu sinifin her dil icin sadece bir defa olusturulmasi onerilir.
-
-
Constructor Summary
Constructors Constructor Description Zemberek(DilAyarlari dilayarlari)
Default constructor.
-
Method Summary
All Methods Static Methods Instance Methods Concrete Methods Modifier and Type Method Description Kelime[]
asciiCozumle(java.lang.String giris)
giris kelimesinin ascii karakter toleransli olarak cozumleyip Kelime cinsinden(kok+ekler) cozumlemelerini dondurur.Kelime[]
asciiCozumle(java.lang.String giris, CozumlemeSeviyesi seviye)
java.lang.String[]
asciidenTurkceye(java.lang.String giris)
Brings the most probable tukish equivalents of a string that uses ascii look alikes of those characters.KelimeCozumleyici
asciiToleransliCozumleyici()
java.lang.String
asciiyeDonustur(java.lang.String giris)
kelime icindeki dile ozel karakterleri ASCII benzer formalarina dondurur.ZemberekAyarlari
ayarlar()
Zemberek konfigurasyon parametrelerini dondurur.static ZemberekAyarlari
ayarOlustur(java.lang.String disKonfigurasyon)
Dosya sisteminden zemberek properties dosyasini yukleyip ZemberekAyarlari nesnesine atar.KelimeCozumleyici
cozumleyici()
return the word parser.DilBilgisi
dilBilgisi()
Zemberek olusumu sirasinda kullanilan DilBilgisi nesnesi doner.int
dilTesti(java.lang.String giris)
Basit sekilde giris kelime ya da kelime dizisinin Zemberek olusturulrken kullanilan dil ile benzerligi kestirir.java.lang.String[]
hecele(java.lang.String giris)
girilen kelimeyi heceler.HeceIslemleri
heceleyici()
Accessor for the syllable extractor.java.util.List<java.lang.String[]>
kelimeAyristir(java.lang.String kelime)
Istenilen kelimenin olasi String acilimlarini bulur.Kelime[]
kelimeCozumle(java.lang.String giris)
performs morphological parsing of the word.Kelime[]
kelimeCozumle(java.lang.String giris, CozumlemeSeviyesi strateji)
performs morphological parsing of the word.boolean
kelimeDenetle(java.lang.String giris)
performs spell checkingjava.lang.String
kelimeUret(Kok kok, java.util.List ekler)
Istenilen kok ve ek listesi ile kelime uretir.KelimeUretici
kelimeUretici()
KokBulucu
kokBulucu()
kok bulucu mekanizmayi dondurur.java.lang.String[]
oner(java.lang.String giris)
giris kelimesine yakin Stringleri dondurur.OneriUretici
oneriUretici()
Accessor for the word suggestion producer.
-
-
-
Constructor Detail
-
Zemberek
public Zemberek(DilAyarlari dilayarlari)
Default constructor.- Parameters:
dilayarlari
-
-
-
Method Detail
-
ayarOlustur
public static ZemberekAyarlari ayarOlustur(java.lang.String disKonfigurasyon) throws java.io.IOException
Dosya sisteminden zemberek properties dosyasini yukleyip ZemberekAyarlari nesnesine atar.- Parameters:
disKonfigurasyon
-- Returns:
- Throws:
java.io.IOException
-
cozumleyici
public KelimeCozumleyici cozumleyici()
return the word parser.- Returns:
- cozumleyici
-
kelimeUretici
public KelimeUretici kelimeUretici()
-
asciiToleransliCozumleyici
public KelimeCozumleyici asciiToleransliCozumleyici()
-
oneriUretici
public OneriUretici oneriUretici()
Accessor for the word suggestion producer.- Returns:
- oneri uretici.
-
heceleyici
public HeceIslemleri heceleyici()
Accessor for the syllable extractor.- Returns:
- heceIslemleri
-
kelimeDenetle
public boolean kelimeDenetle(java.lang.String giris)
performs spell checking girisin imla denetimini yapar. Eger varsa denetleme cebini kullanir.- Parameters:
giris
- giris kelimesi- Returns:
- EN: true:spell checking successfull, false otherwise. TR: true:imla denetimi basarili. false: Denetim basarisiz.
-
kelimeCozumle
public Kelime[] kelimeCozumle(java.lang.String giris)
performs morphological parsing of the word. Returns the possible solutions as a Kelime array. Kelime object contains the root and a suffix list. kok() method can be used for accessing the root. ekler() can be used for accessing the Ek object List. giris kelimesinin olasi tum (kok+ekler) cozumlemelerini dondurur.- Parameters:
giris
- giris kelimesi- Returns:
- Kelime sinifi cinsinden dizi. Eger dizinin boyu 0 ise kelime cozumlenemedi demektir. Kelime kokune erisim icin kok(), eklere erisim icin Ek cinsinden nesne listesi donduren ekler() metodu kullanilir.
- See Also:
Kelime
-
kelimeCozumle
public Kelime[] kelimeCozumle(java.lang.String giris, CozumlemeSeviyesi strateji)
performs morphological parsing of the word. Returns the possible solution(s) as a Kelime array. Kelime object contains the root and a suffix list. kok() method can be used for accessing the root. ekler() can be used for accessing the Ek object List. giris kelimesinin olasi tum (kok+ekler) cozumlemelerini dondurur.- Parameters:
giris
- giris kelimesistrateji
- EN:defines the parsing strategy. TR:cozumleme stratejisini belirler.- Returns:
- Kelime sinifi cinsinden dizi. Eger dizinin boyu 0 ise kelime cozumlenemedi demektir. Kelime kokune erisim icin kok(), eklere erisim icin Ek cinsinden nesne listesi donduren ekler() metodu kullanilir.
- See Also:
Kelime
-
asciiCozumle
public Kelime[] asciiCozumle(java.lang.String giris)
giris kelimesinin ascii karakter toleransli olarak cozumleyip Kelime cinsinden(kok+ekler) cozumlemelerini dondurur. Birden cok cozumun oldugu durumda simdilik donen adaylarin hangisinin gercekten yazidaki kelime olup olmadigi belirlenmiyor. ancak donen sonuclar basitce kok kullanim frekansina gore dizilir. Yani ilk kelime buyuk ihtimalle kastedilen kelimedir.- Parameters:
giris
- giris kelimesi- Returns:
- Kelime sinifi cinsinden dizi. Eger dizinin boyu 0 ise kelime cozumlenemedi demektir. Kelime kokune erisim icin kok(), eklere erisim icin Ek cinsinden nesne listesi donduren ekler() metodu kullanilir. Kelimenin String cinsinden ifadesi icin icerik().toString() metodu kullanilabilir.
- See Also:
Kelime
-
asciiCozumle
public Kelime[] asciiCozumle(java.lang.String giris, CozumlemeSeviyesi seviye)
-
asciidenTurkceye
public java.lang.String[] asciidenTurkceye(java.lang.String giris)
Brings the most probable tukish equivalents of a string that uses ascii look alikes of those characters. asciiCozumle ile benzer bir yapidadir. Farki String[] dizisi donmesi ve donus degerlerinin tekil olmasidir, yani ayni kelime tekrari olmaz.- Parameters:
giris
- giris kelimesi- Returns:
- EN:possible turkish equivalents of the ascii turkish string in a String array. TR:yazilan kelimenin olasi turkce karakter iceren halleri. String[] seklinde.
-
asciiyeDonustur
public java.lang.String asciiyeDonustur(java.lang.String giris)
kelime icindeki dile ozel karakterleri ASCII benzer formalarina dondurur.- Parameters:
giris
- giris kelimesi- Returns:
- turkce karakter tasimayan String.
-
hecele
public java.lang.String[] hecele(java.lang.String giris)
girilen kelimeyi heceler.- Parameters:
giris
- giris kelimesi- Returns:
- String dizisi. Eger dizi boyu 0 ise kelime hecelenememis demektir.
-
oner
public java.lang.String[] oner(java.lang.String giris)
giris kelimesine yakin Stringleri dondurur. Yani eger kelime bozuk ise bu kelimeye benzeyen dogru kelime olasiliklarini dondurur. simdilik - 1 harf eksikligi - 1 harf fazlaligi - 1 yanlis harf kullanimi - yanyana yeri yanlis harf kullanimi. hatalarini giderecek sekilde cozumleri donduruyor. Bu metod dogru kelimeler icin de isler, yani giris "kedi" ise donus listesinde kedi ve kedi'ye benzesen kelimeler de doner. Ornegin "kedim", "yedi" .. gibi.- Parameters:
giris
- giris kelimesi- Returns:
- String sinifi cinsinden dizi. Eger dizinin boyu 0 ise kelime cozumlenemedi demektir.
- See Also:
Kelime
-
dilTesti
public int dilTesti(java.lang.String giris)
Basit sekilde giris kelime ya da kelime dizisinin Zemberek olusturulrken kullanilan dil ile benzerligi kestirir. Girilen kelime sayisinin azligi soznucun basarimini dusurur. donus farkli seviyelerde olabilir.- Parameters:
giris
- giris string- Returns:
- Donus integer 0-4 arasi deger alabilir. nesne olusturulurken kullanilan dil D ise 0 yazinin D dili olmadigi 4 ise kesin D oldugunu belirtir. ara degerler 1- yazi icinde D olabilecek kelimeler var, ama genel D degil. 2- yazi D, cok fazla yabanci ya da bozuk kelime var. 3- yazi D, yabanci ve bozuk kelimeler iceriyor.
-
dilBilgisi
public DilBilgisi dilBilgisi()
Zemberek olusumu sirasinda kullanilan DilBilgisi nesnesi doner. Bu nesne uzerinden dile ozel cesitli dil bilgisi islemlerine erisilebilir.- Returns:
- bu nesneyi olustururken kullanilan DilBilgisi arayuzune sahip nesne.
-
kelimeUret
public java.lang.String kelimeUret(Kok kok, java.util.List ekler)
Istenilen kok ve ek listesi ile kelime uretir.- Parameters:
kok
- kok nesnesiekler
- ek listesi- Returns:
- String olarak uretilen kelime.
-
kelimeAyristir
public java.util.List<java.lang.String[]> kelimeAyristir(java.lang.String kelime)
Istenilen kelimenin olasi String acilimlarini bulur. Ornegin, "alayim" icin "al-a-yim" ve "ala-yim" cozumleri String dizileri seklinde uretilir. sonucta olusan diziler bir Listeye eklenir.- Parameters:
kelime
- giris kelimesi- Returns:
- Kok ve ek olusumlarini ifade eden String dizilerini tasiyan List.
List
Eger kelime ayristirilamiyorsa sifir uzunluklu String dizisi tasiyan tek elemanli liste doner. .
-
ayarlar
public ZemberekAyarlari ayarlar()
Zemberek konfigurasyon parametrelerini dondurur.- Returns:
- ayarlar.
-
kokBulucu
public KokBulucu kokBulucu()
kok bulucu mekanizmayi dondurur.- Returns:
-
-