Metodoloji
Dilbilimsel Analiz ve AI Tefsir Üretim Süreci
Genel Bakış
LinguisticQuran, üç katmanlı bir metodoloji kullanarak Kur'an ayetlerinin dilbilimsel analizini yapar ve yapay zeka destekli tefsirler üretir.
Katman 1: Dilbilimsel Veri Toplama
Kur'an metnini kelimelerine ayırır ve her kelime için klasik sözlüklerden (Lane's Lexicon) kök anlamları, türleri ve kullanım örneklerini toplar.
Katman 2: Kombinasyon Üretimi
Çok anlamlı kelimelerin farklı anlam seçeneklerini matematiksel olarak birleştirerek binlerce olası tefsir kombinasyonu oluşturur.
Katman 3: AI Tefsir Sentezi
Seçilen anlam kombinasyonlarını yapay zeka modeline (LLM) vererek tutarlı ve derinlikli tefsir metinleri üretir.
1. Tokenizasyon ve Morfolojik Analiz
Veri Kaynağı
Quranic Arabic Corpus projesinden alınan morfolojik analiz verileri kullanılır. Her kelime için şu bilgiler elde edilir:
- Surface Form: Kelimenin Uthmani hattaki yazılışı
- Root: Üç harfli kök (örn: ك-ت-ب)
- Lemma: Sözlük formu
- POS (Part of Speech): Kelime türü (isim, fiil, harf)
- Transliteration: Latin harflerle okunuşu
Örnek Token Verisi
2. Sözlük Eşleştirme
Her kök kelime, Lane's Arabic-English Lexicon'daki ilgili madde ile eşleştirilir. Lane's Lexicon, 19. yüzyılda Edward William Lane tarafından derlenen 8 ciltlik kapsamlı bir Arapça-İngilizce sözlüktür.
Sense (Anlam) Yapısı
Her kök kelime için birden fazla "sense" (anlam) kaydedilir:
- Gloss: Anlamın İngilizce açıklaması
- Weight: Anlamın yaygınlık/önem skoru (0-10)
- Is Primary: Birincil anlam olup olmadığı
3. Kombinasyon Algoritması
Bir ayetteki çok anlamlı kelimeler için tüm olası anlam kombinasyonları hesaplanır.
Kombinasyon Sayısı Formülü
Sᵢ: i'nci kelimenin anlam sayısı
Örnek: Bir ayetteki 3 kelimeden birincisinin 5, ikincisinin 3, üçüncüsünün 4 anlamı varsa:
Skorlama Sistemi
Her kombinasyon, aşağıdaki kriterlere göre skorlanır:
- Sense Weight Toplamı: Seçilen anlamların ağırlık skorları toplanır
- Primary Sense Bonusu: Birincil anlamlar için ekstra puan
- Coherence Score: Anlamların birbirleriyle uyumu (gelecek sürümlerde)
4. AI Tefsir Üretimi
Seçilen bir kombinasyon için yapay zeka modeline (örn: DeepSeek) şu prompt gönderilir:
Model Parametreleri
- Model: DeepSeek-R1 (veya kullanıcı tercihi)
- Temperature: 0.7 (yaratıcılık dengesi)
- Max Tokens: 1000
- Top P: 0.9
5. Kalite Kontrolü
Üretilen tefsirler, kullanıcılar tarafından 1-5 yıldız arasında puanlanabilir. Bu puanlar, gelecekte kombinasyon skorlamasını iyileştirmek için kullanılacaktır.
Planlanan İyileştirmeler
- Makine öğrenmesi ile otomatik kombinasyon skorlaması
- Klasik tefsirlerle karşılaştırma ve benzerlik analizi
- Çoklu LLM modellerinin sonuçlarını karşılaştırma
- Kullanıcı geri bildirimlerine dayalı model fine-tuning
Sınırlamalar ve Etik Hususlar
Bu metodoloji, dilbilimsel olasılıkları keşfetmeyi amaçlar ancak şu sınırlamalara sahiptir:
- AI üretimi tefsirler, kesin dini hüküm niteliği taşımaz
- Klasik tefsir geleneğinin yerini almaz, onu tamamlar
- Bağlam (siyak-sibak) analizi henüz otomatik değildir
- Nüzul sebepleri ve tarihsel bağlam manuel olarak eklenmeli
Sonuç: LinguisticQuran, modern teknoloji ile klasik ilim geleneğini birleştirerek Kur'an araştırmalarına yeni bir boyut kazandırmayı hedefler.