Metodoloji - LinguisticQuran

Genel Bakış

LinguisticQuran, üç katmanlı bir metodoloji kullanarak Kur'an ayetlerinin dilbilimsel analizini yapar ve yapay zeka destekli tefsirler üretir.

Katman 1: Dilbilimsel Veri Toplama

Kur'an metnini kelimelerine ayırır ve her kelime için klasik sözlüklerden (Lane's Lexicon) kök anlamları, türleri ve kullanım örneklerini toplar.

Katman 2: Kombinasyon Üretimi

Çok anlamlı kelimelerin farklı anlam seçeneklerini matematiksel olarak birleştirerek binlerce olası tefsir kombinasyonu oluşturur.

Katman 3: AI Tefsir Sentezi

Seçilen anlam kombinasyonlarını yapay zeka modeline (LLM) vererek tutarlı ve derinlikli tefsir metinleri üretir.

1. Tokenizasyon ve Morfolojik Analiz

Veri Kaynağı

Quranic Arabic Corpus projesinden alınan morfolojik analiz verileri kullanılır. Her kelime için şu bilgiler elde edilir:

Surface Form: Kelimenin Uthmani hattaki yazılışı
Root: Üç harfli kök (örn: ك-ت-ب)
Lemma: Sözlük formu
POS (Part of Speech): Kelime türü (isim, fiil, harf)
Transliteration: Latin harflerle okunuşu

Örnek Token Verisi

                {
                "surface": "بِسْمِ",
                "root": "س-م-و",
                "lemma": "اسم",
                "pos": "noun",
                "transliteration": "bismi",
                "translation_en": "In the name of"
                }
            

2. Sözlük Eşleştirme

Her kök kelime, Lane's Arabic-English Lexicon'daki ilgili madde ile eşleştirilir. Lane's Lexicon, 19. yüzyılda Edward William Lane tarafından derlenen 8 ciltlik kapsamlı bir Arapça-İngilizce sözlüktür.

Sense (Anlam) Yapısı

Her kök kelime için birden fazla "sense" (anlam) kaydedilir:

Gloss: Anlamın İngilizce açıklaması
Weight: Anlamın yaygınlık/önem skoru (0-10)
Is Primary: Birincil anlam olup olmadığı

3. Kombinasyon Algoritması

Bir ayetteki çok anlamlı kelimeler için tüm olası anlam kombinasyonları hesaplanır.

Kombinasyon Sayısı Formülü

Toplam Kombinasyon = S₁ × S₂ × S₃ × ... × Sₙ

Sᵢ: i'nci kelimenin anlam sayısı

Örnek: Bir ayetteki 3 kelimeden birincisinin 5, ikincisinin 3, üçüncüsünün 4 anlamı varsa:

5 × 3 × 4 = 60 farklı kombinasyon

Skorlama Sistemi

Her kombinasyon, aşağıdaki kriterlere göre skorlanır:

Sense Weight Toplamı: Seçilen anlamların ağırlık skorları toplanır
Primary Sense Bonusu: Birincil anlamlar için ekstra puan
Coherence Score: Anlamların birbirleriyle uyumu (gelecek sürümlerde)

4. AI Tefsir Üretimi

Seçilen bir kombinasyon için yapay zeka modeline (örn: DeepSeek) şu prompt gönderilir:

                Sen bir Kur'an tefsir uzmanısın. Aşağıdaki ayetin belirtilen
                kelime anlamlarına göre bir tefsir yaz:

                Ayet: {ayah_text}

                Kelime Anlamları:
                1. {word_1}: {meaning_1}
                2. {word_2}: {meaning_2}
                ...

                Bu spesifik anlam seçimlerine dayalı olarak ayetin muhtemel
                yorumunu Türkçe olarak yaz.
            

Model Parametreleri

Model: DeepSeek-R1 (veya kullanıcı tercihi)
Temperature: 0.7 (yaratıcılık dengesi)
Max Tokens: 1000
Top P: 0.9

5. Kalite Kontrolü

Üretilen tefsirler, kullanıcılar tarafından 1-5 yıldız arasında puanlanabilir. Bu puanlar, gelecekte kombinasyon skorlamasını iyileştirmek için kullanılacaktır.

Planlanan İyileştirmeler

Makine öğrenmesi ile otomatik kombinasyon skorlaması
Klasik tefsirlerle karşılaştırma ve benzerlik analizi
Çoklu LLM modellerinin sonuçlarını karşılaştırma
Kullanıcı geri bildirimlerine dayalı model fine-tuning

Sınırlamalar ve Etik Hususlar

Bu metodoloji, dilbilimsel olasılıkları keşfetmeyi amaçlar ancak şu sınırlamalara sahiptir:

AI üretimi tefsirler, kesin dini hüküm niteliği taşımaz
Klasik tefsir geleneğinin yerini almaz, onu tamamlar
Bağlam (siyak-sibak) analizi henüz otomatik değildir
Nüzul sebepleri ve tarihsel bağlam manuel olarak eklenmeli

Sonuç: LinguisticQuran, modern teknoloji ile klasik ilim geleneğini birleştirerek Kur'an araştırmalarına yeni bir boyut kazandırmayı hedefler.