Genel Bakış

LinguisticQuran, üç katmanlı bir metodoloji kullanarak Kur'an ayetlerinin dilbilimsel analizini yapar ve yapay zeka destekli tefsirler üretir.

Katman 1: Dilbilimsel Veri Toplama

Kur'an metnini kelimelerine ayırır ve her kelime için klasik sözlüklerden (Lane's Lexicon) kök anlamları, türleri ve kullanım örneklerini toplar.

Katman 2: Kombinasyon Üretimi

Çok anlamlı kelimelerin farklı anlam seçeneklerini matematiksel olarak birleştirerek binlerce olası tefsir kombinasyonu oluşturur.

Katman 3: AI Tefsir Sentezi

Seçilen anlam kombinasyonlarını yapay zeka modeline (LLM) vererek tutarlı ve derinlikli tefsir metinleri üretir.

1. Tokenizasyon ve Morfolojik Analiz

Veri Kaynağı

Quranic Arabic Corpus projesinden alınan morfolojik analiz verileri kullanılır. Her kelime için şu bilgiler elde edilir:

  • Surface Form: Kelimenin Uthmani hattaki yazılışı
  • Root: Üç harfli kök (örn: ك-ت-ب)
  • Lemma: Sözlük formu
  • POS (Part of Speech): Kelime türü (isim, fiil, harf)
  • Transliteration: Latin harflerle okunuşu

Örnek Token Verisi

{ "surface": "بِسْمِ", "root": "س-م-و", "lemma": "اسم", "pos": "noun", "transliteration": "bismi", "translation_en": "In the name of" }

2. Sözlük Eşleştirme

Her kök kelime, Lane's Arabic-English Lexicon'daki ilgili madde ile eşleştirilir. Lane's Lexicon, 19. yüzyılda Edward William Lane tarafından derlenen 8 ciltlik kapsamlı bir Arapça-İngilizce sözlüktür.

Sense (Anlam) Yapısı

Her kök kelime için birden fazla "sense" (anlam) kaydedilir:

  • Gloss: Anlamın İngilizce açıklaması
  • Weight: Anlamın yaygınlık/önem skoru (0-10)
  • Is Primary: Birincil anlam olup olmadığı

3. Kombinasyon Algoritması

Bir ayetteki çok anlamlı kelimeler için tüm olası anlam kombinasyonları hesaplanır.

Kombinasyon Sayısı Formülü

Toplam Kombinasyon = S₁ × S₂ × S₃ × ... × Sₙ

Sᵢ: i'nci kelimenin anlam sayısı

Örnek: Bir ayetteki 3 kelimeden birincisinin 5, ikincisinin 3, üçüncüsünün 4 anlamı varsa:

5 × 3 × 4 = 60 farklı kombinasyon

Skorlama Sistemi

Her kombinasyon, aşağıdaki kriterlere göre skorlanır:

  1. Sense Weight Toplamı: Seçilen anlamların ağırlık skorları toplanır
  2. Primary Sense Bonusu: Birincil anlamlar için ekstra puan
  3. Coherence Score: Anlamların birbirleriyle uyumu (gelecek sürümlerde)

4. AI Tefsir Üretimi

Seçilen bir kombinasyon için yapay zeka modeline (örn: DeepSeek) şu prompt gönderilir:

Sen bir Kur'an tefsir uzmanısın. Aşağıdaki ayetin belirtilen kelime anlamlarına göre bir tefsir yaz: Ayet: {ayah_text} Kelime Anlamları: 1. {word_1}: {meaning_1} 2. {word_2}: {meaning_2} ... Bu spesifik anlam seçimlerine dayalı olarak ayetin muhtemel yorumunu Türkçe olarak yaz.

Model Parametreleri

  • Model: DeepSeek-R1 (veya kullanıcı tercihi)
  • Temperature: 0.7 (yaratıcılık dengesi)
  • Max Tokens: 1000
  • Top P: 0.9

5. Kalite Kontrolü

Üretilen tefsirler, kullanıcılar tarafından 1-5 yıldız arasında puanlanabilir. Bu puanlar, gelecekte kombinasyon skorlamasını iyileştirmek için kullanılacaktır.

Planlanan İyileştirmeler

  • Makine öğrenmesi ile otomatik kombinasyon skorlaması
  • Klasik tefsirlerle karşılaştırma ve benzerlik analizi
  • Çoklu LLM modellerinin sonuçlarını karşılaştırma
  • Kullanıcı geri bildirimlerine dayalı model fine-tuning

Sınırlamalar ve Etik Hususlar

Bu metodoloji, dilbilimsel olasılıkları keşfetmeyi amaçlar ancak şu sınırlamalara sahiptir:

  • AI üretimi tefsirler, kesin dini hüküm niteliği taşımaz
  • Klasik tefsir geleneğinin yerini almaz, onu tamamlar
  • Bağlam (siyak-sibak) analizi henüz otomatik değildir
  • Nüzul sebepleri ve tarihsel bağlam manuel olarak eklenmeli

Sonuç: LinguisticQuran, modern teknoloji ile klasik ilim geleneğini birleştirerek Kur'an araştırmalarına yeni bir boyut kazandırmayı hedefler.