Web tabanlı kişisel bilgi hasatlama


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Gazi Üniversitesi, Fen Bilimleri Enstitüsü, Türkiye

Tezin Onay Tarihi: 2013

Öğrenci: ÖMER ERAKMAN

Danışman: ŞEREF SAĞIROĞLU

Özet:

Bu tez çalışmasında,kişisel bilgi hasatlama işlemleriyapan çalışmalar ile yazılım uygulamaları incelenmiş, web tabanlı kişisel bilgi hasatlama yapan iki uygulama yazılımı geliştirilmiştir. Bu yazılımlara Internet Falcon (IF) NER (isimlendirilmiş varlık tanıma) ve IF Semantik (IFS) adları verilmiştir. IF NER?de doğal dil işleme teknikleri kullanılarak kişisel bilgilerin hasatlanması yapılabilirken,IFS ile bir semantik veritabanı kullanılarak milyonlarca varlık hakkında bilgiler hasatlanabilmektedir.Her uygulamanın kendine göreüstünlükleri ve kısıtları bulunmaktadır. Geliştirilen IF NER, web sayfaları üzerinde çalıştığından hasatlama süresi uzundur ve hasatlama sonucu elde edilen bilgiler geliştirilen IFS?ye göre daha az güvenilirdir. IFS ise sadece semantik veritabanı üzerinde sorgulamalar yapabildiğinden, bunun dışındaki dokümanlar üzerinde hasatlama işleminidesteklememektedir.IFS'de hasatlama sonucu elde edilen bilgiler güvenilirdir ve hasatlama süresi IF NER?e göre oldukça kısadır.Sahip olunan veritabanı içeriği kadar hasatlama yapılabilmesi ise geliştirilen bu yazılımın kısıtıdır.